基于3D可解释性神经渲染的单样本人脸重演方法
李碧莹;刘智威;曾豪;王金桥;人脸重演技术作为可控人脸生成领域的关键研究方向,其目标在于通过给定的驱动人脸图像或视频帧,驱动源人脸图像,实现其面部表情和姿态的准确可控合成。该技术要求生成结果既能保持源人脸图像的身份特征,又能与驱动人脸图像的表情姿态保持高度一致。单样本人脸重演任务由于仅依赖单一视角的2D人脸图像,导致面部信息描述不充分。现有方法在生成姿态变化幅度较大的人脸图像时,难以准确地保持人脸身份、表情姿态的一致性。针对该问题,提出了一种基于3D可解释性神经渲染的单样本人脸重演(3D Explainable Neural Rendering Based Single-sample Face Reenactment, 3D-ENS)方法。该方法在神经网络内部显式建模出固定的3D人脸结构及纹理信息用于整个重演视频生成阶段,以保证重演结果中人脸身份的一致性和表情姿态变化的稳定性。在此基础上构建了一种神经纹理补全网络,通过多尺度特征学习机制实现高质量面部纹理重建;提出了一种背景运动估计网络,预测驱动后人脸图像的背景,将背景信息与补全后的面部神经纹理渲染(Neural Texture Rendering, NTR)结果进行融合。使用关键点检测模型提供面部一致性约束,进一步提升模型的表观一致性。在主流基准数据集与真实场景数据上的实验证明,所提方法具有较好的身份保持度,能够有效应对面部姿态变化的复杂场景,为人脸重演任务提供了新的解决方案。
基于YOLO11的无人机航拍图像小目标检测算法
贾星宇;李大鹏;针对无人机航拍图像小目标检测中面临的目标尺寸微小、分布密集、特征信息模糊以及复杂背景干扰等挑战,对YOLO11模型进行改进。改进主要聚焦在3个方面:设计了渐进式多尺度特征提取模块CSMAConv(Channel Split Multi-scale Aggregation Convolution),对原有C3k2模块进行改造,通过通道分割与多尺度卷积级联结构,既保留了原始特征信息又扩大了感受野范围,显著增强了对多尺度细节特征的捕获能力;提出了新的特征金字塔结构HEFFPN(Hierarchical Efficient Fusion Feature Pyramid Network),通过构建额外的跨尺度特征融合路径并引入SBA(Selective Boundary Aggregation)特征融合模块,频繁整合不同尺度信息,提升了特征融合能力;设计了共享增强型检测头(Shared Enhanced Detection-Head, SED-Head),在降低计算复杂度的同时提高了小目标检测效率。在VisDrone-DET2019数据集的实验中,改进后的模型较YOLO11s在参数量降低51.1%的同时,mAP@0.5和mAP@0.5:0.95分别提高了0.099和0.07,验证了模型的有效性。
基于超分辨率和YOLO的红外小目标检测
李璐;陈清江;针对远距离、弱能量、低分辨率的红外图像目标检测中存在的识别率低、虚警率高等问题,结合超分辨率和深度学习,设计了一种基于YOLOv8n的深度学习网络SR-YOLOv8。在主干网络搭建了SRNet网络,对输入图片进行超分辨率预处理来增加小目标的像素数量,在颈部部分设计了全局上下文感知模块(Global Context Aware Module, GCAM)以增强目标与背景的区分度,抑制复杂背景的影响,改进了完全交并比(Complete Intersection over Union, CIoU)损失函数,提出β-CIoU作为新边界框损失函数,该函数能够依据检测目标的大小灵活地调整损失值,提高模型检测性能。在红外遥感数据集SIRST上的mAP0.5和mAP0.5:0.95分别达到0.844和0.351,较原始模型YOLOv8n分别提升了4.7%和11.4%,有效解决了漏检和误检问题。
基于LoRa卫星下行链路的误符号率分析
刘侠;陈楠;近年来,低功耗广域网络(Low-Power Wide-Area Network, LPWAN)技术在低轨道(Low Earth Orbit, LEO)卫星通信中的应用快速发展。作为LPWAN的典型代表,远距离无线电(Long Range, LoRa)技术因其低功耗与广覆盖特性,成为卫星物联网通信的研究热点。然而,在低信噪比(Signal to Noise Ratio, SNR)条件下,LoRa调制系统的下行链路存在解调误差问题,导致数据传输可靠性显著下降。针对这一问题,通过理论推导与模型分析,研究了Rician信道下LoRa卫星通信系统的误符号率(Symbol Error Rate, SER)性能。通过推导视距(Line of Sight, LOS)路径信号的SER闭式表达式,分析了非视距(Non Line of Sight, NLOS)多径分量对LOS信号解调的干扰机制。在此基础上,提出了一种基于干扰影响阈值的SER优化模型,进一步揭示了低SNR环境下系统的性能极限。仿真结果表明,所推导的闭式表达式能够准确刻画NLOS干扰与LOS信号SER的关联性。优化模型可有效提升低SNR场景下的解调可靠性,为LoRa技术在卫星物联网中的实际部署提供了理论依据与设计指导。
基于残差注意力和BiLSTM的视听情绪识别
刘充;江雪;尽管人工智能系统在认知任务上表现出色,但由于缺乏人类的情感理解能力,其在人机交互场景中的应用仍存在显著局限,这使得情绪识别研究成为提升机器环境适应性的关键环节。针对多模态融合不足造成的情绪分类效果不佳的问题,提出了一种基于视听融合的情感识别解决方案。使用MobileNet模型提取面部特征,同时使用Emotion2vec提取音频特征,2种模态特征分别经过双向长短期记忆网络(Bi-dictional Long Short-Term Memory, BiLSTM)以结合前后帧特征并使用残差注意力模块融合视听2种模态特征。实验中在公共数据集RAVDESS的情绪识别准确率为91.33%,与其他方法的比较表明,该方法显著提高了视听情感识别的准确率。
一种超宽带双向吸收式共模滤波器电路拓扑设计及实现
于正永;潘志恒;周鹏;提出了一种超宽带双向吸收式共模滤波器电路拓扑,从左至右依次由第一吸收电路、相延电路及第二吸收电路级联构成,且第一吸收电路和第二吸收电路相同。该电路拓扑关于电磁波传播方向成轴对称,以保护差模信号的完整传输,避免有用的差模信号向破坏性的共模噪声转化。该电路拓扑关于垂直于电磁波传播方向成镜像对称,以实现双向共模吸收性能。仿真结果显示,该电路拓扑可实现10 GHz以内差模信号的完整传输,同时可对左、右两个方向输入的共模信号实现超宽频段的吸收抑制性能,共模吸收阻带为2.7~7.3 GHz,相对带宽为92%。最后给出了设计实例,仿真结果验证了所提出的电路拓扑的有效性。
基于磁-电偶极子的双频全向双圆极化MIMO天线设计
刘康;王颖舒;晏彬洋;张光辉;王平;叶志红;为了满足半/全双工通信系统需求,提出一种基于磁-电偶极子的双频全向双圆极化多输入-多输出(multiple input multiple output, MIMO)天线。该天线由4个相同天线单元对称分布形成2×2 MIMO阵,而每一天线单元由圆形平面波导腔、4个折叠偶极子、8个寄生偶极子组成。在圆形平面波导上蚀刻扇形缝和采用短路柱可在弧形开口侧形成磁偶极子,其辐射电场与电偶极子产生的电场正交。当磁偶极子与电偶极子产生90o空间距离相位时,能在水平360o方向辐射左旋或右旋圆极化波。结果表明,该天线在低频段(2.42~2.47 GHz)能产生全向的右旋圆极化波,而在高频段(5.76~5.85 GHz)能产生全向的左旋圆极化波,轴比值低于3 dB,水平面增益波动分别低于2.1 dB和7.3 dB。此外,建议的MIMO天线通过相互对称布阵,在低频段和高频段的隔离度分别低于-30 dB和-50 dB。
基于ARM架构与Docker的Swin-Transformer遥感影像云检测方法研究
陆俊南;戴山;胡昌苗;针对特定平台下遥感影像分割、分类应用,提出了一种基于ARM架构与Docker容器化部署的Swin-Transformer遥感影像云检测方法。通过构建无符号16位的图像-标签样本,保持地物的光谱细节不被压缩丢失,与传统的8位自然图像相比,提升了云与雪高亮类别的可分性和检测精度。同时针对ARM架构硬件及操作系统,采用基于Docker 容器化技术的跨平台部署方案,实现算法环境的一致性封装与灵活迁移。数据实验表明,利用基于ImageNet-1k样本预训练的Swin-Transformer模型进行小块推理并添加精细化调整进行模型迭代,结合模型迭代的主动学习策略,提升了复杂场景下的地物分类准确率,同时基于ARM的Docker部署方案保持了跨平台的兼容性,为特定环境中的遥感智能解译提供了可行技术路径。
基于3D高斯溅射的周视3D占用预测方法
王建伟;李同占;虞永方;朱开元;李嘉欣;李阳;高戈;在自动驾驶领域中,3D占用预测(3D occupancy prediction)算法是环境感知领域的一项重要技术。目前许多3D占用预测算法依赖于3D体素空间的完整真值信息,标注此真值的过程耗时耗力,常存在标注模糊不清的情况,限制了算法的可用性和可扩展性。由于周视相机的成本优势以及图像具有丰富语义信息的性质,利用2D真值数据监督3D占用预测的方法逐渐受到更多关注。为了解决这一问题,提出了基于3D高斯溅射(3D Gaussian Splatting)的周视3D占用预测方法——GaussianOcc。将3D体素特征转换为显式的3D高斯表示,利用3D Gaussian Splatting将3D高斯映射为相机平面的2D高斯并渲染出2D语义与深度图。通过最小化渲染图与2D真值之间的损失来优化模型。实验数据表明,在nuScenes数据集上,与基线模型RenderOcc相比,GaussianOcc的平均交并比(mean Intersection over Union, mIoU)指标提升了7.7%,在汽车、行人类别上的交并比(Intersection over Union, IoU)指标分别提升了35.5%、40.7%。
低空时空网:概念框架、关键技术、应用前景
蔚保国;盛传贞;张云龙;李硕;熊华捷;张振宇;低空时空网是低空安全信息基础设施的重要组成,是低空经济走向规模化、安全化、标准化应用的必要条件。提出了低空时空网的概念内涵和体系架构,分析了高安全低空时空网天空地协同融合技术、无人集群感通导控一体化网络技术、高可信网信终端技术、低空时空网导航安全综合监测评估技术、基于多维网信场图的飞行安全风险评估技术等关键技术。构建了“云-边-端”的网络化、数字化、智能化低空飞行服务与管理模式,实现对各类低空飞行器个体及群体的智能导航、气象预报、实时监控、调度管理、风险预测评估和飞行辅助服务,为低空飞行提供泛在、精准、可信的时空信息支撑,实现时空数据驱动的低空安全管理。
最大类间方差法在图像处理中的应用
齐丽娜;张博;王战凯;图像分割在图像处理中占有重要的地位,分割结果的好坏直接影响图像的后续处理。文章首先介绍了最大类间方差法及其改进算法———基于灰度拉伸的最大类间方差法算法原理和实现,并针对高速公路中的图像特点。在背景差分法的基础上利用上述两种方法对图像进行了分割处理,对两种方法处理的结果进行了比较。
无线传感器网络拓扑结构研究
杨宁;田辉;张平;李立宏;随着处理技术、存储技术以及无线传输技术的不断发展,由体积小、重量轻、价格低的无线传感器节点所组成的传感器网络已经充分具备了感知客观事物及自然现象,随时随地为用户提供精确信息的能力。通过对于星状网、网状网和混合网等几种常用传感器网络拓扑结构的比较,以及针对这些拓扑结构所形成的网络寿命的仿真,说明了对于常用的基站距离远、节点密度大的传感器网络,分层式的拓扑结构能够大大的节省网络能量,延长网络寿命,改善网络性能。
基于S型函数的变步长LMS自适应滤波算法
覃景繁,韦岗本文通过建立步长因子μ与误差信号之间的非线性函数关系,得出一种新的变步长自适应滤波算法(SVSLMS)。理论分析和计算机仿真结果表明该算法的性能优于传统的LMS算法和NLMS算法。
MIMO无线传输技术综述
李忻;黄绣江;聂在平;MIMO无线传输技术是通信领域的一项重要技术突破,它能在不增加带宽与功率的情况下成倍地提高无线通信系统的容量和频谱效率,堪称新一代无线通信系统中的关键技术之一,近年来引起了人们的广泛关注与研究兴趣。回顾无线移动通信的发展历程,概述天线分集技术与智能天线技术,剖析MIMO无线传输技术的原理与国内外研究现状:传统单天线系统向多天线系统演进、智能天线向多天线系统演进、MIMO无线传输技术的原理、MIMO系统中的分集与复用、MIMO无线信道建模、MIMO系统中的多天线设计等,为深入认识与进一步研究MIMO无线传输技术奠定基础。
ZigBee技术在工业控制领域的应用
陈景运;周祥平;ZigBeeTM是一种低速率、低成本、低功耗的短程无线网络协议。在众多无线网络技术中,ZigBee技术以其数据传输安全可靠、组网简易灵活、设备成本低、电池寿命长等独特的优势,在工业控制领域中展现了深厚的发展潜力和广阔的市场前景。在Modbus现场总线控制系统中引入ZigBee无线网络,可以在确保数据传输可靠性和实时性的前提下,大大提高控制系统的可扩展性,降低设备维护的成本,从而使整个控制系统得到优化。
人工智能大模型综述及展望
罗锦钊;孙玉龙;钱增志;周鲁;王金桥;大模型是人工智能领域的热门研究方向。以ChatGPT为代表的大模型技术应用掀起了国内外的大模型研究热潮,大模型参数规模和训练数据量级迅速增长,模型性能显著提升。概述了大模型的发展历程以及代表性的算法模型,介绍了大模型的基础架构及其核心原理,分析了大模型的特点,讨论了大模型的局限性以及未来发展方向。
基于YOLOv8s改进的小目标检测算法
雷帮军;余翱;余快;针对目标检测任务中小目标尺寸较小、背景复杂、特征提取能力不足、漏检和误检严重等问题,提出了一种基于YOLOv8s改进的小目标检测算法——Improved-v8s。Improved-v8s算法重新设计了特征提取和特征融合网络,优化检测层架构,增强浅层信息和深层信息的融合,提高了小目标的感知和捕获能力;在特征提取网络中使用部分卷积(Partial Convolution, PConv)和高效多尺度注意力(Efficient Multi-scale Attention, EMA)机制构建全新的F_C2f_EMA,在降低网络参数量和计算量的同时,通过通道重塑和维度分组最大化保留小目标的特征信息;为了更好地匹配小目标的尺度,优化调整SPPCSPC池化核的尺寸,同时引入无参注意力机制(Simple-parameter-free Attention Module, SimAM),加强复杂背景下小目标特征提取;在Neck部分使用轻量级上采样模块——CARAFE,通过特征重组和特征扩张保留更多的细节信息;引入了全局注意力机制(Global Attention Mechanism, GAM)通过全局上下文的关联建模,充分获取小目标的上下文信息;使用GSConv和Effective Squeeze-Excitation(EffectiveSE)设计全新的G_E_C2f,进一步降低参数量,降低模型的误检率和漏检率;使用WIoU损失函数解决目标不均衡和尺度差异的问题,加快模型收敛的同时提高了回归的精度。实验结果表明,该算法在VisDrone2019数据集上的精确度(Precision)、召回率(Recall)和平均精度(mean Average Precision, mAP)为58.5%、46.0%和48.7%,相较于原始YOLOv8s网络分别提高了8%、8.5%和9.8%,显著提高了模型对小目标的检测能力。在WiderPerson和SSDD数据集上进行模型泛化性实验验证,效果优于其他经典算法。
无人机集群综述:技术、挑战与未来
张旭东;李少波;李传江;张安思;杨磊;随着无人系统、网络通信技术和群体智能理论的发展,使无人机集群协作从概念走向现实、从理论转向实践。回顾了无人机集群的兴起与发展,概述了无人机集群难点与特点;从无人机集群层次结构技术框架出发,分别从智能感知层、通信网络层、自主决策层、路径规划层、协同控制层和实际应用层6个方面介绍了无人机集群关键技术的研究进展;讨论了无人机集群在未来发展中面临的诸多挑战,并对未来研究方向进行了展望,旨在为无人机集群技术的进一步应用落地提供理论参考。
MIMO无线传输技术综述
李忻;黄绣江;聂在平;MIMO无线传输技术是通信领域的一项重要技术突破,它能在不增加带宽与功率的情况下成倍地提高无线通信系统的容量和频谱效率,堪称新一代无线通信系统中的关键技术之一,近年来引起了人们的广泛关注与研究兴趣。回顾无线移动通信的发展历程,概述天线分集技术与智能天线技术,剖析MIMO无线传输技术的原理与国内外研究现状:传统单天线系统向多天线系统演进、智能天线向多天线系统演进、MIMO无线传输技术的原理、MIMO系统中的分集与复用、MIMO无线信道建模、MIMO系统中的多天线设计等,为深入认识与进一步研究MIMO无线传输技术奠定基础。
基于改进YOLOv8的无人机航拍图像目标检测算法
程换新;乔庆元;骆晓玲;于沙家;针对现存无人机航拍图像目标检测算法检测精度较低、模型较为复杂的问题,提出一种改进YOLOv8的目标检测算法。在骨干网络引入多尺度注意力EMA,捕捉细节信息,以提高模型的特征提取能力;改进C2f模块,减小模型的计算量。提出了轻量级的Bi-YOLOv8特征金字塔网络结构改进YOLOv8的颈部,增强了模型多尺度特征融合能力,改善网络对小目标的检测精度。使用WIoU Loss优化原网络损失函数,引入一种动态非单调聚焦机制,提高模型的泛化能力。在无人机航拍数据集VisDrone2019上的实验表明,提出算法的mAP50为40.7%,较YOLOv8s提升了1.5%,参数量降低了42%,同时相比于其他先进的目标检测算法在精度和速度上均有提升,证明了改进算法的有效性和先进性。

网站访问量
今日访问量: 0