基于3D可解释性神经渲染的单样本人脸重演方法
李碧莹;刘智威;曾豪;王金桥;人脸重演技术作为可控人脸生成领域的关键研究方向,其目标在于通过给定的驱动人脸图像或视频帧,驱动源人脸图像,实现其面部表情和姿态的准确可控合成。该技术要求生成结果既能保持源人脸图像的身份特征,又能与驱动人脸图像的表情姿态保持高度一致。单样本人脸重演任务由于仅依赖单一视角的2D人脸图像,导致面部信息描述不充分。现有方法在生成姿态变化幅度较大的人脸图像时,难以准确地保持人脸身份、表情姿态的一致性。针对该问题,提出了一种基于3D可解释性神经渲染的单样本人脸重演(3D Explainable Neural Rendering Based Single-sample Face Reenactment, 3D-ENS)方法。该方法在神经网络内部显式建模出固定的3D人脸结构及纹理信息用于整个重演视频生成阶段,以保证重演结果中人脸身份的一致性和表情姿态变化的稳定性。在此基础上构建了一种神经纹理补全网络,通过多尺度特征学习机制实现高质量面部纹理重建;提出了一种背景运动估计网络,预测驱动后人脸图像的背景,将背景信息与补全后的面部神经纹理渲染(Neural Texture Rendering, NTR)结果进行融合。使用关键点检测模型提供面部一致性约束,进一步提升模型的表观一致性。在主流基准数据集与真实场景数据上的实验证明,所提方法具有较好的身份保持度,能够有效应对面部姿态变化的复杂场景,为人脸重演任务提供了新的解决方案。
基于YOLO11的无人机航拍图像小目标检测算法
贾星宇;李大鹏;针对无人机航拍图像小目标检测中面临的目标尺寸微小、分布密集、特征信息模糊以及复杂背景干扰等挑战,对YOLO11模型进行改进。改进主要聚焦在3个方面:设计了渐进式多尺度特征提取模块CSMAConv(Channel Split Multi-scale Aggregation Convolution),对原有C3k2模块进行改造,通过通道分割与多尺度卷积级联结构,既保留了原始特征信息又扩大了感受野范围,显著增强了对多尺度细节特征的捕获能力;提出了新的特征金字塔结构HEFFPN(Hierarchical Efficient Fusion Feature Pyramid Network),通过构建额外的跨尺度特征融合路径并引入SBA(Selective Boundary Aggregation)特征融合模块,频繁整合不同尺度信息,提升了特征融合能力;设计了共享增强型检测头(Shared Enhanced Detection-Head, SED-Head),在降低计算复杂度的同时提高了小目标检测效率。在VisDrone-DET2019数据集的实验中,改进后的模型较YOLO11s在参数量降低51.1%的同时,mAP@0.5和mAP@0.5:0.95分别提高了0.099和0.07,验证了模型的有效性。
基于超分辨率和YOLO的红外小目标检测
李璐;陈清江;针对远距离、弱能量、低分辨率的红外图像目标检测中存在的识别率低、虚警率高等问题,结合超分辨率和深度学习,设计了一种基于YOLOv8n的深度学习网络SR-YOLOv8。在主干网络搭建了SRNet网络,对输入图片进行超分辨率预处理来增加小目标的像素数量,在颈部部分设计了全局上下文感知模块(Global Context Aware Module, GCAM)以增强目标与背景的区分度,抑制复杂背景的影响,改进了完全交并比(Complete Intersection over Union, CIoU)损失函数,提出β-CIoU作为新边界框损失函数,该函数能够依据检测目标的大小灵活地调整损失值,提高模型检测性能。在红外遥感数据集SIRST上的mAP0.5和mAP0.5:0.95分别达到0.844和0.351,较原始模型YOLOv8n分别提升了4.7%和11.4%,有效解决了漏检和误检问题。
基于LoRa卫星下行链路的误符号率分析
刘侠;陈楠;近年来,低功耗广域网络(Low-Power Wide-Area Network, LPWAN)技术在低轨道(Low Earth Orbit, LEO)卫星通信中的应用快速发展。作为LPWAN的典型代表,远距离无线电(Long Range, LoRa)技术因其低功耗与广覆盖特性,成为卫星物联网通信的研究热点。然而,在低信噪比(Signal to Noise Ratio, SNR)条件下,LoRa调制系统的下行链路存在解调误差问题,导致数据传输可靠性显著下降。针对这一问题,通过理论推导与模型分析,研究了Rician信道下LoRa卫星通信系统的误符号率(Symbol Error Rate, SER)性能。通过推导视距(Line of Sight, LOS)路径信号的SER闭式表达式,分析了非视距(Non Line of Sight, NLOS)多径分量对LOS信号解调的干扰机制。在此基础上,提出了一种基于干扰影响阈值的SER优化模型,进一步揭示了低SNR环境下系统的性能极限。仿真结果表明,所推导的闭式表达式能够准确刻画NLOS干扰与LOS信号SER的关联性。优化模型可有效提升低SNR场景下的解调可靠性,为LoRa技术在卫星物联网中的实际部署提供了理论依据与设计指导。
基于残差注意力和BiLSTM的视听情绪识别
刘充;江雪;尽管人工智能系统在认知任务上表现出色,但由于缺乏人类的情感理解能力,其在人机交互场景中的应用仍存在显著局限,这使得情绪识别研究成为提升机器环境适应性的关键环节。针对多模态融合不足造成的情绪分类效果不佳的问题,提出了一种基于视听融合的情感识别解决方案。使用MobileNet模型提取面部特征,同时使用Emotion2vec提取音频特征,2种模态特征分别经过双向长短期记忆网络(Bi-dictional Long Short-Term Memory, BiLSTM)以结合前后帧特征并使用残差注意力模块融合视听2种模态特征。实验中在公共数据集RAVDESS的情绪识别准确率为91.33%,与其他方法的比较表明,该方法显著提高了视听情感识别的准确率。
基于注意力机制与小波变换的皮肤病变分割方法
李明蓉;皮肤病变发病率上升,使皮肤癌早期筛查变得尤为关键。在皮肤病变图像分割任务中,在通道信息建模、结构适应性及特征融合方面存在不足,易导致病变边界识别不准确和关键上下文信息利用不充分。针对这些问题,提出一种基于注意力机制与小波变换的皮肤病图像分割方法(AW-SkinNet)。该方法通过双分支协同注意力提取空间与通道依赖特征,结合小波变换增强频域表征,并利用轻量注意力引导的子像素上采样提升细节恢复与上下文理解。在ISIC-2017和ISIC-2018皮肤病变分割数据集上的实验表明,所提方法相较于现有皮肤病变图像分割方法实现了更高的分割精度。
空间光通信弱光同步:关键技术与未来展望
孙凯琳;袁仁智;杨闯;弱链路场景下的空间光通信系统(星间激光通信、深空光通信等)通常采用强度调制/直接检测技术,接收信号由服从泊松分布的离散光子数表征。光子信号的粒子特性、器件的暗计数、背景光干扰等易引发符号误判,且因无法检测连续波形导致传统时钟同步机制失效。因此,弱链路场景下的空间光通信系统需要采用专门的弱光同步技术。为此,梳理了弱光同步技术的研究现状与关键技术,包括时钟与符号独立同步、时钟与符号联合同步以及帧同步,并展望了弱光同步技术的未来发展趋势,为研究弱光通信系统的同步技术提供思路。
地下管廊空间单基站定位技术研究与实现
王明;任鹏;焦立彬;地下管廊空间定位技术因单一定位基站存在定位结果波动大、方位(前后)模糊识别不准确等问题,难以满足实际定位需求。针对该问题,提出一种基于超宽带(UltraWide-Band,UWB)单基站双天线的定位算法,旨在构建适用于地下管廊场景的单基站室内定位系统。该算法基于密闭空间内定位基站的时间同步机制,利用双天线采集环境中传输的距离信息,通过优化后的双向测距(Two-WayRanging,TWR)算法,完成定位标签距离值和方位位置解算;利用测量噪声、非视距(Non-Line-of-Sight,NLOS)误差统计和LOS/NLOS距离概率模型构建包含测量噪声、NLOS误差统计特性的似然函数,通过最大化联合概率密度函数求解最优位置,有效减小了定位结果的波动性,提高了定位精度。测试结果表明,所提出的算法能够显著减小单基站定位误差,并成倍增加UWB 基站的定位覆盖范围。
基于改进YOLO11n的船舶红外图像目标检测算法
彭鹏;陈慈发;张上;提出一种基于YOLO11n的船舶红外图像目标检测算法AGT-YOLO,旨在解决模型精度和召回率偏低、小目标识别困难以及复杂海况下的多尺度识别问题。通过引入改进后的GhostHGNetV2网络,增强背景区分能力;设计的ASF-P2优化颈部网络,以提升对低分辨率图像和极小目标的检测能力;研究的TAADH检测头替换原有检测头,提升定位和分类性能;同时,融入AFGCAttention注意力机制,提高全局信息处理能力和模型的泛化能力。实验结果表明,与基准模型YOLO11n相比,AGT-YOLO的召回率提高了4.4%,平均精度mAP@50提高了3.1%,并在复杂环境下展现出较强的多尺度识别能力和鲁棒性。
一种超宽带双向吸收式共模滤波器电路拓扑设计及实现
于正永;潘志恒;周鹏;提出了一种超宽带双向吸收式共模滤波器电路拓扑,从左至右依次由第一吸收电路、相延电路及第二吸收电路级联构成,且第一吸收电路和第二吸收电路相同。该电路拓扑关于电磁波传播方向成轴对称,以保护差模信号的完整传输,避免有用的差模信号向破坏性的共模噪声转化。该电路拓扑关于垂直于电磁波传播方向成镜像对称,以实现双向共模吸收性能。仿真结果显示,该电路拓扑可实现10 GHz以内差模信号的完整传输,同时可对左、右两个方向输入的共模信号实现超宽频段的吸收抑制性能,共模吸收阻带为2.7~7.3 GHz,相对带宽为92%。最后给出了设计实例,仿真结果验证了所提出的电路拓扑的有效性。
最大类间方差法在图像处理中的应用
齐丽娜;张博;王战凯;图像分割在图像处理中占有重要的地位,分割结果的好坏直接影响图像的后续处理。文章首先介绍了最大类间方差法及其改进算法———基于灰度拉伸的最大类间方差法算法原理和实现,并针对高速公路中的图像特点。在背景差分法的基础上利用上述两种方法对图像进行了分割处理,对两种方法处理的结果进行了比较。
无线传感器网络拓扑结构研究
杨宁;田辉;张平;李立宏;随着处理技术、存储技术以及无线传输技术的不断发展,由体积小、重量轻、价格低的无线传感器节点所组成的传感器网络已经充分具备了感知客观事物及自然现象,随时随地为用户提供精确信息的能力。通过对于星状网、网状网和混合网等几种常用传感器网络拓扑结构的比较,以及针对这些拓扑结构所形成的网络寿命的仿真,说明了对于常用的基站距离远、节点密度大的传感器网络,分层式的拓扑结构能够大大的节省网络能量,延长网络寿命,改善网络性能。
基于S型函数的变步长LMS自适应滤波算法
覃景繁,韦岗本文通过建立步长因子μ与误差信号之间的非线性函数关系,得出一种新的变步长自适应滤波算法(SVSLMS)。理论分析和计算机仿真结果表明该算法的性能优于传统的LMS算法和NLMS算法。
MIMO无线传输技术综述
李忻;黄绣江;聂在平;MIMO无线传输技术是通信领域的一项重要技术突破,它能在不增加带宽与功率的情况下成倍地提高无线通信系统的容量和频谱效率,堪称新一代无线通信系统中的关键技术之一,近年来引起了人们的广泛关注与研究兴趣。回顾无线移动通信的发展历程,概述天线分集技术与智能天线技术,剖析MIMO无线传输技术的原理与国内外研究现状:传统单天线系统向多天线系统演进、智能天线向多天线系统演进、MIMO无线传输技术的原理、MIMO系统中的分集与复用、MIMO无线信道建模、MIMO系统中的多天线设计等,为深入认识与进一步研究MIMO无线传输技术奠定基础。
人工智能大模型综述及展望
罗锦钊;孙玉龙;钱增志;周鲁;王金桥;大模型是人工智能领域的热门研究方向。以ChatGPT为代表的大模型技术应用掀起了国内外的大模型研究热潮,大模型参数规模和训练数据量级迅速增长,模型性能显著提升。概述了大模型的发展历程以及代表性的算法模型,介绍了大模型的基础架构及其核心原理,分析了大模型的特点,讨论了大模型的局限性以及未来发展方向。
人工智能大模型综述及展望
罗锦钊;孙玉龙;钱增志;周鲁;王金桥;大模型是人工智能领域的热门研究方向。以ChatGPT为代表的大模型技术应用掀起了国内外的大模型研究热潮,大模型参数规模和训练数据量级迅速增长,模型性能显著提升。概述了大模型的发展历程以及代表性的算法模型,介绍了大模型的基础架构及其核心原理,分析了大模型的特点,讨论了大模型的局限性以及未来发展方向。
基于YOLOv8s改进的小目标检测算法
雷帮军;余翱;余快;针对目标检测任务中小目标尺寸较小、背景复杂、特征提取能力不足、漏检和误检严重等问题,提出了一种基于YOLOv8s改进的小目标检测算法——Improved-v8s。Improved-v8s算法重新设计了特征提取和特征融合网络,优化检测层架构,增强浅层信息和深层信息的融合,提高了小目标的感知和捕获能力;在特征提取网络中使用部分卷积(Partial Convolution, PConv)和高效多尺度注意力(Efficient Multi-scale Attention, EMA)机制构建全新的F_C2f_EMA,在降低网络参数量和计算量的同时,通过通道重塑和维度分组最大化保留小目标的特征信息;为了更好地匹配小目标的尺度,优化调整SPPCSPC池化核的尺寸,同时引入无参注意力机制(Simple-parameter-free Attention Module, SimAM),加强复杂背景下小目标特征提取;在Neck部分使用轻量级上采样模块——CARAFE,通过特征重组和特征扩张保留更多的细节信息;引入了全局注意力机制(Global Attention Mechanism, GAM)通过全局上下文的关联建模,充分获取小目标的上下文信息;使用GSConv和Effective Squeeze-Excitation(EffectiveSE)设计全新的G_E_C2f,进一步降低参数量,降低模型的误检率和漏检率;使用WIoU损失函数解决目标不均衡和尺度差异的问题,加快模型收敛的同时提高了回归的精度。实验结果表明,该算法在VisDrone2019数据集上的精确度(Precision)、召回率(Recall)和平均精度(mean Average Precision, mAP)为58.5%、46.0%和48.7%,相较于原始YOLOv8s网络分别提高了8%、8.5%和9.8%,显著提高了模型对小目标的检测能力。在WiderPerson和SSDD数据集上进行模型泛化性实验验证,效果优于其他经典算法。
无人机集群综述:技术、挑战与未来
张旭东;李少波;李传江;张安思;杨磊;随着无人系统、网络通信技术和群体智能理论的发展,使无人机集群协作从概念走向现实、从理论转向实践。回顾了无人机集群的兴起与发展,概述了无人机集群难点与特点;从无人机集群层次结构技术框架出发,分别从智能感知层、通信网络层、自主决策层、路径规划层、协同控制层和实际应用层6个方面介绍了无人机集群关键技术的研究进展;讨论了无人机集群在未来发展中面临的诸多挑战,并对未来研究方向进行了展望,旨在为无人机集群技术的进一步应用落地提供理论参考。
MIMO无线传输技术综述
李忻;黄绣江;聂在平;MIMO无线传输技术是通信领域的一项重要技术突破,它能在不增加带宽与功率的情况下成倍地提高无线通信系统的容量和频谱效率,堪称新一代无线通信系统中的关键技术之一,近年来引起了人们的广泛关注与研究兴趣。回顾无线移动通信的发展历程,概述天线分集技术与智能天线技术,剖析MIMO无线传输技术的原理与国内外研究现状:传统单天线系统向多天线系统演进、智能天线向多天线系统演进、MIMO无线传输技术的原理、MIMO系统中的分集与复用、MIMO无线信道建模、MIMO系统中的多天线设计等,为深入认识与进一步研究MIMO无线传输技术奠定基础。
基于改进YOLOv8的无人机航拍图像目标检测算法
程换新;乔庆元;骆晓玲;于沙家;针对现存无人机航拍图像目标检测算法检测精度较低、模型较为复杂的问题,提出一种改进YOLOv8的目标检测算法。在骨干网络引入多尺度注意力EMA,捕捉细节信息,以提高模型的特征提取能力;改进C2f模块,减小模型的计算量。提出了轻量级的Bi-YOLOv8特征金字塔网络结构改进YOLOv8的颈部,增强了模型多尺度特征融合能力,改善网络对小目标的检测精度。使用WIoU Loss优化原网络损失函数,引入一种动态非单调聚焦机制,提高模型的泛化能力。在无人机航拍数据集VisDrone2019上的实验表明,提出算法的mAP50为40.7%,较YOLOv8s提升了1.5%,参数量降低了42%,同时相比于其他先进的目标检测算法在精度和速度上均有提升,证明了改进算法的有效性和先进性。

网站访问量
今日访问量: 0