nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo searchdiv qikanlogo popupnotification benqimuci xinwengonggao jingxuanzhuanti guokanliulan wangluoshoufa beiyinpaihang xiazaipaihang liulanpaihang caozuorukou wenbenneirong xiazaizhongxin lianjiezhongxin fangwenliangtongji papernavigation benqimucitupian wangluoshoufatupian beiyinpaihangtupian xiazaipaihangtupian liulanpaihangtupian xinwengonggaosimple xiazaizhongxinsimple lianjiezhongxinsimple jingxuanzhuantisimple
2025年08期
信号与信息处理

基于3D可解释性神经渲染的单样本人脸重演方法

李碧莹;刘智威;曾豪;王金桥;

人脸重演技术作为可控人脸生成领域的关键研究方向,其目标在于通过给定的驱动人脸图像或视频帧,驱动源人脸图像,实现其面部表情和姿态的准确可控合成。该技术要求生成结果既能保持源人脸图像的身份特征,又能与驱动人脸图像的表情姿态保持高度一致。单样本人脸重演任务由于仅依赖单一视角的2D人脸图像,导致面部信息描述不充分。现有方法在生成姿态变化幅度较大的人脸图像时,难以准确地保持人脸身份、表情姿态的一致性。针对该问题,提出了一种基于3D可解释性神经渲染的单样本人脸重演(3D Explainable Neural Rendering Based Single-sample Face Reenactment, 3D-ENS)方法。该方法在神经网络内部显式建模出固定的3D人脸结构及纹理信息用于整个重演视频生成阶段,以保证重演结果中人脸身份的一致性和表情姿态变化的稳定性。在此基础上构建了一种神经纹理补全网络,通过多尺度特征学习机制实现高质量面部纹理重建;提出了一种背景运动估计网络,预测驱动后人脸图像的背景,将背景信息与补全后的面部神经纹理渲染(Neural Texture Rendering, NTR)结果进行融合。使用关键点检测模型提供面部一致性约束,进一步提升模型的表观一致性。在主流基准数据集与真实场景数据上的实验证明,所提方法具有较好的身份保持度,能够有效应对面部姿态变化的复杂场景,为人脸重演任务提供了新的解决方案。

2025 年 08 期 v.55 ; 国家自然科学基金面上项目(62276260)~~
[下载次数: 35 ] [被引频次: 0 ] [阅读次数: 41 ] HTML PDF 引用本文

基于YOLO11的无人机航拍图像小目标检测算法

贾星宇;李大鹏;

针对无人机航拍图像小目标检测中面临的目标尺寸微小、分布密集、特征信息模糊以及复杂背景干扰等挑战,对YOLO11模型进行改进。改进主要聚焦在3个方面:设计了渐进式多尺度特征提取模块CSMAConv(Channel Split Multi-scale Aggregation Convolution),对原有C3k2模块进行改造,通过通道分割与多尺度卷积级联结构,既保留了原始特征信息又扩大了感受野范围,显著增强了对多尺度细节特征的捕获能力;提出了新的特征金字塔结构HEFFPN(Hierarchical Efficient Fusion Feature Pyramid Network),通过构建额外的跨尺度特征融合路径并引入SBA(Selective Boundary Aggregation)特征融合模块,频繁整合不同尺度信息,提升了特征融合能力;设计了共享增强型检测头(Shared Enhanced Detection-Head, SED-Head),在降低计算复杂度的同时提高了小目标检测效率。在VisDrone-DET2019数据集的实验中,改进后的模型较YOLO11s在参数量降低51.1%的同时,mAP@0.5和mAP@0.5:0.95分别提高了0.099和0.07,验证了模型的有效性。

2025 年 08 期 v.55 ; 国家自然科学基金(62371245)~~
[下载次数: 1,447 ] [被引频次: 0 ] [阅读次数: 42 ] HTML PDF 引用本文

基于超分辨率和YOLO的红外小目标检测

李璐;陈清江;

针对远距离、弱能量、低分辨率的红外图像目标检测中存在的识别率低、虚警率高等问题,结合超分辨率和深度学习,设计了一种基于YOLOv8n的深度学习网络SR-YOLOv8。在主干网络搭建了SRNet网络,对输入图片进行超分辨率预处理来增加小目标的像素数量,在颈部部分设计了全局上下文感知模块(Global Context Aware Module, GCAM)以增强目标与背景的区分度,抑制复杂背景的影响,改进了完全交并比(Complete Intersection over Union, CIoU)损失函数,提出β-CIoU作为新边界框损失函数,该函数能够依据检测目标的大小灵活地调整损失值,提高模型检测性能。在红外遥感数据集SIRST上的mAP0.5和mAP0.5:0.95分别达到0.844和0.351,较原始模型YOLOv8n分别提升了4.7%和11.4%,有效解决了漏检和误检问题。

2025 年 08 期 v.55 ; 国家自然科学基金(12101482)~~
[下载次数: 220 ] [被引频次: 0 ] [阅读次数: 29 ] HTML PDF 引用本文

基于LoRa卫星下行链路的误符号率分析

刘侠;陈楠;

近年来,低功耗广域网络(Low-Power Wide-Area Network, LPWAN)技术在低轨道(Low Earth Orbit, LEO)卫星通信中的应用快速发展。作为LPWAN的典型代表,远距离无线电(Long Range, LoRa)技术因其低功耗与广覆盖特性,成为卫星物联网通信的研究热点。然而,在低信噪比(Signal to Noise Ratio, SNR)条件下,LoRa调制系统的下行链路存在解调误差问题,导致数据传输可靠性显著下降。针对这一问题,通过理论推导与模型分析,研究了Rician信道下LoRa卫星通信系统的误符号率(Symbol Error Rate, SER)性能。通过推导视距(Line of Sight, LOS)路径信号的SER闭式表达式,分析了非视距(Non Line of Sight, NLOS)多径分量对LOS信号解调的干扰机制。在此基础上,提出了一种基于干扰影响阈值的SER优化模型,进一步揭示了低SNR环境下系统的性能极限。仿真结果表明,所推导的闭式表达式能够准确刻画NLOS干扰与LOS信号SER的关联性。优化模型可有效提升低SNR场景下的解调可靠性,为LoRa技术在卫星物联网中的实际部署提供了理论依据与设计指导。

2025 年 08 期 v.55 ; 国家自然科学基金重点项目(52331012);国家自然科学基金面上项目(52471379)~~
[下载次数: 32 ] [被引频次: 0 ] [阅读次数: 41 ] HTML PDF 引用本文

基于残差注意力和BiLSTM的视听情绪识别

刘充;江雪;

尽管人工智能系统在认知任务上表现出色,但由于缺乏人类的情感理解能力,其在人机交互场景中的应用仍存在显著局限,这使得情绪识别研究成为提升机器环境适应性的关键环节。针对多模态融合不足造成的情绪分类效果不佳的问题,提出了一种基于视听融合的情感识别解决方案。使用MobileNet模型提取面部特征,同时使用Emotion2vec提取音频特征,2种模态特征分别经过双向长短期记忆网络(Bi-dictional Long Short-Term Memory, BiLSTM)以结合前后帧特征并使用残差注意力模块融合视听2种模态特征。实验中在公共数据集RAVDESS的情绪识别准确率为91.33%,与其他方法的比较表明,该方法显著提高了视听情感识别的准确率。

2025 年 08 期 v.55 ; 江苏省重点研发计划(BE2023087); 南京邮电大学江苏省通信与网络技术工程研究中心开放课题资助(JSGCZX23007)~~
[下载次数: 111 ] [被引频次: 0 ] [阅读次数: 24 ] HTML PDF 引用本文
本期统计数据 more>>

网站访问量

总访问量: 436,400
今日访问量: 0

帮助视频

友情链接

友情链接

引用

GB/T 7714-2015 格式引文
MLA格式引文
APA格式引文
检 索 高级检索