下载排行
改进YOLOv8的遥感图像检测算法
程换新;矫立浩;骆晓玲;于沙家;针对目前遥感图像目标检测算法中存在的误检、漏检和检测精度低等问题,提出了一种改进YOLOv8的遥感图像检测算法。在主干网络中引入注意力机制EMA到C2f模块,以提高模型对多尺度目标的特征提取能力;在颈部网络中提出Slim-PAN结构,以减少模型计算量;使用WIOU损失函数代替CIOU损失函数,以提升模型的检测精度。通过在DIOR和RSOD遥感数据集上的实验结果表明,改进后的算法与原YOLOv8算法相比,mAP分别提升了1.5%和2.3%,计算量降低了0.3 GFLOPs,改进算法在不增加计算量的同时能提高检测精度,证明了改进算法的有效性和先进性。
无线网络规划的最优化算法研究
孙鹏,杨大成无线网络规划是决定移动通信网络质量的关键环节。通过加站解决规划方案中的覆盖盲区时,必须根据已有网络配置方案选择新基站的最佳位置和最优配置参数,因此属于一个多目标最优化问题。该问题可以采用多变量遗传算法解决。仿真结果说明该算法在能够有效确定站址和参数配置的全局最优解,并具有很高的效率。
低轨卫星互联网:发展、应用及新技术展望
禹华钢;方子希;传统以人为中心的通信模式正在逐步向以服务为中心的通信模式转移,未来的6G时代,将是空天地海一体化的泛在网络。为了解决互联网的“最后一公里”问题、实现全球无差别的信息覆盖,低轨卫星互联网应运而生。从互联网的概念入手,介绍了低轨卫星的发展,并由此衍生出低轨卫星互联网的概念;概述了国内外在低轨卫星互联网建设中的项目进展情况;详细阐述了低轨卫星互联网在陆地、海洋及空中的典型应用场景和业务接入需求;梳理了低轨互联网发展过程中面向用户的4个关键技术,即抗干扰技术、感-传-算一体化技术、多星多波束联合传输技术和免授权接入技术,希望对低轨卫星互联网的工程推广产生一定的积极意义。
基于深度学习的遥感影像变化检测方法进展综述
姜凯悦;赵竹新;马璐;马聪慧;随着人工智能技术与遥感大数据的紧密结合,深度学习技术在多时相遥感影像变化检测中展现出卓越的性能,推动了传统方法向智能化方向的转变,以更加自动化、精细化和智能化的方式解决多领域的地表时空变化检测问题。旨在综述基于深度学习的遥感影像变化检测方法,探讨智能化技术在变化检测方法中的应用潜力。通过介绍深度学习变化检测的通用框架,分析基于像素、面向对象和面向场景变化检测方法的研究进展,讨论数据质量、模型设计和实用性方面的挑战。研究结果表明,深度学习技术显著提高了变化检测的精度和鲁棒性,但需解决多源异构数据处理、模型泛化能力提升和实际应用效率等问题。未来遥感变化检测技术的发展将聚焦于多源数据融合、超分辨率技术和语义变化检测等关键技术,以实现遥感变化检测技术的智能化和精细化发展。
基于深度学习的智能体轨迹预测文献综述
章璐璐;李思照;智能体的轨迹预测是人工智能领域中的热点之一,特别是在自动驾驶领域,预测智能体下一时间点的位置是自动驾驶辅助系统的关键任务。在智能体轨迹预测技术的基础上,根据建模方法的不同进行分类介绍,分别为循环神经网络(Recurrent Neural Network, RNN)、卷积神经网络(Convolutional Neural Network, CNN)、生成对抗网络(Generative Adversarial Network, GAN)和混合网络,同时分析了常见的经典模型的优缺点,归纳了当前常用公开的轨迹预测数据集和评价指标,比较了经典模型的算法性能,对智能轨迹预测方向进行了展望和总结。
无人机蜂群作战特点和对抗体系设想
陈镜;近年来,无人机蜂群技术迅猛发展,正逐步演变为一种新型的作战样式,对传统的防空体系形成极大挑战。介绍了美国、俄罗斯等国家的无人机蜂群发展情况,对作战运用模式和特点进行了总结。提出无人机蜂群对抗的技术体系设想,对探测、跟踪和处置手段进行了分析,给出了无人机蜂群对抗的工作流程、发展阶段设想和效能评估要素。
具身智能大模型综述及展望
袁霆宇;刘凯;关标良;叶雯;赵雅萃;赵朝阳;王金桥;视觉-语言-行动(Vision-Language-Action, VLA)模型是实现通用具身人工智能的核心技术,旨在在统一的端到端框架内融合视觉感知、语言理解与动作决策。对VLA模型的研究现状与发展脉络进行了全面而系统的梳理。追溯了VLA模型的理论起源,阐明了其从分离式模块向统一架构演进的范式变迁。针对VLA的演进路线,以多模态融合与认知分层为重点阐述了SpatialVLA、TLA与GR00T N1等工作。构建了一个详尽的VLA模型分类体系,从宏观架构和系统分层2个核心维度,深入剖析了从RT-1等开创性工作到引入大规模知识迁移的RT-2、OpenVLA、ECOT等工作,再到双系统架构的Helix、OpenHelix、DexVLA、DexGraspVLA等前沿模型的关键技术与设计思想。系统性地整合与评述了支撑VLA研究的主流仿真环境、核心数据集与基准,并探讨了其在机器人操作、自主导航、工业自动化等领域的应用现状与前景。深入剖析了当前VLA研究在泛化性与数据效率、长时程任务规划、实时响应速度等方面面临的核心挑战,并对融合世界模型、提升数据效率等未来研究方向进行了展望。
无源定位技术发展及其展望
李俊霞;王欣;黄高见;徐勇军;郝万明;朱政宇;李兴旺;随着智能信息社会的不断演进以及智慧城市建设的推进,电子设备的定位准确性和可靠性需求日益突显,特别是在万物互联的背景下,对定位精度和定位质量的要求变得更加迫切。无源定位技术因隐蔽性强、功耗低、不易被感知与干扰等诸多优点被广泛应用于各个领域,尤其近年来,通感一体化(Integrated Sensing and Communication, ISAC)、机器学习、环境反向散射以及智能反射面的引入与发展,为无源定位在6G中的应用提供了新的契机。基于此,阐述了无源定位技术特点及分类;按照参数化的分类方式总结梳理无源定位方法及误差影响因素;讨论了多参数融合无源定位方案与优势;展望了无源定位技术在6G新愿景下典型的应用场景、潜在技术、挑战及未来研究方向。
多模态大模型的发展综述及思考
王金桥;杨蓓莹;近年来,随着以ChatGPT为代表的大语言模型(Large Language Models, LLMs)在通用人工智能方向上取得突破性进展,国内外掀起了大模型应用的研究热潮。人类获取和处理信息的方式往往涉及视觉、听觉、文本等多种模态,单纯依赖文本的语言模型难以充分理解和表达复杂的现实世界信息。因此,研究者开始探索将LLMs扩展到多模态领域,通过统一建模文本、图像、视频等不同类型的数据,构建具有跨模态理解能力的多模态大模型(Multimodal Large Models, MLMs)。对MLMs的发展现状进行了全面梳理,重点介绍了当前主流的模型架构、训练策略以及评估方法,并分析了该领域面临的挑战和未来发展方向。随着模型参数规模和训练数据的大幅扩展,MLMs在跨模态任务中的性能显著超越了传统方法,为通用人工智能的发展奠定了重要基础。这些模型在视觉问答(Visual Question Answering, VQA)、图像描述、多模态对话等典型任务中展现出卓越的理解与生成能力。然而,当前MLMs仍存在长序列处理效率、计算资源需求以及模型可靠性等方面的技术瓶颈。未来研究将致力于在保持模型性能的前提下提升计算效率,并推动技术从通用框架向领域专用解决方案的转化,为通用人工智能的实现和产业智能化转型提供关键技术基础。
无人机集群通信的应用现状及展望
付振江;罗俊松;宁进;多滨;近年来,随着无人机(Unmanned Aerial Vehicle, UAV)逐渐自主化和智能化,单UAV已无法满足日益复杂的任务需求,UAV集群技术的提出能够有效提高UAV的生存能力和任务效率,引起了国内外的广泛关注。当前UAV集群技术面临着极具挑战性的通信问题,严重影响到UAV间的协同作业与信息处理能力。基于UAV集群的概念,通过与多UAV系统对比,系统分析了UAV集群的优点及挑战,并结合近年来不同的通信场景,总结了UAV集群通信的架构和路径规划的解决方案。讨论了集群通信仍面临的开放问题,对未来的研究方向进行了展望。