多模态大模型的发展综述及思考
王金桥;杨蓓莹;近年来,随着以ChatGPT为代表的大语言模型(Large Language Models, LLMs)在通用人工智能方向上取得突破性进展,国内外掀起了大模型应用的研究热潮。人类获取和处理信息的方式往往涉及视觉、听觉、文本等多种模态,单纯依赖文本的语言模型难以充分理解和表达复杂的现实世界信息。因此,研究者开始探索将LLMs扩展到多模态领域,通过统一建模文本、图像、视频等不同类型的数据,构建具有跨模态理解能力的多模态大模型(Multimodal Large Models, MLMs)。对MLMs的发展现状进行了全面梳理,重点介绍了当前主流的模型架构、训练策略以及评估方法,并分析了该领域面临的挑战和未来发展方向。随着模型参数规模和训练数据的大幅扩展,MLMs在跨模态任务中的性能显著超越了传统方法,为通用人工智能的发展奠定了重要基础。这些模型在视觉问答(Visual Question Answering, VQA)、图像描述、多模态对话等典型任务中展现出卓越的理解与生成能力。然而,当前MLMs仍存在长序列处理效率、计算资源需求以及模型可靠性等方面的技术瓶颈。未来研究将致力于在保持模型性能的前提下提升计算效率,并推动技术从通用框架向领域专用解决方案的转化,为通用人工智能的实现和产业智能化转型提供关键技术基础。
低空安全时空感知与管控导读
蔚保国 ;孙永生 ;吴启晖;<正>低空经济作为国家重大战略部署,是新质生产力的典型代表,其本质是地面经济活动向低空空域的拓展,这种拓展的有效性和规模化取决于空间信息基础设施的完备性和安全性。该类空间信息基础设施不同于地面基础设施,具有空间数字化、网络化、体系化的特点,其中时空感知与管控运维是低空信息网络的关键核心,是保障低空飞行安全及经济活动安全的必要支撑手段。
低空时空网:概念框架、关键技术、应用前景
蔚保国;盛传贞;张云龙;李硕;熊华捷;张振宇;低空时空网是低空安全信息基础设施的重要组成,是低空经济走向规模化、安全化、标准化应用的必要条件。提出了低空时空网的概念内涵和体系架构,分析了高安全低空时空网天空地协同融合技术、无人集群感通导控一体化网络技术、高可信网信终端技术、低空时空网导航安全综合监测评估技术、基于多维网信场图的飞行安全风险评估技术等关键技术。构建了“云-边-端”的网络化、数字化、智能化低空飞行服务与管理模式,实现了对各类低空飞行器个体及群体的智能导航、气象预报、实时监控、调度管理、风险预测评估和飞行辅助服务,为低空飞行提供泛在、精准、可信的时空信息支撑,实现时空数据驱动的低空安全管理。
低空智联网空天地协同技术研究——关键挑战与对策建议
马新辉;低空智联网作为支撑低空经济高质量发展的新型基础设施,通过天基、空基与地基网络深度融合的空天地协同技术架构实现飞行器智能互联与空域高效管控,才能实现低空经济的规模化发展。地理空间信息技术(Geospatial Information Technology, GIT)通过高精度定位、三维建模、时空数据融合和智能分析等为空域管理、低空飞行规划、基础设施布局规划、低空监管和服务提供有效支撑,成为推动低空经济高质量发展的核心引擎。提出以地理信息技术为关键支撑,融合5G-A通感一体化基站与低轨卫星组网,构建具备通信感知融合、广域覆盖与精准定位能力的低空智联网。地理信息技术通过统一的多尺度实景三维建模数据底座,融合跨部门、跨行业数据,支撑空域动态分区和分配、基于各类地物要素的路径规划,以及多类型、规模化UAV有序飞行与智能避让等。5G-A基站实现低空目标厘米级追踪与高带宽传输。千帆星座等卫星网络补足高空通信盲区。深圳“秒级审批”、海南“电子围栏”等试点验证其在物流、安防与应急救援场景的应用效能。但当前低空智联网还面临通导监覆盖不足、跨部门协同缺位及数据孤岛等挑战,需通过强化顶层设计、分级网络布局、构建标准化信息平台及深化产业生态协同等路径突破瓶颈。为低空智联网技术优化与政策制定提供系统性参考,助力我国低空经济有序稳健发展。
无人机红外目标检测技术:现状与展望
徐倩;韩楠;董文安;胡海;苟浩淞;杨春芳;乔少杰;随着低空经济的快速发展,无人机在物流、安防、应急救援等领域的应用日益广泛,而无人机目标检测技术作为维护低空交通秩序、保障公共安全的核心支撑,具有重要的研究和应用价值。介绍了无人机红外目标检测技术的研究背景和意义;详细剖析了传统算法与基于深度学习算法的原理、步骤及各自的优劣;对无人机红外目标检测的关键技术进行了分析,包括小目标检测技术、复杂背景适应技术、实时性优化技术和轻量级模型设计;探讨了无人机红外目标检测技术所面临的核心挑战及未来发展趋势,为低空经济场景下的算法选型及工程部署提供了有益参考。
[下载次数: 449 ] [被引频次: 0 ] [阅读次数: 103 ] HTML PDF 引用本文
高动态GNSS接收机高阶载波环的设计与实现
吴翔;彭舒文;杨东旭;张锦;周丰华;针对高动态环境下全球导航卫星系统(Global Navigation Satellite System,GNSS)接收机载波环动态适应性不足的问题,提出了一种高阶载波环设计。该设计采用三阶锁频环辅助四阶锁相环的结构,以应对加速度和加加速度的冲击。通过引入环路带宽自适应调整算法,实时监控环路的工作状态,动态调节锁频环和锁相环带宽,在保证载波跟踪效果的同时兼顾硬件性能。仿真和测试结果表明,所提出的高阶载波环可有效应对70 g加速度和100 g/s加加速度的冲击,相较于传统的二阶锁频环辅助三阶锁相环结构,具有更强的动态适应性以及更好的定位与测速精度。该设计已在箭载GNSS接收机的工程实现中取得了良好效果,为高动态载体导航与定位提供了一种有效的技术途径。
融合数据增强与注意力机制的下肢关节角度预测
洪涛;吴钦木;随着人口老龄化加剧,肢体功能障碍患者增加,特别是因慢性病导致行走困难的患者,需要一种能准确识别人体运动意图并辅助康复训练的设备。提出一种融合数据增强与注意力机制的CNN-BiLSTM模型,用于下肢髋膝关节角度预测。通过惯性测量单元采集步态信号,并采用多种数据增强技术如高斯噪声、随机遮挡、缩放及时域扭曲,模拟真实干扰情况以提升模型性能。实验结果表明,新模型在处理原始及增强数据时均优于传统网络模型,特别是在膝关节预测上,误差显著降低,其误差指标均方根误差(Root mean square error, RMSE)、平均绝对误差(Mean absolute error, MAE)和决定系数(R2)最优状态下分别为1.89、1.23、0.9878,平均误差较传统方法减少超过10%。不同增强策略的应用进一步增强了模型对个体差异和步态变化的适应能力,提高了预测精度和稳定性,为智能康复外骨骼系统的发展提供了新的方法和技术支持,有助于提升康复训练效果和患者生活质量。
离散波束下基站与用户定位方法
叶欣;蔡梦佳;李立言;针对通信系统中基站位置与朝向存在误差导致定位性能下降的问题,提出了一种基站与用户定位的协同优化方法。该方法在离散波束特性条件下,构建静动分离的联合定位模型,引入箱粒子滤波,结合区间分析理论,并设计重采样机制以增强粒子多样性,有效抑制角度量测的非高斯误差。对不同基站初始误差及用户遮挡条件开展仿真分析,结果表明,该方法在定位精度方面优于基于高斯假设的卡尔曼滤波,能够有效修正基站初始信息误差并保持较高稳定性。研究为离散波束环境下高精度定位系统的设计与实现提供参考。
面向输电线路在线监控系统无线宽带自组网关键技术研究
陈鼎;陈智阳;徐嘉鸿;陈勇;琚诚;针对高压输电线路在线监控与数字化运维对通信技术的需求,以及现有光纤、4G/5G等通信手段在复杂环境适应性、覆盖完整性、成本控制等方面的不足,分析了高压输电线路现有通信手段的特点和需求,依托国家重点研发计划项目,研究并提出了一种高可靠宽带超多跳无线自组网通信系统解决方案,攻克了多跳无线传输后的业务服务质量急剧下降的技术难题,构建了宽带超多跳安全无线自组网通信系统,实现了具有服务质量保证的远距离宽带业务传输服务。通过OMNeT++ 仿真平台、9节点室外地面测试与国网天津 220 kV 滨幸一线实地投运对所构建超多跳无线自组网通信系统进行仿真与测试。仿真与测试结果显示系统可实现 50 跳宽带无线数据传输,端到端流量不低于 2 Mb/s,相较于传统技术路线,该系统技术适应性更强、运维成本更低,提升了电网数字化运维水平,为新型电力系统通信网络建设提供可靠解决方案。
北斗系统平稳过渡对导航接收机服务性能影响分析
吕志成;高沙沙;张悦;北斗卫星导航系统(BeiDou satellite navigation System,BDS)接收机具备定位、导航、授时(Positioning, Navigation and Timing,PNT)和报文通信功能,在各行业中得到广泛应用。以北斗二号(BDS-2)区域系统向北斗三号(BDS-3)全球系统平稳过渡为背景,研究其对导航接收机服务性能影响及应对措施。通过对比BDS-2与BDS-3系统在信号类型、信号体制、星座规模和服务性能等方面的差异,阐述北斗系统平稳过渡的具体表现形式和状态变化趋势。重点分析北斗系统平稳过渡对导航接收机报文通信、导航定位、抗压制干扰等服务性能产生的影响。仿真结果表明,BDS-2接收机(PRN1~37)在平稳过渡期间,RDSS报文通信服务仍可正常使用;随着BDS-2卫星的陆续退役,空间可用卫星数将逐渐由33颗减少到18颗,全球范围内平均可见卫星数由11.62减少至6.31,平均几何精度因子(Geometric Dilution Precision, GDOP)值由2.00增加至3.15,服务连续可用性由93%降低到46.46%,定位精度和服务范围均受到影响;BDS-3卫星实施功率增强时,导航接收机可获得7~15 dB的抗压制干扰能力提升。针对导航接收机不同应用场景分别给出减弱或消除影响的应对措施,使导航接收机在北斗系统平稳过渡期间能够持续为用户提供可靠服务。研究成果可为北斗导航接收机的设计、研制和应用提供参考。
最大类间方差法在图像处理中的应用
齐丽娜;张博;王战凯;图像分割在图像处理中占有重要的地位,分割结果的好坏直接影响图像的后续处理。文章首先介绍了最大类间方差法及其改进算法———基于灰度拉伸的最大类间方差法算法原理和实现,并针对高速公路中的图像特点。在背景差分法的基础上利用上述两种方法对图像进行了分割处理,对两种方法处理的结果进行了比较。
无线传感器网络拓扑结构研究
杨宁;田辉;张平;李立宏;随着处理技术、存储技术以及无线传输技术的不断发展,由体积小、重量轻、价格低的无线传感器节点所组成的传感器网络已经充分具备了感知客观事物及自然现象,随时随地为用户提供精确信息的能力。通过对于星状网、网状网和混合网等几种常用传感器网络拓扑结构的比较,以及针对这些拓扑结构所形成的网络寿命的仿真,说明了对于常用的基站距离远、节点密度大的传感器网络,分层式的拓扑结构能够大大的节省网络能量,延长网络寿命,改善网络性能。
基于S型函数的变步长LMS自适应滤波算法
覃景繁,韦岗本文通过建立步长因子μ与误差信号之间的非线性函数关系,得出一种新的变步长自适应滤波算法(SVSLMS)。理论分析和计算机仿真结果表明该算法的性能优于传统的LMS算法和NLMS算法。
人工智能大模型综述及展望
罗锦钊;孙玉龙;钱增志;周鲁;王金桥;大模型是人工智能领域的热门研究方向。以ChatGPT为代表的大模型技术应用掀起了国内外的大模型研究热潮,大模型参数规模和训练数据量级迅速增长,模型性能显著提升。概述了大模型的发展历程以及代表性的算法模型,介绍了大模型的基础架构及其核心原理,分析了大模型的特点,讨论了大模型的局限性以及未来发展方向。
MIMO无线传输技术综述
李忻;黄绣江;聂在平;MIMO无线传输技术是通信领域的一项重要技术突破,它能在不增加带宽与功率的情况下成倍地提高无线通信系统的容量和频谱效率,堪称新一代无线通信系统中的关键技术之一,近年来引起了人们的广泛关注与研究兴趣。回顾无线移动通信的发展历程,概述天线分集技术与智能天线技术,剖析MIMO无线传输技术的原理与国内外研究现状:传统单天线系统向多天线系统演进、智能天线向多天线系统演进、MIMO无线传输技术的原理、MIMO系统中的分集与复用、MIMO无线信道建模、MIMO系统中的多天线设计等,为深入认识与进一步研究MIMO无线传输技术奠定基础。
人工智能大模型综述及展望
罗锦钊;孙玉龙;钱增志;周鲁;王金桥;大模型是人工智能领域的热门研究方向。以ChatGPT为代表的大模型技术应用掀起了国内外的大模型研究热潮,大模型参数规模和训练数据量级迅速增长,模型性能显著提升。概述了大模型的发展历程以及代表性的算法模型,介绍了大模型的基础架构及其核心原理,分析了大模型的特点,讨论了大模型的局限性以及未来发展方向。
基于YOLOv8s改进的小目标检测算法
雷帮军;余翱;余快;针对目标检测任务中小目标尺寸较小、背景复杂、特征提取能力不足、漏检和误检严重等问题,提出了一种基于YOLOv8s改进的小目标检测算法——Improved-v8s。Improved-v8s算法重新设计了特征提取和特征融合网络,优化检测层架构,增强浅层信息和深层信息的融合,提高了小目标的感知和捕获能力;在特征提取网络中使用部分卷积(Partial Convolution, PConv)和高效多尺度注意力(Efficient Multi-scale Attention, EMA)机制构建全新的F_C2f_EMA,在降低网络参数量和计算量的同时,通过通道重塑和维度分组最大化保留小目标的特征信息;为了更好地匹配小目标的尺度,优化调整SPPCSPC池化核的尺寸,同时引入无参注意力机制(Simple-parameter-free Attention Module, SimAM),加强复杂背景下小目标特征提取;在Neck部分使用轻量级上采样模块——CARAFE,通过特征重组和特征扩张保留更多的细节信息;引入了全局注意力机制(Global Attention Mechanism, GAM)通过全局上下文的关联建模,充分获取小目标的上下文信息;使用GSConv和Effective Squeeze-Excitation(EffectiveSE)设计全新的G_E_C2f,进一步降低参数量,降低模型的误检率和漏检率;使用WIoU损失函数解决目标不均衡和尺度差异的问题,加快模型收敛的同时提高了回归的精度。实验结果表明,该算法在VisDrone2019数据集上的精确度(Precision)、召回率(Recall)和平均精度(mean Average Precision, mAP)为58.5%、46.0%和48.7%,相较于原始YOLOv8s网络分别提高了8%、8.5%和9.8%,显著提高了模型对小目标的检测能力。在WiderPerson和SSDD数据集上进行模型泛化性实验验证,效果优于其他经典算法。
无人机集群综述:技术、挑战与未来
张旭东;李少波;李传江;张安思;杨磊;随着无人系统、网络通信技术和群体智能理论的发展,使无人机集群协作从概念走向现实、从理论转向实践。回顾了无人机集群的兴起与发展,概述了无人机集群难点与特点;从无人机集群层次结构技术框架出发,分别从智能感知层、通信网络层、自主决策层、路径规划层、协同控制层和实际应用层6个方面介绍了无人机集群关键技术的研究进展;讨论了无人机集群在未来发展中面临的诸多挑战,并对未来研究方向进行了展望,旨在为无人机集群技术的进一步应用落地提供理论参考。
MIMO无线传输技术综述
李忻;黄绣江;聂在平;MIMO无线传输技术是通信领域的一项重要技术突破,它能在不增加带宽与功率的情况下成倍地提高无线通信系统的容量和频谱效率,堪称新一代无线通信系统中的关键技术之一,近年来引起了人们的广泛关注与研究兴趣。回顾无线移动通信的发展历程,概述天线分集技术与智能天线技术,剖析MIMO无线传输技术的原理与国内外研究现状:传统单天线系统向多天线系统演进、智能天线向多天线系统演进、MIMO无线传输技术的原理、MIMO系统中的分集与复用、MIMO无线信道建模、MIMO系统中的多天线设计等,为深入认识与进一步研究MIMO无线传输技术奠定基础。
基于改进YOLOv8的无人机航拍图像目标检测算法
程换新;乔庆元;骆晓玲;于沙家;针对现存无人机航拍图像目标检测算法检测精度较低、模型较为复杂的问题,提出一种改进YOLOv8的目标检测算法。在骨干网络引入多尺度注意力EMA,捕捉细节信息,以提高模型的特征提取能力;改进C2f模块,减小模型的计算量。提出了轻量级的Bi-YOLOv8特征金字塔网络结构改进YOLOv8的颈部,增强了模型多尺度特征融合能力,改善网络对小目标的检测精度。使用WIoU Loss优化原网络损失函数,引入一种动态非单调聚焦机制,提高模型的泛化能力。在无人机航拍数据集VisDrone2019上的实验表明,提出算法的mAP50为40.7%,较YOLOv8s提升了1.5%,参数量降低了42%,同时相比于其他先进的目标检测算法在精度和速度上均有提升,证明了改进算法的有效性和先进性。

网站访问量
今日访问量: 0