- 郭耀武;王飞;陈云菲;
近年来目标检测技术取得了显著进展,但大多数基于自然图像设计的检测方法在直接应用于SAR船舶遥感图像时表现不佳,性能显著下降。深入分析表明,SAR图像目标检测的关键挑战在于复杂的背景杂波干扰和多尺度船舶目标的尺度变化。针对上述问题,该文将扩散模型(Diffusion)引入SAR图像船舶目标检测领域,并提出了一种面向SAR图像船舶目标检测的多尺度网络(DMADNet)。为提升检测精度,设计了一种多尺度聚合网络(MANet),其核心设计理念是独立特征提取和交互融合策略,构建灵活且高效的信息流处理框架,突出目标特征,并显著增强推理阶段的检测表现。同时,该文设计的上下文聚合注意力(CA-X)以并行方式集成于网络中,能够有效整合长距离上下文信息,在保证全局上下文对目标判别的帮助下,避免了无关背景的干扰,从而显著提升了复杂背景下船舶目标的检测精度。DMADNet在SAR船舶检测数据集(SSDD)、高分辨率SAR图像数据集(HRSID)以及SAR-Ship数据集上,在IoU阈值设为0.5的条件下,分别达到了96.65%、93.03%和97.92%的平均精度,进一步验证了其在复杂环境下的鲁棒性与卓越的检测性能。
2026年03期 v.36;No.347 59-67页 [查看摘要][在线阅读][下载 1326K] - 朱雨馨;朱烨;魏敏;邹鑫;童攀;
3D Gaussian Splatting作为一种新兴的3D表示方法,在复杂场景的重建和渲染中展现了卓越的性能。在3D Gaussian Splatting目标分割中,大多数方法需要重新训练3D Gaussian Splatting的内置分割属性,不仅耗时较长,还可能导致边界区域的分割结果模糊。为了解决这些问题,提出了一种以2D特征为引导的高效三维分割方法。该分割方法将2D视觉信息与3D空间信息相关联,通过2D提示分割出3D高斯函数表示的目标物体,整个流程无需通过第二次迭代梯度下降为每个高斯函数添加新的分割属性。具体来说,首先根据2D掩码为3D高斯函数分配初始分割标签,随后通过邻界细化算法,细化目标物体的边界,成功克服了边界模糊的挑战,显著提升了分割精度。实验结果表明,该方法能够实现高质量的三维分割,处理时间减少了80%以上,同时分割精度显著提升,mIoU提高了1百分点以上,mACC提高了0.3百分点。
2026年03期 v.36;No.347 68-76页 [查看摘要][在线阅读][下载 1279K] - 何俊;张晓滨;
现有基于Unet++图像分割模型在复杂光照条件下图像阴影检测中由于堆叠卷积和下采样操作,可能导致浅层细节(如纹理、亮度梯度)的丢失,从而影响阴影边界的精准定位和弱阴影区域的检测效果。为了解决这个问题,该文提出一个图像阴影检测模型MADSUNet。在深层编码器加入自适应多头掩码注意力模块,该模块通过动态权重分配机制增强对阴影区域关键特征的聚焦能力,同时抑制非阴影背景的干扰,从而提升模型在复杂光照条件下的鲁棒性。此外,在解码器部分引入高效动态上采样器,进一步改善阴影边界的平滑性和连续性。实验结果表明,该模型在图像阴影检测方向有较高的准确率和检测性能,在SBU、UCF、ISTD三个数据集上平衡错误率(BER)值分别达到了4.99%、8.72%、2.06%,这意味着该模型可以准确识别不同光照条件下的图像阴影和非阴影区域,从而准确区分阴影和黑色背景。
2026年03期 v.36;No.347 77-82+91页 [查看摘要][在线阅读][下载 1309K] - 吴灿灿;张智;
当前基于扩散模型的图像超分辨率方法普遍采用双线性插值对低分辨率图像进行简单预处理,忽视了对多尺度特征的提取;同时,其噪声预测网络多采用单一的基于卷积神经网络的U-Net结构,无法有效捕获噪声图像的全局特征。为此,该文提出一种融合LR编码网络和扩散模型的超分辨率重建方法。首先,引入蓝图可分离卷积并设计出多尺度通道感知模块,实现了对输入图像多尺度、多层次的特征提取;其次,设计高效特征蒸馏模块,通过动态加权机制增强图像细节和关键区域的表达能力;结合上述模块构建出LR编码网络,旨在对LR图像预超分并提取其多尺度特征,将预超分图像作为先验条件有效引导扩散模型的去噪方向;最后,基于卷积神经网络和Swin Transformer,遵循U-Net形状,搭建出集成型噪声预测网络,提高噪声预测的精准度。实验结果表明,该方法在多个标准数据集上的整体性能优于其他先进方法。
2026年03期 v.36;No.347 83-91页 [查看摘要][在线阅读][下载 1498K] - 崔振涛;群诺;郭亚美;尼玛扎西;
藏语多方言语音识别受限于语料稀缺与方言异质性,导致模型性能提升和跨方言泛化受限。针对该问题,提出了一种基于Whisper预训练模型的分层迁移微调框架,在冻结预训练参数的基础上,采用两种参数高效微调方法——LoRA与AdaLoRA,比较其在多方言识别中的性能差异。进一步引入顺序迁移与混合训练策略,以提升模型迁移稳定性及跨方言适应能力。实验在卫藏、安多及康巴三大藏语方言上进行,模型训练与测试均按方言划分。实验结果表明,微调策略在卫藏与安多方言上的字符错误率(CER)分别达到10.0%和5.9%,在康巴方言中,引入顺序迁移后CER较直接微调下降11.4%。上述结果验证了该方法在藏语多方言语音识别中的有效性,且对低资源康巴方言具有显著提升效果。
2026年03期 v.36;No.347 92-98页 [查看摘要][在线阅读][下载 1237K] - 孔李沛;赵月爱;张艳;王玲;
针对航拍图像小目标检测精度低、检测实时性差以及无人机嵌入式平台计算资源受限等问题,提出一种基于DTA(Dynamic Task Alignment,动态任务对齐)双标签分配策略的轻量化小目标检测模型。首先,为了降低复杂背景信息对小目标特征的影响,用YOLOv10的P2层替换原来的P5层,提高模型对小目标特征的学习能力;其次,为了降低模型参数量,构建轻量化Faster特征提取模块,使用FasterNet中的残差模块Fasternet Block替换C2f中的Bottleneck模块;再次,提出动态分类与定位任务对齐检测方法,旨在解决小目标特征在分类和回归任务中的不匹配问题,在提高模型检测小目标精度的同时,还能进一步降低模型的复杂度;最后,利用基于幅度的层自适应剪枝算法对模型进行全局通道剪枝,在保证模型检测精度的前提下进一步压缩模型参数量和文件大小。在Visdrone2019数据集上的实验结果表明,该模型在APT、APS和mAP上分别比Baseline提高了104%、50%、26%,参数量和模型文件体积分别降低了63%和59%,模型FPS约为148。各种数据表明该模型对小目标检测具有检测精度高、检测速度快、模型易部署等优点。
2026年03期 v.36;No.347 99-108页 [查看摘要][在线阅读][下载 1443K] - 王浩宇;鞠全勇;
为提高消防机器人在复杂环境下的火焰检测精确率,该文提出一种基于改进YOLO11n的火焰检测算法。通过融合FasterNet主干网络、局部窗口级联分组注意力模块及双向全局-局部特征金字塔三项核心改进,显著提升了模型的特征提取与多尺度融合能力。实验采用Roboflow公开火焰数据集,在RTX4060硬件平台验证表明:改进后模型的平均精确率均值mAP达94.3%,相较于原模型提升了2.5百分点,精确率与召回率分别提高3.6和1.8百分点,F_1分数达到了89.7%,表明改进后的模型在保持高精确率的同时召回能力也得到增强,整体性能更加均衡,在复杂环境下仍保持高可靠性。并通过目标检测错误识别工具箱TIDE进行深入分析,模型的定位、背景、漏检及重复检测错误率分别降低1.13、0.13、0.18和0.11百分点,从错误类型层面验证了模型性能的全面提升。该算法在保持良好实时性的同时,有效解决了浓烟遮挡、小目标漏检等复杂场景问题,为消防机器人在复杂环境下的智能化作业提供了可靠的技术支持。
2026年03期 v.36;No.347 109-117页 [查看摘要][在线阅读][下载 1395K]
- 富宇;李浩冉;
自然语言到SQL(Text-to-SQL)任务旨在将用户查询映射为可执行的SQL语句,是自然语言与数据库交互的核心技术。当前主流大型语言模型在处理复杂结构、多表关联及嵌套逻辑时,常出现结构错误、语义偏离和执行失败,限制了其可靠性与泛化能力。为此,该文提出Struct-MCTS,一种基于结构感知与蒙特卡洛树搜索(MCTS)的Text-to-SQL生成框架。该框架通过细粒度结构化动作建模SQL生成过程,并结合多模型并行生成与协同辩论对候选路径进行动态打分,从而提升生成结果的鲁棒性与一致性。在零样本条件下,Struct-MCTS在Spider和BIRD等复杂数据集上表现出领先的执行准确率,显示出强泛化能力与实际应用潜力。
2026年03期 v.36;No.347 118-123+117页 [查看摘要][在线阅读][下载 1247K] - 周磊;邵佳慧;徐英杰;田宏;
在农业现代化中,黄瓜病害检测对保证产量和品质极为重要。现有方法在处理形状大小多样和症状差异显著的黄瓜叶片时存在局限,且难以在资源受限设备上应用。该文提出了一种基于YOLOv9的黄瓜病害检测轻量化算法——SPAF-YOLOv9。首先引入空间到深度卷积(SPD-Conv)并结合下采样模块(ADown)构成SPAD模块,优化了特征图的空间信息利用效率,增强了模型捕捉细微特征的能力。同时引入渐进式特征金字塔网络(AFPN)进行跨层级特征融合,提升了模型对不同尺度目标的检测能力。实验结果表明,SPAF-YOLOv9模型在黄瓜病害数据集上的精确率达到91.5%,平均精度均值(mAP)达到了92.5%。与初始模型相比,参数量减少了约19.3%,计算量(GFLOPs)降低了约9.8%,推理时间显著缩短。由此表明,SPAF-YOLOv9模型不仅提高了黄瓜病害检测的精度和效率,而且通过轻量化设计,使其更适合在资源受限的嵌入式设备上部署,为农业现代化提供了有力的技术支持。
2026年03期 v.36;No.347 124-129页 [查看摘要][在线阅读][下载 1177K] - 周娟;胡静;张晓龙;金淑婷;
高性能计算机辅助药物设计是一个极具潜力的领域,而药物靶点亲和力(DTA)预测则是众多药物设计阶段中关键的步骤之一,它降低了药物开发的成本并提高了效率。本研究旨在开发一种高精度的药物靶点亲和力(DTA)预测模型以提升药物开发效率。提出了一种基于多通道密集连接图卷积和多尺度交互融合的预测方法。方法上,模型以药物分子和蛋白质的图结构数据(节点邻接矩阵)为输入,通过多头自注意力模块结合多通道密集连接图卷积模块提取药物分子的高阶结构特征,蛋白质靶标特征则通过三层图卷积网络提取。在特征融合阶段,引入Highway和Mamba模块从局部与全局两个尺度建模药物与靶点之间的交互关系,并通过全连接层输出亲和力预测值。实验结果表明,该模型在多个公开数据集上的预测性能优于现有方法,展现出更高的准确性和鲁棒性。相较于传统模型,该方法通过密集连接和多通道机制有效聚合高阶邻接信息,融合模块增强了特征交互建模能力。结论表明,该模型具有强大的泛化能力,能准确预测药物靶点相互作用强度,为计算机辅助药物设计提供了高效工具。
2026年03期 v.36;No.347 130-137页 [查看摘要][在线阅读][下载 1157K] - 王玥琪;姜静清;赵海燕;宋佳智;
针对灰狼优化算法(GWO)求解精度不高、收敛速度较慢、易陷入局部最优等缺陷,该文在GWO框架的基础上引入两项改进策略:一是α狼的局部搜索策略,通过在最优解邻域内进行扰动,赋予最优解主动搜索能力,从而提高算法的局部搜索能力;二是随机概率混合更新位置策略,借鉴百慕大三角优化算法(BTO)的思想,以概率阈值动态选择位置更新方式。一方面,利用三角强吸引区域面积扰动因子与指数衰减加速度扰动因子来增强种群多样性,从而提高算法的全局搜索能力;另一方面,结合GWO中α、β、δ狼的等权协同引导机制以保持解的稳定性。据此,提出基于局部三角搜索机制的灰狼优化算法(LTS-GWO)。为验证LTS-GWO的有效性,在三种不同类型的11个基准测试函数上,将LTS-GWO与其他群智能优化算法及其改进算法以及其他改进型GWO算法进行对比实验,实验结果表明LTS-GWO具有良好的求解精度、稳定性和收敛速度。进一步地,将LTS-GWO应用于拉伸/压缩弹簧设计和三杆桁架设计两类典型工程设计优化问题中,通过与其他改进型群智能优化算法以及其他改进型GWO算法进行对比,验证了LTS-GWO良好的实用性和鲁棒性。
2026年03期 v.36;No.347 138-146+153页 [查看摘要][在线阅读][下载 1360K] - 梁海军;沈小波;胡文海;薛子涵;
该文提出了一种改进的淘金优化算法(IGRO),该算法融合了蜘蛛蜂优化算法(SWO)与差分进化算法(DE)的优良特性,以提升优化性能。IGRO通过整合SWO的狩猎与筑巢行为以及DE的差分变异和交叉机制,实现了在全局搜索与局部开发之间更为平衡的探索能力。此外,IGRO采用Levy飞行策略增强了搜索代理的随机性和多样性,避免了陷入局部最优解。利用高斯函数模型绘制山地环境,根据约束条件,目标函数建立无人机飞行的数学模型,根据适应度函数求出在指定空域内能避开障碍物的飞行最小代价值,并通过三次样条插值平滑飞行路径。仿真和CEC2017测试集结果表明,IGRO在更少迭代次数内生成了高质量、平滑的路径,克服了传统遗传算法的早熟收敛和局部搜索能力不足的问题,适应复杂地形,提供了高效可靠的解决方案。
2026年03期 v.36;No.347 147-153页 [查看摘要][在线阅读][下载 1270K] - 季瑶涵;姜瑛;刘海毅;
面对海量的移动应用软件(APP),用户评论是了解用户满意度及情绪状态的重要渠道。然而,传统情绪分类仅将情绪分为积极、中性和消极三类,分类范围较粗且强度等同,难以深入分析特定方面的细粒度情绪。此外,现有方法仅关注了文本的语义和位置特征,未能将各个特征进行有效融合,忽略了评论语句整体与内部具体元素的协同作用与内在联系的同时,也忽略了其他潜在有用特征。因此,该文提出了一种细粒度的情绪分析方法,针对APP软件用户评论中的评价对象,通过融合全局和局部特征对用户评论中的情绪进行细致的划分和识别。该方法对APP软件用户评论中的评价对象和评价观点进行定义,接着基于ISO/IEC 25010:2011将评价对象分为9类,运用命名实体识别技术抽取评价对象和观点;然后提取全局特征和局部特征;最后将这些特征进行协同和融合并应用BiLSTM-Attention模型将情绪划分为12个类别并赋予0~10分的评分。实验表明,该方法证实了基于特征融合的APP软件用户评论细粒度情绪分析的有效性,为产品优化提供更精准的参考依据。
2026年03期 v.36;No.347 154-161+177页 [查看摘要][在线阅读][下载 1221K]
- 熊洋俊;李鹏;成姝燕;
针对现有的对抗训练方法普遍耗时长的问题,该文提出了一种新的对抗训练策略。首先,在训练期间,可以根据模型网络层中每层的梯度大小来调整该层的采样概率。梯度较大的层,被赋予较高的采样概率,意味着它们在训练中会更多地参与权重更新。梯度较小的层,被赋予较低的采样概率,意味着它们在训练中可能被冻结或参与较少的更新,从而减少计算开销,加快训练效率。其次,引入了一种动态攻击强度的对抗样本生成策略,在训练前期使用攻击强度较弱的对抗样本,生成对抗样本的时间较短;随着训练的进行,对抗样本的攻击强度逐渐增加,伴随着生成对抗样本的时间也逐渐增加。尽管如此,相较于标准对抗训练,该策略显著减少了对抗样本生成的时间,提升了训练效率。在CIFAR-10、CIFAR-100和Tiny ImageNet数据集上进行实验,验证了该方法可以显著减小时间开销,并且在模型对抗鲁棒性方面也有较好的表现。
2026年03期 v.36;No.347 186-191+206页 [查看摘要][在线阅读][下载 1099K] - 王泷铖;李进;宋亚飞;
针对传统恶意代码检测方法对于轻量化、性能和训练效率难以兼顾的问题,提出一种可快速训练的具有较高性能的轻量化恶意代码分类方法。该方法首次提出将轻量化改造的MobileNetV3与自监督对比学习SimSiam网络相结合的混合训练策略,以充分发挥两者在特征提取方面的互补优势,并且引入自定义的层次化融合注意力模块(HFAM),其采用动态且差异化的注意力策略,高效融合了SimSiam与MobileNetV3提取的异构特征,从而在增强特征表示能力的同时降低了计算冗余。实验结果表明,该方法在Malimg、MaleVis和Maldeb数据集上的准确率分别达到了99.68%、98.08%和99.28%,平均较现有高效轻量化方法EfficientNetV2提升约4.4%。同时,训练时间分别减少至188秒、200秒和371秒,训练速度提升13倍以上。可见,该方法在资源受限环境下对多样化恶意代码样本具有较高的分类性能和训练效率。
2026年03期 v.36;No.347 192-199页 [查看摘要][在线阅读][下载 1242K] - 杨铭;闫嘉龙;
针对传统恶意代码检测方法难以捕捉关键细节与泛化能力不足的问题,该文提出了一种基于多特征提取与多模型融合的恶意代码检测方法。通过多维度特征映射技术,将恶意代码的二进制数据转化为三种互补性灰度图像,分别提取其纹理特征;同时解析可执行文件的反汇编代码,利用长短时记忆网络(LSTM)捕获指令序列的潜在行为特征。在此基础上,采用加权投票策略对图像特征进行融合,构建出图像特征融合模型(IFFEM)。进一步通过堆叠融合策略将IFFEM与LSTM模型进行深度整合,形成集成模型IITFM(Integrated Image-Text Feature Model)。通过多角度特征协同分析,充分发挥图像特征和文本特征的互补性,构建了高效、精准的恶意代码检测体系。在DataCon2020恶意代码数据集上的实验表明,该方法显著提升了恶意代码检测的准确率,验证了多特征协同分析在提升检测性能方面的显著优势。
2026年03期 v.36;No.347 200-206页 [查看摘要][在线阅读][下载 1333K] - 郭红波;王继剑;冯治东;贺海波;
为提高企业网络安全防护水平及对网络威胁的实时应急响应能力,该文设计并提出了一种基于集成自编码器的多任务混合神经网络模型,并构建了相应的风险应急响应平台。该模型首先通过自编码器进行高维特征的有效提取,继而通过多任务神经网络实现特征共享,提升了模型的泛化能力,最终利用Softmax分类器完成多任务分类,实时预测威胁类型和风险应急响应处置建议。风险等级根据风险类型特征在数据库实时检索匹配,实现风险等级预测。为了提升模型的适应性与准确性,该文还引入了监督学习机制,通过与平台业务的联动,结合人工反馈修正已知威胁,对未知威胁触发人工研判,支持模型的周期性自动迭代与知识库的持续更新与优化。实验结果表明,该方法在特征提取与预测精度方面优于XGBoost-DNN、LSTM网络和MBO-LPO等传统方法,精确率达到98.6%,表明该模型在多任务学习、风险预测和应急响应方面具有较高的有效性与可行性。
2026年03期 v.36;No.347 207-214页 [查看摘要][在线阅读][下载 1572K] - 徐胜超;蒋大锐;吕峻闽;
利用单一维度表征网络安全状态的参量进行度量时,参量的畸变会引起度量误差,导致生成的防御策略难以保障攻击场景下网络的安全。为此,论文引入AI大模型对多维网络安全进行度量,并生成主动防御策略。从主机状态和网络状态两个角度出发,在7个维度上对表征网络安全状态的参量进行量化,并拟合权重输出网络安全度量结果,避免了单一维度参量畸变引起的度量误差。利用整数线性规划的方式对网络切片进行部署时,将安全度量值最大值化作为目标函数,在AI大模型下更新网络切片迁移结果,直至目标函数达到收敛,输出主动防御策略。仿真结果中,设计技术在实现对网络安全状态准确度量的基础上,生成的主动防御策略能够有效降低攻击的成功率,攻击类型为数据泄露时,该方法的主动防御策略生成耗时仅为21 ms,节点数量为30个时,该方法的攻击成功率为2.3%,表明该方法防御策略效果好。
2026年03期 v.36;No.347 215-221页 [查看摘要][在线阅读][下载 1395K] 下载本期数据