智能博弈领域中的对手建模方法综述
程恺;张金鹏;邵天浩;邹世辰;于本川;对手建模是通过在线或离线的方式,学习构建出对手的模型,并对对手的行为、意图、策略或是其它特征预测的一种方法总称。其在网络安全、金融、智能机器人等诸多领域已有应用,同时也逐渐成为智能博弈研究的热点之一,特别是在部分可观察的情况下,己方信息的不完整会给对手建模带来更大的挑战。针对当前对手建模方法种类多样、应用场景尚不明晰、优缺点比较不系统等问题,基于己方对博弈环境的观察程度,建立了一种新的对手建模方法分类体系,将对手建模分为了完全可观察下的对手建模和部分可观察两大类下的对手建模,同时在阐述完全可观察对手建模方法的基础上,着重介绍了部分可观察情况下的对手建模问题,明确了相关方法的适用场景,对不同方法的优缺点及局限性进行了比较分析。最后针对存在的问题,提出了相关研究展望,为该领域进一步研究提供了重要参考。
基于IPFS的分批式容器镜像分发方案设计
陈小星;鲍一飞;顾加伟;陈灿;容器技术凭借其轻量、可移植、便于扩展等优势,在业界得到了广泛使用。容器启动前需要预先下载所需镜像,因此容器镜像下载时延直接关系到服务上线和更新迭代的效率,进而影响服务质量。现有方法通过P2P(Peer-to-Peer)传输技术处理并发的镜像拉取请求以提升镜像分发速度,但其传输初始阶段效率较低,因此在对服务响应速度有严格要求的任务场景中,如电商平台进行促销活动、流媒体服务发布新热点内容等,会导致用户等待服务时间较久。针对此问题,该文提出了一种基于星际文件系统(Inter Planetary File System, IPFS)的分批式镜像分发方案。该方案首先将集群中拥有所需镜像的节点加入到IPFS网络中,随后依据当前网络中的源节点数量,分批将需求节点加入IPFS网络进行镜像传输,直至所有需求节点都获取到所需镜像。实验结果表明,该方案能够显著提升部分节点的响应速度,并且提高了分发过程的鲁棒性。
结合多特征融合和Transformer的步态识别
刘庆华;王正勇;秦予禛;陈洪刚;刘怡欣;何小海;近年来,步态特征因具有非接触、自然性、隐蔽性、难模仿等优势受到广泛关注。针对现有步态识别方法中受到相机视角、行人遮挡或外观变化等因素导致的步态识别准确率急剧下降的问题,提出了一种基于多特征融合和结合Transformer的步态识别方法。通过在模型输入时将步态轮廓图以及步态骨骼图逐帧输入,将轮廓特征与骨骼特征进行提取融合,实现跨模态的互补,同时提出了由多个平行的多尺度时间特征提取模块构成的多尺度时间特征融合器,引入了标准Transformer结构的编码部分以提取全局时空特征,并通过残差结构提取局部时空特征,最后通过通道注意力机制将局部时空特征和全局时空特征进行特征融合,以此来提高模型识别的准确率。实验结果表明,该方法在CASIA-B公开步态数据集上的行人正常行走、带包行走、穿大衣或夹克行走这三种场景下的准确率分别达到了98.6%,95.1%和86.3%,同时在自建数据集上也取得了不错的效果,验证了该方法的有效性。
基于双尺度特征交互网络的CT影像分类应用
孔佑进;陈锘;尹冰德;李响;何昶;陈建刚;深入探讨一种基于双尺度特征交互网络的上尿路泌尿感染CT影像评估方法。对2023年12月至2024年4月复旦大学附属闵行医院收治的上尿路感染患者CT平扫数据进行回顾性分析,构建数据集,展开深度学习训练。该文提出一种基于双尺度特征交互的模型(Dual-Scale Feature Interaction Network, DFI-Net)。该模型在ResNet模型的基础上,融合了视觉Transformer结构的优势,引入特征交互机制,可以有效提高模型的特征提取和识别能力,同时以准确率、精确度、特异度等作为模型性能的评价指标,与已有的分类模型ResNet50、EfficientNet-B0、ConvNext-T、Swin-T及Vision Transformer进行了对比。此外,设计消融实验以验证特征交互模块的有效性。ResNet50、EfficientNet-B0、ConvNext-T、Vision Transformer和Swin-T的准确率分别为79.955%、78.842%、83.206%、78.485%和83.195%。DFI-Net的准确率达到85.582%,且特异度和灵敏度达到较好的平衡,分别为88.261%和85.093%。该模型能够有效增强对上尿路泌尿感染CT影像的识别能力。
MDSD-YOLO:一种复杂道路场景目标检测方法
赵龙阳;李天豪;张会兵;刘琦;孟瑞敏;复杂道路场景下的目标检测由于检测目标形状不规则、远处目标精度低和推理速度慢,导致现有模型性能严重不足。针对此问题,该文提出一种基于YOLOv8改进的算法MDSD-YOLO。在Head部分,设计了MLCA注意力和DCNv4融合改进的MD-C2f模块,适应不规则目标并增强小目标检测精度。在检测头后引入SEAM注意力模块,优化目标相互遮挡时的检测精度。在主干网络中设计了基于DualConv轻量化卷积的D-C2f模块,在提高精度的同时降低了模型的参数量,显著增强了模型的实时性。实验结果显示,改进后的模型在SODA10M和KITTI数据集上表现优异,mAP50分别达到67.0%和94.4%,比YOLOv8n基准模型提升8.7百分点和5.3百分点;mAP50:95分别达到44.8%和70.5%,比基准模型高出5.5百分点和4.2百分点。实验表明该模型推理速度快、检测精度高,在复杂道路场景中的目标检测具备有效性和优越性。
融合转置注意力的自监督单目深度估计方法
孙琦;胡建华;胡立华;姚晓玲;王欣波;针对结构复杂,重复纹理丰富的对象,现有单目深度估计方法获得的深度图在重复纹理处存在“缺口”、局部细节模糊等问题。在Monodepth2的基础上,该文提出一种基于转置注意力和局部细节增强的自监督深度估计方法。首先,在编码器部分加入转置注意力,计算特征图通道间的长距离依赖关系,进一步提取重复纹理区域的全局信息,有效解决了重复纹理区域的“缺口”问题。其次,在解码器引入局部细节增强模块,通过融合不同尺度特征,缓解了深度图局部细节模糊的问题。最后,以古建筑数据集为对象,实验结果表明相较于基线网络,该算法在δ<1.25阈值精度提升了15.2%,平均相对误差、平方相对误差分别提升了4.4%、1.1%,均方根误差、对数均方根误差分别提升了3.7%、6%。可视化结果表明,该网络模型生成的深度图不仅在古建筑椽结构等重复纹理处具有完整性,在雀替等精美局部结构也有细节保持能力。
多尺度感知的单文本条件图像风格迁移
贵向泉;李琪;李立;张继续;张斌轩;针对现有图像风格迁移方法生成图像质量不均匀、风格化效果不平衡等问题,提出一种基于CLIP的多尺度感知单文本条件融合的图像风格迁移模型—CLIP-TextFusion。该模型充分利用CLIP的文本—图像对齐能力,无需依赖目标风格图像,仅通过文本描述即可生成与目标风格匹配的图像。模型设计了特征提取与增强网络FENet,结合编码器、多尺度感知解码器以及通道注意力和空间注意力机制,动态调整特征权重和多尺度特征融合,实现内容图像细节的高效保留与风格纹理的精准传递。为进一步优化风格迁移效果,模型引入定向CLIP损失、多尺度感知损失、风格特征提取损失及对抗性损失,分别约束生成图像与文本描述的全局风格一致性、局部细节匹配度以及视觉真实性。实验结果表明,CLIP-TextFusion生成的图像风格鲜明、纹理细腻,在视觉效果和风格一致性上优于现有方法,能够广泛应用于艺术创作和个性化图像生成等领域。
基于快速傅里叶卷积和掩码注意力的图像修复算法
张钊源;曾志高;谢峥嵘;张建明;随着深度神经网络的迅速发展,图像修复技术取得了重要突破,在诸多领域得到了广泛应用。通常的图像修复方法采取不断增加网络层数或利用膨胀卷积来达到扩大感受野的目的,这可能会导致网络训练困难、参数量和计算量增加、修复结果容易产生伪影等问题。因此,设计了一种基于快速傅里叶卷积模块和空间掩码注意力机制的图像修复算法,包括图像修复主分支和滤波器预测辅助分支。首先,设计了一种快速傅里叶卷积模块将图像转换到频域进行处理,这使得图像中的噪声和纹理细节更加显著。其次,在空域上对图像进行处理,将破损图像的上下文信息和经编码器处理后的特征进行结合,再采用可学习的空间信息传播操作依次在两个不同空间维度上提取特征,提出了一个空间掩码注意力模块。另外,构建了一个轻量的滤波器预测网络,得到的两个滤波器用于图像修复主分支,对提取的特征和修复结果进行逐像素滤波,强化了边缘细节并进一步去除了噪声。最后,在CelebA、Paris Street View以及Places2三个公开数据集上与目前先进的修复方法进行了比较,实验结果表明,该方法能够取得更好的性能和视觉效果。
融合CNN与GAT的储层物性参数预测方法
张可佳;华浩南;刘宗堡;刘涛;张岩;储层物性参数的预测对于油气开发具有重要意义,而现有的储层物性参数预测方法在应对复杂地质条件时可能存在误差和不确定性。因此,该文提出了一种基于测井曲线与邻井数据的联合预测方法,选取松辽盆地北部凹陷区块某油田井组作为样本,采用卷积神经网络和图注意力网络相结合的模型(CNN-GAT)预测致密砂岩储层的孔隙度和渗透率。模型首先利用CNN对测井曲线进行局部与全局特征提取,捕捉储层随深度变化的特征趋势;随后,GAT通过构建邻井关系图,对邻井储层特性进行注意力加权融合,增强井间数据关联性,提高预测稳定性。结果表明,该方法在复杂地质环境下表现优越,能够充分利用测井曲线和邻井数据优势,有效降低储层物性参数预测的不确定性。
基于双层无人机辅助的车联网任务调度优化方法
陈学锋;王众;林婷;车联网与低空经济无人机(Unmanned Aerial Vehicles, UAV)的结合助推了边缘计算的飞速发展,但同时也为边缘网络带来大规模计算负荷。现有基于无人机辅助的车联网任务调度优化方法由于仅采用单一分配模式的无人机进行辅助,导致难以实现边缘系统算力资源的充分利用和网络资源的均衡分配。针对该问题,该文提出一种基于双层无人机辅助的车联网任务调度优化方法。首先,基于多旋翼无人机和固定翼无人机的优势特点,建立基于双层无人机辅助的车联网任务调度优化模型,上层无人机实现分配决策和资源调度,下层无人机进行卸载计算和信息交互;然后,针对该模型的优化问题,提出一种改进自适应遗传算法,该算法通过动态调整变异交叉概率,能够实现高效收敛。实验结果表明,提出的优化方法能够有效提升系统的计算服务效率,从而实现动态灵活的资源调度和卸载决策。
