变压器作为电网核心设备,及时发现其内部故障对可靠供电至关重要。通过溶气色谱分析绝缘油分解后的特征气体是当前诊断变压器内部故障的主要途径,这种方式需要作业人员从变压器采集绝缘油样品送到色谱检测仪器,因此对色谱图的有效性提出了较高的要求。为了实现从油样采集到故障诊断的智能运维,该文提出基于人工智能的变压器绝缘油溶气色谱有效性自动评估模型,通过及时发现因设备或操作问题导致的基线漂移、峰形畸变、信号消失等无效或低质量图谱,从源头保障数据可靠性。其中,为了克服真实数据采集流程复杂的问题,提出了基于数学方法的异常数据生成模型,并用所生成的数据训练了基于神经网络的检测模型。实验结果表明,该模型在色谱图质量识别方面表现优异,为变压器状态智能评估与运维决策提供了高效可靠的技术支撑。
情感本身具有很强的主观性和多样性,不同人对同一文本可能产生不同的情感理解。情感的主观性和多样性给情感挖掘带来了很大挑战,使得模型难以准确地判断文本中的隐含情感。情感的复杂性使得情感挖掘模型需要具备更强的语义理解和上下文建模能力,才能准确地捕捉到隐含情感的变化。该文利用多模态特征提取技术,采用BERT-DPCNN对文本的情感进行特征提取;采用倒谱系数对语音进行特征提取,并引入时序卷积网络增强时序建模能力,并增加动态差分参数的提取,以捕捉语音的动态变化。在多头注意力机制中建立跨模态情感特征对齐机制,动态对齐文本和语音的时序关系,最后借助多头注意力机制将两者进行融合。在CMU-MOSI和CMU-MOSEI数据集上的实验结果显示,相较于拼接等传统的多模态特征融合的方法,该方法在准确率和F1得分上均有明显的提升,并设计了消融实验,进一步证明了文本和语音情感特征融合的重要作用。
手势识别技术作为人机交互领域的重要研究方向,近年来得到了广泛关注。然而,现有的基于深度学习的手势识别模型大多侧重于提取局部特征,这种局限性导致了大量单一功能模型的涌现。这些模型虽然在特定任务中表现出色,但在面对现实场景中的复杂性和不确定性时,往往缺乏足够的通用性和适应性。为解决这一问题,该文创新性地借鉴了大模型中的混合专家模型(Mixture of Experts, MoE)架构,将多个手势识别模型进行有效集成,并根据具体任务动态分配相应的识别专家。在此架构下,该文融合了卷积神经网络(Convolutional Neural Network, CNN)、循环神经网络变体(Gated Recurrent Unit, GRU)和残差网络(Residual Network, ResNet)模型,分别用于提取手势的空间特征、上下文特征及处理大样本量特征。通过在标准手势识别数据集上的实验验证,结果表明:首先,尽管涉及多个模型,该方法仍能成功收敛;其次,在手势识别准确率方面,该方法显著优于现有技术;最后,通过消融实验进一步揭示了各专家模型在手势识别过程中的独特贡献和重要性。
针对智能反射面(Intelligent Reflecting Surface, IRS)辅助的含窃听者的认知物联网(Cognitive Internet of Things, C-IoT)通信系统,提出了一种基于联合波束成型的保密率优化方案。在系统模型中,考虑了一个由发射机、主用户、次用户、窃听者和智能反射面组成的多输入单输出通信场景。基于该模型,构建保密率优化问题,即在发射机总功率约束、主用户端干扰功率约束以及智能反射面单位模约束的条件下,通过联合优化主被动波束成型,最大化系统的保密率(Secrecy Rate, SR)。在实现过程中,由于公式化的问题非凸,因此使用交替优化的方法将原始问题分解为两个子问题进行优化,即发射机波束成型矩阵的优化以及IRS相移矩阵优化。针对发射机波束成型的矩阵优化,使用半定松弛法与逐次凸逼近法。接着,使用丁克尔巴赫法与逐次凸逼近的方法对IRS的相移矩阵进行优化。仿真结果表明,在含有窃听者的多输入单输出系统中,引入智能反射面实现主被动波束成型的优化有效提高了系统的保密率。
自动化物流系统的高效运行依赖于精准的建模与仿真,而离散事件仿真(DES)是其核心建模方法。针对现有仿真工具在应对自动化物流系统动态性与不确定性方面的不足,该文提出一种离散事件仿真引擎的实现方法,可实现事前仿真、事中残留任务加载继续推进的事中仿真以及事后仿真验证等功能。首先分析了自动化物流离散事件仿真实现技术,包括将任务分配、物料流转等过程事件化处理,遵循时间流统筹管理方法推进事件。接着介绍系统架构,涵盖数据层、逻辑控制层、访问层和应用层,以及主要系统类设计、自动化物流场景建模与恢复、运行机制和接口设计。重点阐述离散事件引擎设计,包括事件系统设计、驱动机制、时间流推进管理、设备仿真参数更新、任务执行路径分解控制、事中仿真处理及AGV仿真子系统实现。最后通过某酒类企业生产车间的应用场景,将自研离散事件仿真与现有仿真软件进行对比分析,验证了该引擎在提升系统效率和仿真符合度上的有效性,仿真结果与实际运行对比符合度均在90%以上,研究为自动化物流仿真提供了新的解决方案。
高速服务区吞吐量预测是提升运行效率和服务满意度的重要手段,传统的吞吐量预测任务主要基于时间序列预测算法,利用同一观测点的历史信息,通过统计或深度学习等方法预测未来数据。但在真实场景中,高速服务区流量存在空间关联效应和突发性变化效应等,而序列预测模型既忽略了相关服务区之间的影响,也无法适应流量突变的情况。为此,该文提出一种融合重力模型再分配的序列预测算法(Gravity Model Redistribution, GMAAN),GMAAN可在现有时间序列预测方法的基础上,使用重力模型将高速道路上的车流量在服务区之间进行再次分配。在参数设定上,通过元学习快速定位系数,有效解决了传统试算法和最小二乘法的效率问题。在浙江省高速服务区吞吐量的真实数据集上进行对比,结果表明模型效果优于现有时间序列预测模型,在MAPE指标上降低了5百分点以上。
点云补全是从部分形状中补全完整的三维形状。已有多模态点云补全方法的模态融合过程都是以点云模态为主,缺乏对图像模态的充分利用。为了最大化利用图像提供的几何信息,生成具有足够几何细节的三维点云,该文提出了一种图像引导的双通道跨模态点云补全网络IgDccmNet。首先,通过编码器对不完整点云和完整点云的图像分别进行特征提取。其中,点云路径采用PointNet作为点云特征提取的骨干网络,图像路径采用ResNet18作为图像编码器。然后,为了实现点云与图像特征的深度交互学习,提出了双通道跨模态融合模块。通过自注意力机制强化各模态内部的特征关联性,通过交叉注意力机制建立跨模态间的语义关联,使图像和点云两种模态的特征能够在互补性信息指导下有效融合。最后,设计基于风格的点云解码器对全局特征解码生成预测点云,并与输入的不完整点云进行拼接,采用最远点采样得到完整点云。在ShapeNet-ViPC数据集上的实验结果表明,该方法相比其他主流方法,倒角距离降低21%~66%,F分数增加4%~78%。
视频异常检测是计算机视觉领域的关键任务之一。传统的视频异常检测方法存在着在复杂场景下易受背景噪声干扰、难以有效捕捉局部细节,且易因过拟合训练数据而导致模型泛化能力差、鲁棒性不足的问题。针对这些挑战,该文提出了一种融合DropBlock与注意力机制的视频异常检测算法。该算法基于U-Net架构,在瓶颈层和跳跃连接中分别引入了SE模块(Squeeze-and-Excitation Module)和空间注意力模块(Spatial Attention Module),SE模块通过通道注意力机制增强重要通道的特征表示,而空间注意力模块则通过动态调整空间权重,提升对关键区域的关注。在SE模块后融合了Transformer,增强模型对视频时空特征的建模能力。同时,通过在卷积层中引入DropBlock,有效缓解了卷积网络的过拟合问题,增强了模型的泛化能力。实验结果表明,该方法在UCSD-Ped2、CUHK Avenue和ShanghaiTech公开数据集上的AUC指标分别达到96.9%、86.2%和73.1%,验证了其有效性。
针对签名密钥尺寸过长、基于SIS(Short Integer Solution)身份签名运算复杂度较高、安全性不足的问题,提出了一种基于环上小整数解问题的身份签名方案。首先,利用环上陷门生成算法生成公钥矩阵和陷门矩阵,通过哈希函数将用户身份映射至环元素,并生成短向量私钥。其次,执行双峰高斯采样掩码,再结合消息与承诺值生成挑战,计算响应并进行低位截断压缩,最终输出短签名。最后,验证阶段通过恢复近似响应并检查多项式环运算关系与范数界限,完成签名合法性判定。通过理论分析证明了方案在随机预言机模型下的正确性与强不可伪造性,通过分叉引理,将可能的伪造攻击转化为R-SIS(Ring Short Integer Solution)问题的解,从而论证在多项式时间内无法被有效攻击。实验显示签名生成平均耗时15.8 ms,签名验证时间平均值为10.7 ms,表明方案具有良好的稳定性和高效性。且在时间与存储开销方面,相较于其他方案具备显著优势。
针对小样本目标检测中实测数据稀缺导致模型泛化能力不足的问题,该文提出一种基于多尺度特征对齐的小样本目标检测方法。首先,通过LaMa算法进行仿真数据增强,以生成高真实度的仿真数据,扩充训练样本;其次,设计显著性特征提取模块,通过分层嵌入坐标注意力机制,增强目标区域特征响应,并抑制复杂背景噪声;最后,构建多尺度特征对齐模块,针对底层纹理、中层结构及高层语义特征进行层次化对齐处理,同时设计多尺度特征对齐损失函数,从而实现跨域特征分布的一致性约束。实验结果表明,该方法相较于基准算法,准确率提高了20百分点,召回率提高了2.8百分点,mAP@0.5提高了13.5百分点。与YOLOv8、YOLOv11、SSD和Faster R-CNN目标检测算法相比,该方法的mAP@0.5分别提升了12.1百分点、8.1百分点、35百分点、30.6百分点。结果充分验证了该方法的有效性与鲁棒性,为小样本目标检测任务提供了一种有效的解决方案。