- 彭耿;刘宁钟;
随着食物检索、食物推荐和食物监测等应用需求的增加,食物的自动分析成为了研究的热点。由于食物种类多,存在类间差异小、类内差异大、多尺度等特点,食物识别和定位的准确率一直不高。并且目前很多研究,在食物分析任务中,推理速度慢,性能不佳。针对这些问题,结合注意力机制,提出了一个更优的主干网络,能更好地提取食物细粒度特征。同时对Neck部分进行研究,进行多尺度特征融合,提出了一种轻量级的端到端食物识别和定位框架FFAM(Feature Fusion of Attention Mechanism)。在目前具有挑战性的公开数据集UNIMIB2016上的实验结果表明,该算法比目前的很多方法在精度上更具有优势,最终mAP达到了94.1%。由于得到的模型相比YOLOv4精度高且更小,在应对移动端、嵌入式设备中部署食物分析模型解决实际任务时,能有一个更好的性能表现。
2022年11期 v.32;No.307 121-126页 [查看摘要][在线阅读][下载 1096K] - 朱辰阳;赵春晓;
个人快速交通(PRT)是一种新型的公共交通工具。由于此系统中的车辆仅在乘客需要时移动,因此这种特殊的按需特性会造成运输能力的高度浪费。个人快速交通系统优化的目标是制定一个力求为所有行程请求提供服务的任务分配策略,在满足每辆车的电池容量的前提下,找到里程利用率和乘客等待时间之间的最佳权衡。首先基于NetLogo平台建立了以里程利用率和乘客等待时间为优化目标的PRT系统多智能体模型,提出了一种基于淘汰机制的粒子群算法(EBPSO)求解系统中的动态任务分配问题。所提算法在不损失里程利用率的前提下,相比标准粒子群算法使平均等待时间和最长平均等待时间分别降低了47.95%和41.31%;相比仅改进适应度函数的粒子群算法使平均等待时间和最长平均等待时间分别降低了11.17%和14.85%。仿真结果表明,该算法在解决PRT车辆动态任务分配问题上与标准粒子群算法相比使系统效能大大提高。
2022年11期 v.32;No.307 127-133页 [查看摘要][在线阅读][下载 1241K] - 张利红;蔡敬菊;
针对现有的深度目标检测算法结构复杂、计算量过大,难以直接部署到资源有限的边缘设备进行实时检测应用的问题,以Yolov5算法为基础,针对VOC公开数据集在GPU上进行迭代训练,通过使用MobileNetv2替换Backbone特征提取层中的BottleneckCSP结构、Conv替换Focus模块达到网络轻量化,并结合稀疏训练评价特征提取层中卷积核的重要性后进行减枝的方法进一步实现模型压缩。从模型适应平台硬件加速角度出发,根据瑞芯微Rk3399pro加速芯片MAC单元为3的倍数,提出将网络卷积通道数剪枝后约束为9的倍数,并引入了非对称8位模型量化、CPU-GPU-NPU多核协同工作的策略在嵌入式平台上进行C++算法部署。实验证明,轻量化的Yolov5算法在检测精确度mAP下降6.74的情况下,大幅减少了计算参数量,离线模型部署至Rk3399pro嵌入式平台上理论检测速度达到50 fps/s,相较原Yolov5s未优化改进的部署至平台上的速度提升近1.7倍;满足降低模型参数权重后仍能实时精确检测的效果。
2022年11期 v.32;No.307 134-139页 [查看摘要][在线阅读][下载 1201K] - 黄卫东;程小香;
舆情参与主体是舆情事件的参与者,分析其情感强度可以准确把握舆情发展走势,为舆情相关部门的决策提供支持。利用微博社交媒体平台获取实验所需的热点话题的舆情数据,基于Word2vec计算目标文本中关键词相似度并提取关键性特征。将目标文本转化成向量形式嵌入到深度学习模型的输入层,同时将注意力机制引入深度学习算法构建Bilstm+Attention情感倾向分类模型,对舆情参与主体发布在微博平台上文本的情感倾向进行正负面的划分。为了进一步分析参与主体的情感强度以及与实际舆情走势之间的关系,基于目标语料构建情感副词词典,将情感强度进行划分,并与实际舆情走势进行对比分析。实验结果表明,对比TextCNN、CNN+Bilstm以及Bilstm等深度学习分类模型,Bilstm+Attention情感分类模型准确率更高,Bilstm+Attention+情感副词词典计算出的情感强度与实际舆情走势基本趋于一致,证明了该模型可以有效预测舆情参与主体的情感强度。
2022年11期 v.32;No.307 140-145页 [查看摘要][在线阅读][下载 1483K] - 周娴玮;赖坚;陈玮涛;阮乐;李振丰;余松森;
动作质量评估是视频分析中一个重要且具有挑战性的问题,动作质量评估是指对特定动作(如跳水、体操等)的完成质量进行评分,分数评估模型是通过将视频特征回归到该领域专家提供的真实分数来进行学习。现有的大多数方法是直接使用动作识别任务的模型如(C3D和I3D)来解决问题。为了增强网络模型的特征提取效果,从而提高分数回归的准确性,该文提出了一种基于残差结构的动作质量评估网络模型RFC-Net。该网络由特征提取器和特征聚合器组成,在特征提取器中使用I3D网络对视频特征进行提取,在特征聚合器中对特征提取器最后一层卷积得到的视频特征分别进行平均的全局池化和残差卷积操作,对得到的结果进行特征融合,最后输出视频的分数表示。在动作质量评估领域公开的MTL-AQA数据集上,该方法取得的斯皮尔曼相关性系数为0.946 3。为进一步验证模型在不同背景下、动作差异较大时的泛化能力,制作了羽毛球运动视频数据集,并在此基础上进行了不同模型之间的对比实验。
2022年11期 v.32;No.307 146-153+163页 [查看摘要][在线阅读][下载 1410K] - 褚轲欣;荀亚玲;
层次聚类分析在数据挖掘与机器学习等领域是一种广泛使用的无监督学习技术,但是,由于层次聚类分析算法主要是依赖于人为设定的相似度阈值来实现聚类簇的合并或分裂,因此在没有任何先验知识时,难以设定相似度阈值。采用相似度均值以及边界数据对象分配策略,提出了一种基于相似度均值的分类数据层次聚类分析算法。该算法利用相似度均值刻画数据集中数据对象分布的集中趋势以及平稳相似性度量,作为层次聚类簇合并或分裂的重要依据,给出了一种相似度均值的计算公式,从而可以自动确定相似度阈值,解决了层次聚类分析中相似度阈值参数的人为设定问题;利用相似度均值,给出了一种边界数据对象的分配策略,有效提高了边界数据对象分配的准确性及聚类质量。在UCI与人工合成数据集上的实验验证了该算法具有良好的聚类性能和抗噪性,以及相似度均值的稳定性和有效性。
2022年11期 v.32;No.307 154-163页 [查看摘要][在线阅读][下载 1192K] - 陶慧丹;段亮;王笳辉;岳昆;
民间文学文本中含有大量生动形象的修辞手法;人名、地名极其复杂,难以判断词与词之间的边界;与现代汉语表达差别较大,预训练语言模型难以有效地学习其隐含知识,为机器自然语言理解带来困难。该文提出一种基于BERT的民间文学文本预训练模型MythBERT,使用民间文学语料库预训练,将BERT的字隐蔽策略改进为对中文词语隐蔽策略。对民间文学文本中解释字、词的注释词语重点隐蔽,减小BERT隐蔽的随机性并有利于学习词语语义信息。同时利用注释增强语言模型表示,解决一词多义、古今异义等问题。将MythBERT与BERT、BERT-WWM和RoBERTa等主流中文预训练模型在情感分析、语义相似度、命名实体识别和问答四个自然语言处理任务上进行比较。实验结果表明,注释增强的民间文学预训练模型MythBERT在民间文学文本任务上性能显著提升,与基线方法相比取得了最优的效果。
2022年11期 v.32;No.307 164-170页 [查看摘要][在线阅读][下载 1165K] - 郑思露;程春玲;毛毅;
人机对话意图识别旨在通过人机之间简短的对话识别出用户意图,通过对话文本的分类进而实现意图的识别。针对人机对话中因篇幅短导致语境匮乏和因对话随意性导致意图模糊的问题,提出了一种融合实体信息和时序特征的人机对话意图识别模型。在文本表示阶段,通过捕捉对话中实体信息来增强文本语义表达,并利用双向注意力机制动态生成符合语境的文本表示;并利用双向GRU提取对话上下文的时序特征来获取上下文意图之间的关系;通过级联多层gMLP,利用其内部空间控制单元自适应融合实体信息和时序特征,从而提升意图识别的准确率。为验证所提模型在多种任务上的效果,在不同意图识别任务数据集CCKS2018和SMP2018上进行实验,分别取得了90.6%和93.7%的准确率,对比CLSTM、DBN、Attention-RNN等具有代表性的模型,均有3%以上性能的提升。
2022年11期 v.32;No.307 171-176页 [查看摘要][在线阅读][下载 1167K] - 王建军;李婉晴;张敏;
在电影心脏核磁共振(CMR)图像上准确分割左心室、右心室和心肌是心脏功能评估和诊断的重要步骤。然而,大多数带标注的CMR图像数据量较少,无法满足训练需求,同时CMR图像中心脏结构复杂,心室及心肌边界不清晰,导致分割效果欠佳。因此,该文提出了一种基于迁移学习和多尺度空洞U-Net网络的CMR图像分割方法,使用迁移学习,将预训练模型得到的网络参数迁移到目标模型上作为目标模型的初始化参数,提高网络的特征学习能力,解决CMR图像数据量不足的问题;在U-Net网络中引入多尺度空洞卷积模块,使用空洞卷积代替普通卷积在参数不变的情况下扩大了感受野,并且采用多尺度特征融合提取更加精细的特征,解决CMR图像边界曲线欠分割的问题。实验结果表明,该方法能有效实现心脏中左心室、右心室和心肌的准确分割,平均Dice系数和Hausdorff距离平均值分别为0.902和4.219 mm,对比其他网络分割模型明显提高了分割精度。
2022年11期 v.32;No.307 177-182页 [查看摘要][在线阅读][下载 1133K] - 李飞;陈瑞;童莹;陈乐;
端到端的CNN-LSTM模型利用卷积神经网络(Convolutional Neural Network, CNN)提取图像的空间特征,利用长短期记忆网络LSTM提取视频帧间的时间特征,在视频表情识别中得到了广泛的应用。但在学习视频帧的分层表示时,CNN-LSTM模型复杂度较高,且易发生过拟合。针对这些问题,提出一个高效、低复杂度的视频表情识别模型ECNN-SA (Enhanced Convolutional Neural Network with Self-Attention)。首先,将视频分成若干视频段,采用带增强特征分支的卷积神经网络和全局平均池化层提取视频段中每帧图像的特征向量。其次,利用自注意力(Self-Attention)机制获得特征向量间的相关性,根据相关性构建权值向量,主要关注视频段中的表情变化关键帧,引导分类器给出更准确的分类结果。最终,该模型在CK+和AFEW数据集上的实验结果表明,自注意力模块使得模型主要关注时间序列中表情变化的关键帧,相比于单层和多层的LSTM网络,ECNN-SA模型能更有效地对视频序列的情感信息进行分类识别。
2022年11期 v.32;No.307 183-189页 [查看摘要][在线阅读][下载 1259K]
- 王超;倪静;
随着社交平台的兴起,谣言会在短时间内快速扩散,对社会造成负面影响,因此研究谣言传播过程中的影响因素迫在眉睫,这对政府把控和引导突发事件的舆论起着关键性作用。而目前考虑心理因素对谣言传播过程影响的研究较少,因此该模型在经典传染病模型SEIR模型的基础上,将总人群分为四类:易感状态节点、潜伏状态节点、感染状态节点和免疫状态节点。考虑好奇心心理、从众心理、信息干扰率和个体免疫率四种因素,构建融入心理因素的改进SEIR谣言传播模型。首先,利用微分动力学方法和下一代矩阵理论计算了该模型的平衡点,分析并证明了平衡点的局部渐近稳定性。接着使用MATLAB对模型在自建网络和真实网络中进行仿真实验,数值仿真结果表明:好奇心越强烈,由易感状态节点转变为潜伏状态节点的速度越快,潜伏状态节点的峰值越大;从众心理越强烈,由潜伏状态节点转变为感染状态节点的速度越快,感染状态节点的峰值也越大。适当提高个体免疫率和信息干扰率可以缩短谣言传播时间,降低谣言传播总量。
2022年11期 v.32;No.307 190-197+203页 [查看摘要][在线阅读][下载 1327K] - 庞梦吟;王海宁;万通明;马苗;
公共卫生安全事件常常是牵动着一个地区、一个国家,乃至整个世界的重大问题。2019年底爆发的新型冠状病毒(Corona Virus Disease 2019,COVID-19)疫情迅速席卷了很多国家,及时了解疫情确诊人数变化,对协助挖掘肺炎疫情的传播模式和特征规律十分重要。针对此问题,提出了一种组合预测模型来预测此次新型冠状病毒肺炎累计确诊人数数量。首先从国家卫生健康委员会等权威机构所发布的数据中获取历史累计确诊人数,然后再以Logistic模型和长短期记忆深度学习网络模型(Long Short-Term Memory, LSTM)的预测结果为基础,选取一定时间段的累计确诊人数序列来训练线性组合参数,得到最终的组合预测模型,最后通过RMSE等预测性能评价指标对比所提模型和Logistic、LSTM和SEIR等三种模型的预测性能。实验结果表明,所提模型的RMSE值为10.101 7,MAE值为7.633 6,MAPE值为0.008 3%,其准确性和拟合效果均优于其他模型,能够为后续的疫情预测和防控工作提供技术支撑。
2022年11期 v.32;No.307 198-203页 [查看摘要][在线阅读][下载 1120K] - 王诚;唐振坤;
近年来国内通信行业发展十分迅速,运营商通信网络的规模也随之壮大。在运营商通信网络中,数据中心机房是不可或缺的重要枢纽,承担着巨大的通信压力,数据中心机房的配电系统故障率和安全事故的风险也在不断提高,同时也导致机房运维难度和运维成本与日俱增。在现代电力系统中电力大数据的格局下,对高维海量数据进行深度挖掘,进而预测可能存在的告警,从而做到防患于未然,是一个值得研究的问题。针对电力大数据环境下高精度和实时性的负载预测展开了研究,提出了基于随机森林算法的负载预警,并基于Spark平台实现其并行化。结合某区域实际电力数据设计试验,进行模型训练和回归预测,通过试验证明,对同等的数据集,并行随机森林算法预测精度高于单机负载预测,为负载预测提供了一种新思路。
2022年11期 v.32;No.307 204-207+220页 [查看摘要][在线阅读][下载 1069K] - 杨丽琴;康国胜;
对临床实践指南(Clinical Practice Guideline, CPG)中的诊疗过程进行数字化建模并使其被工作流引擎解释执行,可为医生提供针对性的临床建议,为指南的有效实施提供技术保障。由于诊疗过程的复杂业务规则和非结构化等特点,采用传统业务过程建模方法会导致模型难以理解、失去使用价值。而对于一些复杂而频繁的诊疗行为尚无可参考的有效建模方案。为此,该文从四种不同的CPG诊疗过程中提取出五个诊疗模式,并给出形式化定义和基于BPMN(Business Process Model and Notation)、DMN(Decision Management Notation)和CMMN(Case Management Model and Notation)的通用建模方法。诊疗模式的提出可为诊疗过程片段建模提供指导性建议和可复用的模板。在此基础上,对开源建模工具Camunda Modeler进行扩展,实现了支持诊疗模式的建模工具。通过配置诊疗模式,可快速得到诊疗过程片段模型,从而提高建模效率。通过对真实的CPG诊疗过程的建模和覆盖率分析验证了诊疗模式的可用性。
2022年11期 v.32;No.307 208-213页 [查看摘要][在线阅读][下载 1383K] - 陈清秋;朱琦;
随着智能交通系统的发展,移动车辆不仅需要地图信息,还需要更多娱乐内容,而整个网络的容量是有限的,这给车载自组织网络带来很大的压力。边缘缓存是在系统的边缘部署缓存,在车载自组织网络中引入边缘缓存技术,可以有效地缓解网络的压力。对车载自组织网络中的缓存策略进行了研究,提出了一种基于车辆分簇的协作边缘缓存策略,可以充分利用车载自组织网络中有限的缓存资源,内容可以缓存在移动车辆和路边单元中,移动车辆可以从簇头和路边单元获取所需内容,不同的内容获取方式会带来不同的请求时延。由于移动车辆和路边单元的缓存容量是有限的,为了降低内容请求时延和成本,构建了一个时延和成本联合最小化的优化问题,并采用蚁群算法对该问题进行求解,以得到最优的缓存放置方案。仿真结果表明,该算法拥有很好的性能。
2022年11期 v.32;No.307 214-220页 [查看摘要][在线阅读][下载 1308K] 下载本期数据