期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张云佐郑婷婷蔡昭权《合肥工业大学学报(自然科学版)》2022,(11):1478-1483

视频浓缩是高效表达监控视频的重要方式,提取目标管是视频浓缩的基本步骤。现有的视频浓缩大多基于目标检测和跟踪生成目标管,应用于包含拥挤场景的监控视频时,性能表现不佳。文章提出一种稀疏-拥挤视频的浓缩框架(sparse-crowed video synopsis, SCVS),将输入视频分为稀疏和拥挤片段分别处理。首先提出一种基于多层时空切片联合的稀疏和拥挤片段划分方法,以二分思想为基础联合多层时空切片分割稀疏和拥挤片段;其次对分割后的稀疏片段提取目标管,进行管优化重排得到稀疏场景的浓缩视频;最后融合稀疏浓缩视频和拥挤片段生成浓缩视频。实验结果表明,SCVS框架有效避免了现有方法在拥挤场景下性能不佳的问题,具有较高的压缩比和目标留存比以及良好的视觉体验。相似文献

2.

融合深度学习和视觉文本的视频描述方法

付燕马钰叶鸥《科学技术与工程》2021,21(14):5855-5861

为解决当前视频描述任务中,生成描述视频的文本整体质量不高的问题,提出一种融合深度网络和视觉文本的视频描述模型.首先在编码阶段,将注意力机制引入3D残差模块,通过一维通道注意力与二维空间注意力增强视频特征映射,降低无关目标与噪声的影响;其次,解码阶段利用双层长短期记忆(long short-term memory,LSTM)深度网络的时序性特征,输出表述视频高层语义的文本描述;最后,为有效利用视觉文本信息丰富视频生成的语义描述,利用基于神经网络的主题模型提取出视频中的主题作为视觉文本融合进模型中.实验结果表明,本文方法在不同性能指标方面具有较好的准确性,能够更加准确地利用自然语言描述视频高层语义信息. 相似文献

3.

多注意力结合光流的视频超分辨方法

储岳中乔雨楠《重庆工商大学学报(自然科学版)》2022,39(4):1-8

针对现如今监控摄像、卫星遥感以及视频娱乐等领域对视频图像的清晰度要求越来越高,而目前大部分视频超分辨方法存在参数量大、恢复的视频存在抖动等问题,提出了一种多注意力结合光流的视频超分辨方法,通过引入多个注意力包括空间注意力、通道注意力以及自注意力来提升超分辨性能。具体而言,作为一种特征加权的增强方法,这些注意力可以捕获视频帧的时空特征并增强自适应性和通道间的依赖性,实现全局学习的功能;同时,提出双阶段特征对齐思路,首先利用光流对视频进行估计,进行第一阶段的特征对齐,然后引入长短是记忆网络结构增强位置和通道的特征融合,进行第二阶段的特征对齐,以防止恢复的视频帧出现抖动。实验结果表明:该方法在评估标准和可视化效果方面都取得了令人满意的效果。相似文献

4.

结合注意力机制与时空特征融合的长时程行为识别方法

孙宁郝一嘉宦睿智刘佶鑫韩光《合肥工业大学学报(自然科学版)》2021,44(8):1051-1058,1145

为了建立基于视频行为识别的长时程图像序列的时空信息模型,文章提出了一种嵌入注意力的时空特征融合网络(attention-embedded spatial-temporal feature fusion network,ASTFFN)的深度神经网络模型.AST FFN将一个包含动作的长时程图像序列分割成多个重叠的片段,并... 相似文献

5.

融合多路注意力机制的语句匹配模型

王进刘麒麟马樱仪孙开伟胡珂《重庆邮电大学学报(自然科学版)》2023,35(3):520-527

为了增强语句内关键信息和语句间交互信息的表征能力,有效整合匹配特征,提出一种融合多路注意力机制的语句匹配模型。采用双向长短时记忆网络获取文本的编码信息,通过自注意力机制学习语句内部的关键信息;将编码信息和自注意力信息拼接之后,通过多路注意力机制学习语句间的交互信息;结合并压缩多路注意力层之前和之后的信息,通过双向长短时记忆网络进行池化获得最终的语句特征,经过全连接层完成语句匹配。实验结果表明,该模型在SNLI和MultiNLI数据集上进行的自然语言推理任务、在Quora Question Pairs数据集上进行的释义识别任务和在SQuAD数据集上进行的问答语句选择任务中均表现出了更好效果,能够有效提升语句匹配的性能。相似文献

6.

融合注意力机制和新型卷积神经网络的市政道路病害识别

任泳洁吴立朋《科学技术与工程》2024,24(20):8663-8672

环境和荷载协同作用导致的路面病害对道路使用性能和安全性能的影响日益突出。现有图像智能识别算法难以实现处理速度和计算量的平衡。针对道路病害快速准确实时识别的需求,对石家庄损伤较为严重的路面进行实地拍照,结合已有图片,采用数据增强技术构建了市政道路病害数据集,并且提出了一种基于MobileNetV3网络的轻量化道路病害识别网络模型GEM-MobileNetV3。该模型首先使用Ghost模块代替MobileNetV3网络基本单元中的1×1卷积;然后结合改进后的高效通道注意力机制ECA模块提取病害目标的重要特征;最后将网络浅层的ReLU激活函数替换为泛化能力更强的Mish激活函数,提高模型的整体性能。通过消融实验与对比实验,验证了新模型的有效性。实验结果表明,新模型准确率达到96.33%,其参数量与计算量较MobileNetV3模型分别降低了37.9%和36%。提出的新模型在保持较高识别准确率的同时有效降低了模型复杂度,为在低成本计算平台上实现高准确率实时识别提供了新途径。相似文献

7.

基于通道注意力机制的视频超分辨率方法

陈雅玲朱永贵《中国传媒大学学报》2023,(5):55-62

基于视频帧间信息特征,提出了基于通道注意力机制的循环残差注意力网络,将连续的低分辨率视频帧、前一时刻输出帧和隐藏态作为输入进行特征提取,在隐藏态中引入残差连接和注意力机制,增强网络特征提取能力,经过亚像素卷积层重建出高分辨率视频帧。然后将本视频超分辨率网络模型在Vid4、UDM10、SPMCS视频数据集进行了测试。实验结果表明,与其他基于深度学习的视频超分辨率方法相比,本方法能利用帧间特征信息较好地恢复高频特征信息,恢复的视频图像PSNR和SSIM值都比其他主流方法要高,同时取得了较好的主观视觉效果。相似文献

8.

融合注意力机制下的弱监督目标检测

杨振文葛斌郑海君邬成《佳木斯大学学报》2023,(6):12-17

针对现有的弱监督目标检测算法由于缺乏实例级类别的注释,易出现局部定位的问题,提出一种基于空间-通道注意力机制与多实例优化回归网络相结合的弱监督目标检测算法。通过在特征提取网络中引入注意力模块,发掘出更为优质的初始伪真值标签,有效地提取了隐含的位置信息。在网络训练阶段引入自适应的策略挖掘出训练细化分支的有效监督,实现对卷积神经网络中实例分类器的优化,同时以端到端的方式进行模型的训练,避免网络过多地关注目标的显著区域而不是整个对象,从而使模型跳出局部最优,提升模型的检测性能。在PASCAL VOC 2007和VOC 2012大规模数据集上的实验结果表明,提出的算法拥有比近几年主流方法更好的检测性能,有效缓解了局部定位的问题。相似文献

9.

基于融合多注意力机制的深度学习的盾构荷载预测方法

陈城史培新王占生贾鹏蛟《东北大学学报(自然科学版)》2023,(11):1631-1637+1646

盾构荷载作为盾构的主要性能指标,准确的荷载预测对于保证盾构安全高效工作和周边环境稳定具有重要意义.鉴于传统预测方法精度差的局限性,本研究以数据的高维度特征和时序特征为切入点,提出一种结合卷积神经网络、双向长短期记忆神经网络和注意力机制的混合模型(CNN-BiLSTM-Multiattention, CBM),对盾构荷载进行精准预测.该模型不仅可以提取数据的高维度特征和时序特征,还能突出高维度特征的重要性和关键时间节点信息.通过实验证明了相较于4种现有的模型,本文所提出的模型在3种评价指标上均优于其他模型,对推力和扭矩预测的准确率达到94.2%和96.2%. 相似文献

10.

融合序列语法知识的卷积-自注意力生成式摘要方法

下载免费PDF全文

罗森林王睿怡吴倩潘丽敏吴舟婷《北京理工大学学报》2021,41(1):93-101

针对基于编码-解码的生成式摘要模型不能充分提取语法知识导致摘要出现不符合语法规则的问题，循环神经网络易遗忘历史信息且训练时无法并行计算导致处理长文本时生成的摘要主旨不显著以及编码速度慢的问题，提出了一种融合序列语法知识的卷积-自注意力生成式摘要方法.该方法对文本构建短语结构树，将语法知识序列化并嵌入到编码器中，使编码时能充分利用语法信息；使用卷积-自注意力模型替换循环神经网络进行编码，更好学习文本的全局和局部信息.在CNN/Daily Mail语料上进行实验，结果表明提出的方法优于当前先进方法，生成的摘要更符合语法规则、主旨更显著且模型的编码速度更快. 相似文献

11.

基于非降维注意力机制的滚动轴承故障诊断方法

刘闯郝润芳程永强闫文恒《太原理工大学学报》2022,(5):948-954

针对传统轴承故障诊断算法中存在的故障特征提取困难、模型泛化性差以及噪声环境下诊断准确率低等问题,提出一种可移植非降维注意力机制与深度残差神经网络相结合的故障诊断方法。该方法使用非降维注意力机制对残差块生成的特征图重新分配权重,对特征图采用局部而非全局的跨通道通信方式,自适应学习邻近通道的注意力分数,以增强故障轴承的特征识别率。使用凯斯西储大学轴承故障数据集对本文方法进行验证,实验表明,融合非降维注意力机制的残差网络可以准确识别出不同负载下混有噪声的故障轴承样本,在12 dB信噪比噪声情况下的准确率为99.5%,具有较强的抗噪性能和一定的泛化性能。相似文献

12.

基于注意力机制的双分支肺炎图像分类网络

张吉友张荣芬刘宇红《贵州大学学报(自然科学版)》2024,(1):94-102

目前许多肺炎图像分类网络大多采用单分支网络对输入图像进行特征提取,这在一定程度上忽略了图像不同维度的特征信息。为了优化这种问题,提出一种融入注意力机制的双分支肺炎图像分类网络,利用VGG16网络和加入可分离卷积以及融入卷积注意力模块(convolution block attention module, CBAM)的CNN卷积神经网络进行双分支特征提取,能够关注到肺炎图像不同层次的特征信息,将2种网络分支的特征进行不同维度的融合,最后输入全连接层进行分类判决。结果表明,该网络在正常肺部、病毒性肺炎、新型冠状病毒肺炎(COVID-19)X-ray图像组成的测试集上取得了95%的平均准确率。经过消融试验证明,该网络加入的可分离卷积模块、注意力模块和特征融合对减少网络参数、提高网络分类的准确率起到明显作用。与其他网络的性能对比也表明该网络在肺炎图像分类上表现出较高的准确率和较强的鲁棒性。相似文献

13.

注意力机制下轻量化网络视频行为识别方法

周骁卓徐代升罗力华李泽旭宋立建《厦门理工学院学报》2022,(5):54-63

为了解决视频行为识别中网络模型结构过于复杂且计算量大的问题,提出一种基于MobileNet+BiGRU结构的轻量化视频行为识别方法。通过嵌入注意力机制提取改进的MobileNet网络视频单帧画面空间特征,将多帧画面的空间特征叠加后送入BiGRU网络提取时序特征,并通过softmax分类器进行分类。对比实验表明,该方法在UCF-101和HMDB51数据集上的识别率分别达到81.4%和56.8%,相比未使用注意力机制的模型分别提升4.7%和6.2%,计算量仅相当于ResNet50+LSTM结构的7.7%,表明该方法比其他方法效率更高。相似文献

14.

基于多模注意力机制的密集型视频描述

杨昊韩翠玲王玉德高张弛《曲阜师范大学学报》2023,(2):62-70

为了解决密集型视频描述(dense video captioning, DVC)任务中视频特征利用不充分,视频定位分段不准确,语义描述效果不丰富的问题,采用多模注意力机制的密集型视频描述方法,提取视频中的视觉特征、音频特征和语音特征.通过多模注意力机制,在编码器中计算不同模态视频帧特征间的关联程度,在解码器中计算描述词序列特征与编码器输出的多模态视频帧特征间的关联程度,并将编码器、解码器输出特征分别作用于视频定位分段模型和语义描述模型获得视频分段和分段描述.提出的方法在ActivityNet Captions数据集上进行了理论分析和实验验证,其中F1-score达到60.09,METEOR指标达到8.78.该方法有效提高了视频定位分段和语义描述的准确性. 相似文献

15.

基于注意力机制的单视角三维重建

胡飞叶龙钟微张勤《中国传媒大学学报》2019,26(4)

相似文献

16.

基于注意力机制的红外小目标检测方法

董亚盼高陈强谌放刘芳岑《重庆邮电大学学报(自然科学版)》2023,35(2):219-226

针对红外小目标占用像素较少、背景相似性强、网络容易受到背景杂波信息干扰的问题,提出了一种基于注意力机制的红外小目标检测方法。利用注意力机制模块抑制背景杂波,增强小目标特征,并使用红外小目标检测模块实现检测任务;为了增强网络鲁棒性,通过高斯噪声与原图通道堆叠输入的数据增强方式提升网络抗杂波干扰的能力。实验表明,提出的方法在MDvsFA数据集中的性能超过了目前最新的对比算法。相似文献

17.

基于注意力和反馈机制的HDR视频重建

下载免费PDF全文

杨英杰王永芳张涵《上海大学学报(自然科学版)》2023,(1):56-67

对基于深度学习的高动态范围(high dynamic range,HDR)重建进行研究,提出一种基于注意力和反馈机制的HDR重建方法.首先,将时间上连续、循环曝光的3张图像作为网络的输入,通过引入注意力模块生成注意力图像,对获取的特征进行自适应的加权,以优化网络的特征提取和减少鬼影现象的出现;然后,将反馈机制引入到网络中,进一步提高特征信息的利用率,优化网络在特征融合和重建方面的性能;最后,在L1损失函数的基础上,考虑色彩相似度损失函数和VGG (Visual Geometry Group)损失函数以增强重建后HDR图像的色彩表现及高频细节.实验结果表明,本方法不仅可获得更好的主观和客观重建质量,而且优于目前存在的主流算法. 相似文献

18.

基于注意力机制BiLSTM的设备智能故障诊断方法

王太勇王廷虎王鹏乔卉卉徐明达《天津大学学报(自然科学与工程技术版)》2020,(6):601-608

状态监测与故障诊断是保证机械设备安全稳定运行的必要手段.本文提出一种基于注意力机制双向LSTM网络(ABiLSTM)的深度学习框架用于机械设备智能故障诊断.首先,将传感器采集的设备原始数据进行预处理,并划分为训练样本集与测试样本集;其次,训练多个不同尺度的双向LSTM网络对原始时域信号进行特征提取,得到设备故障多尺度特征;再次,通过引入注意力机制,对不同双向LSTM网络提取特征的权重参数进行优化,筛选保留目标特征,滤除冗杂特征,以实现精准提取有效故障特征;最后,在输出端利用Softmax分类器输出故障分类结果.通过利用发动机气缸振动实验数据和凯斯西储大学滚动轴承实验数据进行故障诊断实验,故障识别准确率均达到99%以上.实验结果表明,ABiLSTM模型可以实现对原始时域信号的多尺度特征提取和故障诊断,通过与深度卷积网络(CNN)、深度去噪自编码器(DAE)和支持向量机(SVM)等方法进行对比,ABiLSTM模型的故障识别性能优于各类常见模型.另外,通过利用凯斯西储大学滚动轴承在不同工况条件下的数据,对ABiLSTM模型进行泛化性能实验,变工况样本的故障识别准确率仍然能够达到95%以上. 相似文献

19.

基于ASAM注意力机制的光场图像压缩方法

下载免费PDF全文

高莹张倩廖万王斌张艳《上海师范大学学报(自然科学版)》2023,52(2):155-162

为了研究光场图像的空间信息和相似角度信息之间的差异性,提高光场图像的传输效率,提出了一种基于端到端网络的角度空间注意力模型（ASAM）注意力机制的光场图像压缩方法 .以卷积块注意力模型（CBAM）的注意力机制为基础,增强了相对角度特征,提高了压缩编码效率.稀疏图像采用H.266/VVC视频编解码器进行压缩,通过子孔径图像（SAI）网络恢复编码后的图像.结果表明,与现有的光场图像压缩方法相比,所提出的光场图像压缩方法具有较高的图像压缩性能,Bj?ntegaard-Delta比特率（BD-BR）降低了52.30%,Bj?ntegaard-Delta峰值信噪比（BD-PSNR）提高了3.33 dB. 相似文献

20.

基于注意力机制的水下目标检测算法 总被引：1，自引：0，他引：1

赵晓飞于双和李清波阎妍赵颖《扬州大学学报(自然科学版)》2021,(1):62-67

针对传统水下目标检测算法识别精度低的问题,提出一种基于注意力机制的水下目标检测算法(feature refinement and attention mechanism network,FRANet).该算法采用特征融合模块和特征增强模块相结合的方式,使用卷积神经网络提取目标的多尺度特征.同时引入一种由锚框精化模块、空... 相似文献