首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到7条相似文献,搜索用时 0 毫秒
1.
随着视频数据爆发式增长,视频描述任务越来越被研究者们关注。如何让计算机像人类一样理解视频的内容并能够准确无误地用语言表达出来,是视频描述任务领域尚未得到完美解决的难题之一。针对现有代表性视频描述模型中存在的未充分利用语义信息、生成描述不准确等问题,本文基于编码器-解码器框架的视频描述模型,提出了一种融合语义增强与多注意力机制的视频描述方法。该方法首先通过视觉文本特征聚合方法,为模型编码提供高层语义指导。然后,使用Faster-RCNN网络提取视频对象特征,通过图卷积网络获取视频对象的潜在语义信息,得到增强特征。最后,引入多重注意力机制,使模型更好地利用输入信息,增强模型的学习能力。MSVD和MSR-VTT数据集上的实验结果表明,相比于基准模型,本文提出的方法能合理优化视频描述模型的输入信息,有效提取视频潜在语义,从而解决视频文本跨模态问题和生成语句的语法结构问题,并能有效提升视频描述模型的准确度和对复杂场景的描述能力,更具先进性。  相似文献   

2.
基于人工智能技术的生成内容(artificial intelligence generated content,AIGC)已成为当下的热门话题。在众多生成模型中,扩散模型因其高度可解释的数学特性及高质量和多样性的结果引起广泛关注,在条件引导的图像生成领域已取得显著成果,被广泛应用于电影、游戏、绘画和虚拟现实等领域,在文本引导的图像生成任务中,扩散模型不仅能生成高分辨率的图像,而且能保证生成图像的质量。首先介绍了扩散模型的定义和相关背景,然后重点介绍了扩散模型在条件引导的图像生成领域的发展历程和最新进展,最后探讨了扩散模型面临的挑战和潜在的发展方向,旨在为广大研究人员提供相关领域的研究概况和前沿动态。  相似文献   

3.
在OSI管理框架中,GDMO是一种广泛使用而又比较有效的管理对象建模技术,但缺乏对管理对象行为的精确描述.为此,本文提出一种基于规则的方法来完整、精确、无二义性地形式描述管理对象的行为.文章首先引入了面向对象的方法、管理对象、GDMO表示法,然后通过具体例子深入研究基于规则方法的管理对象行为的形式描述.研究结果表明,带有对象通信规则的概念可以与具有继承与包封性质的面向对象方法共存,同时能很容易把这种规则方法集成到GDMO模板表示法中去.  相似文献   

4.
现有细粒度分析方法未能充分利用细粒度情绪信息来增强上下文与评价目标间的语义关联性,且对多词构成的评价目标仅平均化处理,损失了词间内容与关系信息,导致分类不精准。针对上述问题,本文提出了一种基于细粒度信息交互注意力(interactive attention with fine-grained information,FGIA)的情绪分类方法,通过采用更加细粒度的注意力机制来实现评价目标与上下文之间的充分交互,同时得到目标对上下文以及上下文对目标的交互注意力表示,进而辅助完成情绪分类。在本文构建的COVID-19网络舆情中文数据集上进行了实验验证,结果表明,FGIA能够有效地提升网络舆情数据情绪分类的准确性,相比于主流的分类方法,在各项评价指标上均取得了较高的提升。  相似文献   

5.
在代码搜索任务中,已有的基于深度学习的算法,一方面不能有效提取代码特征和查询特征之间的细粒度交互关系,另一方面未考虑特征之间潜在的结构化特征,无法实现更精确的匹配。本文提出了一种基于交互和图注意力网络的代码搜索模型IGANCS(Interaction and Graph Attention Network based model for Code Search)。该模型通过引入基于相似度矩阵的交互机制,学习代码特征和查询特征的细粒度交互关系,实现代码与查询之间的对齐;引入图注意力机制,利用自注意力层学习代码和查询中隐藏的结构化特征,更深入地挖掘代码和查询的结构化语义;利用最大池化机制分别聚合代码特征和查询特征,提取最重要的特征信息。本文在公开的Java数据集和Python数据集上对IGANCS进行了评估。实验结果表明,IGANCS在Mean Reciprocal Rank(MRR)和SuccessRate@1/5/10指标上优于已有的基线模型。  相似文献   

6.
较之分子动力学, 蒙特卡罗能够实现非局域的粒子移动, 从而解决一些分子动力学不容易模拟的问题. 非局域的粒子移动主要包括模拟化学反应时粒子产生和消失的过程, 高分子模拟时的扭折-跳跃、绕枢轴转动和蠕动以及位形偏倚蒙特卡罗中链的回溯和再生. 然而在蒙特卡罗方法处理非局域移动时, 并不存在一种计算短程作用的计算复杂度为 的算法, 从而限制了蒙特卡罗方法的应用. 本文基于双向链表的数据结构, 发展了蒙特卡罗模拟中因粒子删除和插入而引起的短程势能变化的计算复杂度为 的元胞链表方法. 所有非局域的粒子移动可以转化为粒子的删除和插入, 因此该方法适用于上述所有情形. 此外, 由于Metropolis算法中给某粒子一个随机位移的过程可以看成旧位置粒子的删除以及新位置粒子的插入, 因此该方法也适用于Metropolis算法中粒子的随机移动.  相似文献   

7.
中国剪纸的设计极具挑战性, 要求画面简洁、直观, 还需要表达特定的文化内涵, 且整张剪纸须整体连通。提出了一种基于图像的二维剪纸自动生成方法, 能够将任意数码照片自动转化为剪纸图形。首先,利用图像分割方法建立区域连接图; 接着, 基于该连接图对颜色、边界对比度和区域连通性进行数学建模, 并获得优化目标函数; 最后, 通过模拟退火算法求解目标方程, 自动生成保持图像内容的剪纸图形。还开发了连通性后处理和区域指定等用户交互工具, 允许用户在自动生成的剪纸图形中方便地加入个人设计。实验表明, 所生成的剪纸图形画面简洁、整体连通。 本方法在降低剪纸设计难度的同时还可满足个性化的设计需求, 有助于传播和传承我国的民间剪纸艺术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号