首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对三维网格模型分割质量提升问题,提出了感知几何的图注意力网络。首先,定义了感知几何的图注意力系数,利用节点之间的边特征扩展由网络学习得到的注意力系数,引入与节点局部几何信息相关的注意力系数,更好地反映节点之间的相似性。然后,通过调整网络架构,将三维网格模型的几何特征与标签信息共同作为图注意力网络的输入,使标签信息参与网络训练和验证,并通过残差形式的线性连接实现网络的更稳定输出。大量实验结果表明,本文算法能够获得精确的分割边界,其在PSB数据集上的分割准确率较现有经典算法提升约2个百分点,也取得了更好的兰德指数。同时,通过消融实验验证了算法的合理性。  相似文献   

2.
现有细粒度分析方法未能充分利用细粒度情绪信息来增强上下文与评价目标间的语义关联性,且对多词构成的评价目标仅平均化处理,损失了词间内容与关系信息,导致分类不精准。针对上述问题,本文提出了一种基于细粒度信息交互注意力(interactive attention with fine-grained information,FGIA)的情绪分类方法,通过采用更加细粒度的注意力机制来实现评价目标与上下文之间的充分交互,同时得到目标对上下文以及上下文对目标的交互注意力表示,进而辅助完成情绪分类。在本文构建的COVID-19网络舆情中文数据集上进行了实验验证,结果表明,FGIA能够有效地提升网络舆情数据情绪分类的准确性,相比于主流的分类方法,在各项评价指标上均取得了较高的提升。  相似文献   

3.
针对以往基于关键点的目标检测存在小尺度上的检测结果不太理想,忽略关键点之间的类别语义信息的问题,提出了一种新的关键点检测算法Point-GAT。该算法通过在Hourglass和ResNeXt主干网络上加入快捷连接,解决网络深度增加带来的学习退化问题;使用反卷积和特征融合增强小尺度目标的检测效果;同时算法使用了图注意力机制,通过构建有向有权重图映射类别之间的语义关系,获得关键点之间的类别语义信息;在优化定位和回归函数的同时,加入分类损失函数分支来反映类别语义信息。在COCO数据集上实验结果表明,该算法平均精度达到了48.3%,在PASVAL VOC 2007和PASVAL VOC 2012数据集上平均精度均高于其他算法。  相似文献   

4.
随着视频数据爆发式增长,视频描述任务越来越被研究者们关注。如何让计算机像人类一样理解视频的内容并能够准确无误地用语言表达出来,是视频描述任务领域尚未得到完美解决的难题之一。针对现有代表性视频描述模型中存在的未充分利用语义信息、生成描述不准确等问题,本文基于编码器-解码器框架的视频描述模型,提出了一种融合语义增强与多注意力机制的视频描述方法。该方法首先通过视觉文本特征聚合方法,为模型编码提供高层语义指导。然后,使用Faster-RCNN网络提取视频对象特征,通过图卷积网络获取视频对象的潜在语义信息,得到增强特征。最后,引入多重注意力机制,使模型更好地利用输入信息,增强模型的学习能力。MSVD和MSR-VTT数据集上的实验结果表明,相比于基准模型,本文提出的方法能合理优化视频描述模型的输入信息,有效提取视频潜在语义,从而解决视频文本跨模态问题和生成语句的语法结构问题,并能有效提升视频描述模型的准确度和对复杂场景的描述能力,更具先进性。  相似文献   

5.
代码组件的动态组合重用方法   总被引:1,自引:0,他引:1  
阐述了代码组件及其动态组合重用方法的基本概念,详细地介绍了一种动态组合重用代码组件的方法——DCRCC(Dynam icCom position Reuse ofCodeCom ponent)方法. 实践表明,基于代码组件的封装技术、组合技术和库管理技术,DCRCC方法能够通过动态组合重用代码组件的方式有效地进行软件开发.  相似文献   

6.
人脸微表情具有持续时间短,运动幅度小,只发生在面部局部区域的特点,给微表情的准确识别带来了极大的挑战。针对上述问题,提出一种基于持续时空注意力网络(Continuous Spatiotemporal Attention Network, CSTN)的人脸微表情识别算法。该算法由主、副两个通道组成,主通道为持续时空注意力模块,副通道为位置校准模块。首先主通道进行离散采样,等间隔抽取原始视频帧组成一个新的视频序列,利用帧间差分法提取各帧之间的运动差异,再将其输入到持续时空网络,提取面部肌肉运动的时空特征;其次利用副通道提取的面部位置信息对主通道信息进行位置校准,最后将融合信息输入到Softmax分类器对微表情进行分类。实验表明在3个公开微表情数据集CASMEⅡ,SAMM,MMEW上该算法识别的平均准确度分别达到了89.96%,86.73%,89.76%,优于现有其他算法。  相似文献   

7.
为评估搜索引擎的有效性,采用问卷调查法请211名中国用户基于11项指标评估谷歌和百度两大中文搜索引擎.因素分析结果显示11项指标可以聚合为内容准确性和内容直接性两个因素,由两者构成的搜索有效性模型具有良好的信度和效度.应用该模型评价谷歌和百度的搜索有效性发现,谷歌在搜索内容准确性方面优于百度,而在搜索内容直接性方面则不如百度,内容直接性体验上的不足导致谷歌的总体搜索有效性低于百度.两个搜索引擎的用户体验模式也存在明显差别,用户对谷歌有效性的感知主要来自内容准确性,而对百度有效性的感知则相对均衡的来自内容准确性和内容直接性两个方面.  相似文献   

8.
在RGB-D显著性检测视觉任务中,RGB彩色模态和深度模态的信息均被视为十分重要的特征线索。但现有的RGB-D显著性检测模型无法高效执行多尺度特征的交互和多模态特征的融合,因此在真实的开放场景下表现欠佳。针对上述问题,提出了一种基于协同注意力(synergistic attention)机制的RGB-D显著性检测算法模型(SANet),并引入多模态学习中通用的引导与教导策略(guidance and teaching strategy)。在编码器进行多尺度特征提取的阶段中进行隐式引导(implicit guidance),在解码器进行特征融合时进行显式的教导(explicit teaching),实现了编码、解码的分阶段学习。在4个显著性检测评测数据集上进行的综合实验表明,该算法在4个评测指标上均优于已有的18个前沿RGB-D显著性检测模型。  相似文献   

9.
乳腺癌是全球最常见的恶性肿瘤之一,采用传统方法诊断需花费大量时间和精力,且受个人能力影响较大。用计算机辅助诊断的方法,可以提高病理图像分类的准确率和效率,从而满足临床应用的需求。为此,提出一种基于DenseNet的融合多尺度特征和注意力机制的乳腺癌病理图像分类算法(MFDC-Net)。在密集块中引入坐标注意力机制,精准定位重要特征的空间信息。采用多尺度池化过渡层,通过不同卷积核的平均池化和普通卷积,在实现降维的同时扩大感受野。采用多尺度特征增强模块,融合深层次图像特征,提高分类性能。结果显示,MFDC-Net模型的分类性能较其他经典模型更优,分类准确率达97.12%,易混淆率低至3.34%,能较好地进行乳腺癌组织病理图像分类,为诊断和治疗提供重要依据。  相似文献   

10.
提出一种基于注意力机制的连续手语识别算法ACN(attention-based 3D convolutional neural network),能够识别复杂背景下的连续手语。该算法首先利用背景去除模块,对包含复杂背景的手语视频进行预处理;然后,通过基于空间注意力机制的3D-ResNet(3D residual convolutional neural network)提取时空融合信息;最后,采用结合时间注意力机制的长短期记忆(long short-term memory,LSTM)网络进行序列学习,得到最终的识别结果。算法在大规模中国连续手语数据集CSL100上表现优异;在面向不同复杂背景的情况下,算法表现出良好的泛化性能,模型引入的时空注意力机制是切实有效的。  相似文献   

11.
针对微型计算机接口课程的网络虚拟实验提出了基于组件的3D网络虚拟实验实现方法.利用3DMAX的坐标轴变换技术与材质技术实现了组件局部坐标系的调整与模型的材质;利用Java3D的模型导入技术与交互式编程技术解决了导入实验板模型时丢失材质、模型的重装、虚拟场景与实验板的操作等问题.以微型计算机接口课程教学实验中基础的8255并行接口实验作为实例设计了一个虚拟实验,为虚拟实验室的开发与应用提供了实用的案例.  相似文献   

12.
采用区别与传统全局建模的方法,基于三坐标数控代码直接提取出曲面的表面数据点,然后用散乱点三角网格模型,先求出空间坐标点两个方向的切向矢量,进而求出曲面的法向矢量。最后用算例说明了该计算方法较传统的全局建模方法有计算量较小而精度较高的优势。  相似文献   

13.
在传统的图像描述生成任务中,已有方法对图像的描述仅仅停留在浅层,并缺乏真实世界知识的指导,难以挖掘出对象在特定背景下的逻辑语义关系。新闻文本的引入为图像描述带来了新的可能,同时对模型的学习能力有了更高要求;此外,新闻图集中往往存在多幅图像,且相互之间联系紧密,导致现有单图描述生成方法不适用于新闻图集描述生成。针对上述问题,本文提出了一种基于图文双向引导注意力(image and text bidirectional guidance attention,ITBGA)的新闻图集描述方法,以图集作为研究对象,并辅以对应的新闻文本作为背景知识,基于ITBGA分别实现粗、细两个粒度的跨模态信息交互,并通过指针网络辅助命名实体词生成。在本文构建的新闻图集数据集上进行了实验验证,结果表明ITBGA能有效提升描述文本的质量,在关键的CIDEr指标上达到了最优。  相似文献   

14.
磁共振成像(MRI)胎盘组织的准确分割对于研究妊娠和分娩并发症具有重要意义,但传统放射科医师的人工标注难以保证分割准确性和客观性,且费时费力.为了开发用于MRI中胎盘组织自动分割的深度学习模型,提出了结合Transformer和卷积神经网络(CNN)的生成对抗网络(TCGANet).将特征嵌入模块与跳跃连接相结合,缓解传统特征融合方法带来的信息丢失.在此基础上引入内容提取模块,采用Transformer的自注意力机制捕捉全局依赖关系,有效表示MRI的全局和局部信息.此外,鉴于传统分割方法难于精确界定MR影像胎盘组织边缘的问题,运用判别网络对胎盘组织分割的生成网络监督,以提高胎盘边缘界定的精度.结果表明,该模型在定量指标和边界定位精度方面显著优于现有分割方法,其中准确度为0.993±0.003,灵敏度为0.903±0.093,特异度为0.996±0.003,Dice相关性系数为0.861±0.141.对模型不同结构的消融实验验证了网络结构设计的合理性,大部分性能指标明显优于现有方法(P<0.05).该模型能够实现自动且准确地分割MRI中胎盘组织.  相似文献   

15.
为解决深度学习在图像水印算法中计算量大且模型冗余的问题,提高图像水印算法在抵抗噪声、旋转和剪裁等攻击时的鲁棒性,提出基于快速神经网络架构搜索(neural architecture search,NAS)的鲁棒图像水印网络算法。通过多项式分布学习快速神经网络架构搜索算法,在预设的搜索空间中搜索最优网络结构,进行图像水印的高效嵌入与鲁棒提取。首先,将子网络中线性连接的全卷积层设置为独立的神经单元结构,并参数化表示结构单元内节点的连接,预先设定结构单元内每个神经元操作的搜索空间;其次,在完成一个批次的数据集训练后,依据神经元操作中的被采样次数和平均损失函数值动态更新概率;最后,重新训练搜索完成的网络。水印网络模型的参数量较原始网络模型缩减了92%以上,大大缩短了模型训练时间。由于搜索得到的网络结构更为紧凑,本文算法具有较高的时间性能和较好的实验效果,在隐藏图像时,对空域信息的依赖比原始网络更少。对改进前后的2个网络进行了大量鲁棒性实验,对比发现,本文算法在CIFAR-10数据集上对抵抗椒盐噪声和旋转、移除像素行(列)等攻击优势显著;在ImageNet数据集上对抵抗椒盐高斯噪声、旋转、中值滤波、高斯滤波、JPEG压缩、裁剪等攻击优势显著,特别是对随机移除行(列)和椒盐噪声有较强的鲁棒性。  相似文献   

16.
为了使多因子降维能够应用在大规模数据集的分析上,针对多因子降维穷举搜索单核苷酸多态(SNP)的组合的过程进行了改进,利用禁忌搜索的方法来代替穷举搜索.禁忌搜索以SNP的组合作为解,采用低阶的最优SNP组合作为高阶的初始解的一部分,随机替换当前解中的某个SNP作为邻域解,并采用全局多样化搜索,该方法在保证与多因子降维相当的分类正确率的基础上,显著地缩短了检测交互作用的时间.  相似文献   

17.
讨论了基于dj图和降维dj图计算逻辑函数的一阶布尔偏导数和二阶布尔偏导数的图形方法.实例表明该方法具有直观、简单等特点,并且它能给出布尔偏导数的最简CRM式.  相似文献   

18.
分析了逻辑函数的K图和降维K图,在此基础上,从逻辑函数定义出发,讨论了用K图和降维K图计算逻辑函数一阶布尔E-导数和二阶布尔E-导数的图形方法,实例表明该方法具有直观、简单等特点,并且能给出布尔E-导数的最简与/或式.  相似文献   

19.
为解决现有多数视频人体动作识别3D卷积方法无法区分信息中各维度的重要和非重要特征问题,提出了通过门控循环单元(GatedRecurrentUnit,GRU)和空间注意力增强模块构建时空特征处理网络的方法,基于多级特征融合和多组通道注意力特征选择构建网络,改进基础网络模型Res Net3D对视频人体动作识别中的网络模型.改进后模型在2个公开数据集UCF101和HMDB51上的准确率分别为96.42%和71.08%,与C3D、Two-stream等网络模型相比,具有更高的识别准确率.  相似文献   

20.
由于DeMarco的数据流图(DDFD)缺乏形式化的描述方法,本文提出了一种使用综合知识表示模型MAS来形式化描述DDFD的新方法.使用此方法,能方便地建立一些有关DDFD的知识规则,并能对DDFD自动进行一致性和完全性检查  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号