首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
基于BERT-BiLSTM-CRF,提出一种先抽取关系和后抽取实体的自动抽取知识模型。其中,关系识别模型的输出是实体识别模型的输入。实验结果表明,该模型可高效抽取《中国民族药辞典》中的实体和关系。利用此模型抽取的中国民族药知识实体和关系构建了知识图谱,并基于此知识图谱实现了中国民族药知识可视化和智能问答。  相似文献   

2.
面向知识图谱的表示学习在低维语义空间中对实体和关系进行编码,提升了知识理解和推理能力。传统的平移模型在处理知识图谱中的一对多、多对一以及多对多这些复杂关系时,难以区分在某一属性具有相同语义的实体。本文构建了一种基于二值可信向量的平移模型(TransV),通过向量不同维度的元素值控制对应属性的激活与抑制程度,使不同的关系关注不同的实体属性信息,提高模型处理复杂关系的效果。除了知识图谱中的三元组信息,非结构化文本中包含了丰富的语义信息,能够提高实体表达能力。利用与实体相关的文本信息,构建了一种融合上下文信息的基于二值可信向量的知识图谱表示学习模型(CKRV),使得三元组信息与语义信息能相互影响、相互融合。实验结果表明,该方法复杂度更低,在实体预测准确性方面有明显提升。  相似文献   

3.
为用户推荐其感兴趣的新闻内容,已成为了各大互联网新闻平台的首要技术目标。传统的新闻推荐方法主要是基于用户间的相似度或新闻内容间的相似度产生推荐列表。以上两种推荐方法虽然有效,但却忽略了新闻文本中存在的语义信息。知识图谱是一种描述实体以及实体之间链接关系的语义网络,基于知识图谱实现精准推荐是推荐系统目前的研究热点。本文基于知识图谱提出了一种用户兴趣向量的计算方法,在此基础上结合先进的卷积神经网络来构建推荐模型。所提出的基于知识图谱的新闻推荐方法,能借助知识图谱提取新闻文本中的部分语义信息,并将其应用于计算用户的兴趣向量,从而产生较好的符合用户语义的推荐结果。  相似文献   

4.
知识图谱可以为智能问答和自动推荐等系统提供良好的数据支持。针对国内现有学科知识图谱构建数据来源单一等问题,提出一种多源异构数据融合的方法构建初中数学知识图谱。基于领域知识和学习者需求构建初中数学本体,确定概念、方法、公式、定理四种类型的实体;从教材等权威数据源和百度百科、互动百科等网络数据源中获取非结构化与半结构化数据,基于BERT(bidirectional encoder representations from transforms)模型抽取出教材等非结构化数据的关系和实体;利用基于层次过滤思想的知识融合模型进行多源异构数据的融合。实现了基于初中数学知识图谱的智能问答和自动推荐系统,为学习者提供及时且智能的学习支持服务,为破解初中数学在线教学个性化不足提供一条思路。  相似文献   

5.
原子事件抽取是将非结构化文本进行结构化表示的重要方法.针对新闻语料,本文提出了一种基于信息单元融合的原子事件抽取方法.在中文分词、词性标注、命名实体识别等自然语言处理技术的基础上,利用语言规则将信息单元标识出来并进行融合,达到浅层句法分析的效果,通过原子事件抽取算法将原子事件从经信息单元融合后的语料中抽取出来.基于信息单元融合的原子事件抽取方法不仅对文本长度没有严格限制,并且不受事件类型的约束;实验结果表明,基于信息单元融合的原子事件抽取方法是有效的.  相似文献   

6.
为解决和缓解甲骨学研究难度大、周期长、知识关联性弱、知识共享程度低等问题。基于多源异构数据源,融合基于文献计量学的科学知识图谱(MKD)和基于知识库的知识图谱(KG),构建了甲骨学融合知识图谱。通过融合两类知识图谱,并基于知识推理进行语义扩展,形成最终的甲骨学知识图谱。其中包含实体148 305个,关系434 032条,可满足甲骨学研究的基本需求。融合MKD和KG两类知识图谱,优势互补,实现甲骨学知识图谱构建,可为其他古籍类知识图谱构建提供借鉴。  相似文献   

7.
心血管疾病长期以来一直占据着中国疾病死亡率榜首,并且其死亡率仍在逐年上升。在国内开源的中文医学数据集稀缺的背景下,结合自顶向下和自底向上的方法半自动化构建心脏病中文知识图谱。首先,基于高质量百科数据和医学文献构建心脏病本体,为了保证数据的领域封闭性,根据预先定义的疾病词典从百科类网站和医学网站等异构数据源中获取心血管疾病数据;接着,定义实体相似度计算方法进行更好的知识融合,并在图谱数据上通过模式发现寻找最优的数据模式,实现知识图谱模式层和数据层的共同迭代;最后,在图数据库中对图谱数据进行可视化展示,并根据当前研究动态探讨心脏病知识图谱一些具有前景的应用。  相似文献   

8.
为了从多源异构的复杂土地基础数据中快速准确地提取用户所需信息,提出了基于元数据的一体化管理检索方法.在元数据信息提取、元数据加权索引、实体同义词扩展检索3个环节中,结合土地领域专业知识和用户实际需求,设计和开发了共享元数据表结构、加权元数据中字段相对重要性和信息熵因子,构建地名实体和专题数据层实体同义词库,并集成到包括中文分词、实体识别、同义词扩展、索引检索和相似度计算的一体化管理检索框架中,解决了多源异构土地基础数据统一管理和精确检索的问题.实践表明,该方法较传统的通用信息检索方法具有更好的适用性和更高的准确率.  相似文献   

9.
中文实体间的数值型关系抽取有着广泛的应用前景,目前常用的实体关系抽取一般采用有监督抽取方法,且多用于短文本和简单句,并不适合处理海量复杂句.针对来自于网络的大量复杂文本,本文提出了一种中文实体数值型关系的无监督抽取方法.在中文分词、词性标注等自然语言处理结果的基础上,首先经过句式分析并采用选择树算法构建候选集,接着利用Jaro-Winkler距离进行候选集筛选,最后抽取得到数值型三元组关系.本文在钢铁、船舶、房地产3个行业的数据上进行了实验,结果表明,该方法抽取中文实体数值型关系是有效的.  相似文献   

10.
传统的基于词边界划分的中文分词已经难以满足实际应用的需要.通过深入分析词的内部结构,提出了一种基于条件随机场的词结构分析方法.根据伪未登录词(POOV)组成成分的特点及词的内部子结构表示,提出了词的结构特征来提高未登录词(OOV)的识别率及词结构的识别性能.从词的内部结构表示形式推导出一般化的词结构标记集,很好地统一了词边界标记和词内部结构标记.它不仅适用于传统的中文分词任务中词边界的标注,而且也适用于词结构分析任务中词的内部结构的标注.该方法能够同时分析得到词的边界和内部结构信息,解决了语料库之间分词标准不一致的问题,满足了应用的不同需求.实验结果表明,该方法在整体性能和各层次结构的识别上都比现有方法有所提高.  相似文献   

11.
为支持在并行设计过程中设计特征模型到加工特征模型的逐步转换,提出了局部特征识别的方法.在并行设计中,设计特征模型和加工特征模型通过面名历史图共享零件的实体模型,设计特征的变动通过局部特征识别自动地转换为相应的加工特征.局部特征识别是由基于最小条件子图特征识别方法改进来的,它以零件的局部区域为识别对象,通过搜索匹配局部区域构成的边界模式,识别出该局部区域中所包含的加工特征.局部特征识别方法的特点是只对设计中发生变动的区域进行识别.  相似文献   

12.
为解决现有多数视频人体动作识别3D卷积方法无法区分信息中各维度的重要和非重要特征问题,提出了通过门控循环单元(GatedRecurrentUnit,GRU)和空间注意力增强模块构建时空特征处理网络的方法,基于多级特征融合和多组通道注意力特征选择构建网络,改进基础网络模型Res Net3D对视频人体动作识别中的网络模型.改进后模型在2个公开数据集UCF101和HMDB51上的准确率分别为96.42%和71.08%,与C3D、Two-stream等网络模型相比,具有更高的识别准确率.  相似文献   

13.
以字为单位处理中文邮件存在着很大困难,针对于此,笔者引进中文分词算法,设计并实现了基于分词的垃圾邮件过滤系统,并且阐述了与实现相关的3个关键算法:用于关键词匹配的多模式相似/精确匹配算法,用于中文邮件处理的中文分词算法,以及用于特征提取的N元特征提取算法.最后实验证明了该系统对中英文垃圾邮件过滤都有很高的性能.另外,文章第三部分还给出了基于分词的非垃圾邮件分类系统的设计与实现.  相似文献   

14.
3D人脸线框模型的自动调整   总被引:1,自引:0,他引:1       下载免费PDF全文
3D人脸线框模型是自然人脸表述的重要方法.如何将通用的模型调整到特定的人脸上涉及脸部特点的自动提取和模型的调整两个主要过程.对通过皮肤颜色分割和形态滤波得到复杂背景的视频场景中的候选人脸,用区域惯量椭圆方向进行调整并用先验人脸模板校验以找出人脸和脸部特征区域.根据人脸特征区域所具有的颜色特性和空间分布采用基于特征的人脸识别算法提取部分重要的脸部特征点,由曲线和活动轮廓模型拟合脸部特征边缘,从中提取特征点,用来估计头部姿势和作为插值结点的使用径向基函数插值,可将3D人脸线框模型自动调整到特定的人脸上.  相似文献   

15.
语谱 图在语音分析方 面 有着广泛 的应用.音素的 自动分割是语音识别过程中的一个基本阶段,它 将把语音句子按音素特征 进行分割.本文提出 了一 个音素 自动分割的方法 ;使用了两个表示 语谱图密度变化 的形变函 数,以及 自适应阂值技术来 定位每个音素段的边 缘.这个方法在 计算机 上 具体实现 后.我们对取于 一 个 语谱图数据 库的一组 实验数据,用本 文所介绍 的自动分割方法划分 音素,将所得结果与 由一 语音学家分 割的结果进行 比较,得到 的识别率高于 93 %.这 个方法作为语音识别系 统的一 部分.已经在一 个语音分析 系统中使用.  相似文献   

16.
磁共振成像(MRI)胎盘组织的准确分割对于研究妊娠和分娩并发症具有重要意义,但传统放射科医师的人工标注难以保证分割准确性和客观性,且费时费力.为了开发用于MRI中胎盘组织自动分割的深度学习模型,提出了结合Transformer和卷积神经网络(CNN)的生成对抗网络(TCGANet).将特征嵌入模块与跳跃连接相结合,缓解传统特征融合方法带来的信息丢失.在此基础上引入内容提取模块,采用Transformer的自注意力机制捕捉全局依赖关系,有效表示MRI的全局和局部信息.此外,鉴于传统分割方法难于精确界定MR影像胎盘组织边缘的问题,运用判别网络对胎盘组织分割的生成网络监督,以提高胎盘边缘界定的精度.结果表明,该模型在定量指标和边界定位精度方面显著优于现有分割方法,其中准确度为0.993±0.003,灵敏度为0.903±0.093,特异度为0.996±0.003,Dice相关性系数为0.861±0.141.对模型不同结构的消融实验验证了网络结构设计的合理性,大部分性能指标明显优于现有方法(P<0.05).该模型能够实现自动且准确地分割MRI中胎盘组织.  相似文献   

17.
随着信息技术的发展,数字技术越来越多地应用于民族文化数字化保护,民族服饰的数字化及分类问题也日益受关注。相比一般服饰,少数民族服饰具有更多的细节特征信息,对其进行分类识别具有很大挑战。选用卷积神经网络DenseNet-BC作为基础网络结构,设计并使用了多尺度密集连接单元,用不同大小的卷积提取不同尺度的特征信息,以提高网络的学习能力;此外,为进一步提高网络的鲁棒性,提出一种局部和全局注意力机制方法进行分类识别。实验结果表明,改进的DenseNet-BC模型对少数民族服饰的识别准确率达95.18%,较ResNet-18、ResNet-34和DenseNet模型的识别准确率分别提升了3.84%、2.27%和1.18%。改进的DenseNet-BC模型具有更好的特征提取能力,能够提取更多的细节特征信息,一定程度上解决了普通模型提取特征尺度单一、特征丰富度低的问题。  相似文献   

18.
作为世界六大古文字之一的古彝文记录了几千年来人类的发展历史。通过对古彝文的识别能够将这些珍贵文献资料转换为电子文档,便于保存和传播。由于历史发展、区域限制等原因,针对古彝文识别的研究鲜有成果。本文将当前新颖的深度学习技术应用于古老的文字识别。在四层卷积神经网络(convolutional neural network, CNN)基础上扩展出5个模型,然后利用Alpha-Beta散度作为惩罚项,对5个模型的输出神经元重新进行自编码,接着用2个全连接层完成特征压缩,最后在softmax层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符。实验表明,相对于传统CNN模型,本文方法对古彝文手写体的识别精度更高。  相似文献   

19.
作为世界六大古文字之一的古彝文记录了几千年来人类的发展历史。通过对古彝文的识别能够将这些珍贵文献资料转换为电子文档,便于保存和传播。由于历史发展、区域限制等原因,针对古彝文识别的研究鲜有成果。本文将当前新颖的深度学习技术应用于古老的文字识别。在四层卷积神经网络(convolutional neural network, CNN)基础上扩展出5个模型,然后利用Alpha-Beta散度作为惩罚项,对5个模型的输出神经元重新进行自编码,接着用2个全连接层完成特征压缩,最后在softmax层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符。实验表明,相对于传统CNN模型,本文方法对古彝文手写体的识别精度更高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号