首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 42 毫秒
1.
为用户推荐其感兴趣的新闻内容,已成为了各大互联网新闻平台的首要技术目标。传统的新闻推荐方法主要是基于用户间的相似度或新闻内容间的相似度产生推荐列表。以上两种推荐方法虽然有效,但却忽略了新闻文本中存在的语义信息。知识图谱是一种描述实体以及实体之间链接关系的语义网络,基于知识图谱实现精准推荐是推荐系统目前的研究热点。本文基于知识图谱提出了一种用户兴趣向量的计算方法,在此基础上结合先进的卷积神经网络来构建推荐模型。所提出的基于知识图谱的新闻推荐方法,能借助知识图谱提取新闻文本中的部分语义信息,并将其应用于计算用户的兴趣向量,从而产生较好的符合用户语义的推荐结果。  相似文献   

2.
为提高文本匹配过程中对实体上下文和语义关联信息的学习能力,提出一种融合实体上下文特征的深度文本语义匹配模型。该模型通过学习深度多视图语义交互信息和实体上下文特征匹配矩阵来计算文本的综合匹配得分,采用双向长短时记忆网络和共注意力机制获取文本的局部语义特征并进行多视图向量交互匹配,同时,针对文本中提取到的实体计算上下文特征,通过实体匹配矩阵和卷积神经网络进行实体上下文语义匹配。在SNLI、MultiNLI和Quora Question Pairs数据集上分别与已有基准模型对比,实验结果表明,相比经典深度文本匹配模型,本文提出的融合实体上下文特征的文本匹配模型可以有效提升文本匹配的准确度。  相似文献   

3.
为解决和缓解甲骨学研究难度大、周期长、知识关联性弱、知识共享程度低等问题。基于多源异构数据源,融合基于文献计量学的科学知识图谱(MKD)和基于知识库的知识图谱(KG),构建了甲骨学融合知识图谱。通过融合两类知识图谱,并基于知识推理进行语义扩展,形成最终的甲骨学知识图谱。其中包含实体148 305个,关系434 032条,可满足甲骨学研究的基本需求。融合MKD和KG两类知识图谱,优势互补,实现甲骨学知识图谱构建,可为其他古籍类知识图谱构建提供借鉴。  相似文献   

4.
旨在通过考虑特征词汇的潜在语义和自身的重要性来提高文本聚类效果,研究基于RI方法的文本向量表示方法。首先,对基于RI方法构建的特征词汇随机索引向量中+1和-1向量元素出现位置进行约束,以避免在构建特征词汇上下文向量时可能造成该特征词汇潜在语义丢失现象;其次,在生成文本向量时考虑特征词汇自身重要性来改进权值的计算;最后,在测试数据上对基于RI方法的文本向量表示进行聚类效果测试与对比分析,结果表明采用基于RI方法能提高文本聚类效果。  相似文献   

5.
知识图谱可以为智能问答和自动推荐等系统提供良好的数据支持。针对国内现有学科知识图谱构建数据来源单一等问题,提出一种多源异构数据融合的方法构建初中数学知识图谱。基于领域知识和学习者需求构建初中数学本体,确定概念、方法、公式、定理四种类型的实体;从教材等权威数据源和百度百科、互动百科等网络数据源中获取非结构化与半结构化数据,基于BERT(bidirectional encoder representations from transforms)模型抽取出教材等非结构化数据的关系和实体;利用基于层次过滤思想的知识融合模型进行多源异构数据的融合。实现了基于初中数学知识图谱的智能问答和自动推荐系统,为学习者提供及时且智能的学习支持服务,为破解初中数学在线教学个性化不足提供一条思路。  相似文献   

6.
中文实体间的数值型关系抽取有着广泛的应用前景,目前常用的实体关系抽取一般采用有监督抽取方法,且多用于短文本和简单句,并不适合处理海量复杂句.针对来自于网络的大量复杂文本,本文提出了一种中文实体数值型关系的无监督抽取方法.在中文分词、词性标注等自然语言处理结果的基础上,首先经过句式分析并采用选择树算法构建候选集,接着利用Jaro-Winkler距离进行候选集筛选,最后抽取得到数值型三元组关系.本文在钢铁、船舶、房地产3个行业的数据上进行了实验,结果表明,该方法抽取中文实体数值型关系是有效的.  相似文献   

7.
基于BERT-BiLSTM-CRF,提出一种先抽取关系和后抽取实体的自动抽取知识模型。其中,关系识别模型的输出是实体识别模型的输入。实验结果表明,该模型可高效抽取《中国民族药辞典》中的实体和关系。利用此模型抽取的中国民族药知识实体和关系构建了知识图谱,并基于此知识图谱实现了中国民族药知识可视化和智能问答。  相似文献   

8.
大规模RDF数据的高效查询和推理是语义Web研究中关键问题.通过研究RDFS推理规则,结合ORDPATH编码机制,提出了一种新的大规模RDF数据的索引构建方案——S-Index.S-Index的一个显著特点是,通过对RDF数据的查询即可得到RDFS蕴含知识,实现了离线推理.对RDF数据中的ABox和TBox进行区分,通过ORDPATH编码,分别构建TBox中的Class和Property子父关系,以及domain和range关系的语义信息.将构建的语义编码信息持久化到RDF三元组索引中,使得三元组索引承载有语义信息,也即构成语义索引并最终持久化到底层数据库.设计并进行了一系列实验,对比了语义索引与一般索引在存储和查询时的性能.实验结果表明,S-Index语义索引在没有给不支持语义的传统RDF索引增加显著额外负担和开销的情况下,获得了在查询时对推理的有效支持.  相似文献   

9.
随着电力计量业务的不断扩展,迫切需要由业务信息、技术知识、行业标准及其内在联系所组成的电力计量知识图谱,为电网的决策和发展提供更为全面有效的支持。命名实体识别是构建知识图谱的基础。针对电力计量领域需要,结合中文分词技术特点,基于联合学习思想,提出了一种基于联合学习的中文电力计量命名实体识别技术。该技术联合CNN-BLSTM-CRF模型与整合词典知识的分词模型,使其共享实体类别和置信度;同时将2个模型的先后计算顺序改为并行计算,减少了识别误差累积。结果表明,在不需要人工构建特征的情况下,方法的正确率、召回率、F值等均显著优于以往方法。  相似文献   

10.
随着视频数据爆发式增长,视频描述任务越来越被研究者们关注。如何让计算机像人类一样理解视频的内容并能够准确无误地用语言表达出来,是视频描述任务领域尚未得到完美解决的难题之一。针对现有代表性视频描述模型中存在的未充分利用语义信息、生成描述不准确等问题,本文基于编码器-解码器框架的视频描述模型,提出了一种融合语义增强与多注意力机制的视频描述方法。该方法首先通过视觉文本特征聚合方法,为模型编码提供高层语义指导。然后,使用Faster-RCNN网络提取视频对象特征,通过图卷积网络获取视频对象的潜在语义信息,得到增强特征。最后,引入多重注意力机制,使模型更好地利用输入信息,增强模型的学习能力。MSVD和MSR-VTT数据集上的实验结果表明,相比于基准模型,本文提出的方法能合理优化视频描述模型的输入信息,有效提取视频潜在语义,从而解决视频文本跨模态问题和生成语句的语法结构问题,并能有效提升视频描述模型的准确度和对复杂场景的描述能力,更具先进性。  相似文献   

11.
针对现有地理语义相似度计算模型欠考虑实体层次影响因素问题,提出了一种引入实体的地理语义相似度混合计算模型.该模型在已有研究基础上,综合分析了语义相似度概念间的关系、本体结构、属性和实体的几何特征等影响因素,并用各影响因素的综合相似度结果度量地理概念间的语义相似度.最后,通过计算土地利用类型概念语义相似度验证了模型的有效性.  相似文献   

12.
为了从更深层次语义信息来描述图像,定义了图像、文本、事件文本、事件图、图像关键要素和文本关键要素六元组,以六元组为对象建立了中文图文数据集。基于事件语义模型与事件语义标注规范,在对采集的图像文本标注事件语义角色与事件关系的基础上,采用事件图对其语义进行形式化表示。对该中文图文数据集的统计分析表明,该数据集中各个事件语义角色都有所涉及且分布适中,图文对应区域数量相对句子长度表现适中,图文对数据质量较高。  相似文献   

13.
目前主流答案选择算法主要首先基于word2vec/glove进行词语表示,再使用RNN或CNN提取文本语义特征,但word2vec/glove无法解决一词多义问题,RNN和CNN在文本全局特征提取方面也有局限。针对以上不足,论文提出一种基于BERT预训练模型的答案选择算法BERT-LSTM,首先采用BERT模型提取问答文本的语义特征表示,再利用BiLSTM加强文本序列信息并整合文本语义,最后引入注意力机制突出重点信息,以此完成答案选择任务。在答案选择基准数据集InsuranceQA和WiKiQA上的测试验证了所提出算法的有效性。  相似文献   

14.
文本情绪原因识别是情感分析中一个新的研究方向,旨在从文本中自动检测出导致某一情绪产生的原因。针对循环神经网络在长文中出现的长期依赖问题,本文提出了一种基于注意力机制和双向长短时记忆(attention model and bi-directional long short-term memory,AM-BiLSTM)神经网络模型的情绪原因识别方法。该方法采用字符向量表示文本语义信息,使用BiLSTM模型提取文本特征,该过程结合了人工提取的子句特征,在训练模型时,引入了注意力机制来优化模型性能,使用softmax对子句进行分类。实验结果表明本文方法对情绪原因的识别是有效的。  相似文献   

15.
作文智能评分和评语智能生成能极大减轻评阅专家的工作量、节约人力成本。目前,评分和评语结果的准确性与公平性尚不高。近年来,机器学习和自然语言处理等技术的快速发展,在一定程度上提升了文本分类、机器翻译等任务的性能,但仍有许多新的研究成果尚未应用于作文智能评价。本研究综合了词向量(word2vec)、段落向量(paragraph2vec)、词性向量(pos2vec)和LDA (latent dirichlet allocation)等特征,共同组合为作文的语义表示向量;采用基于kNN (k nearest neighbors)算法的语义相似度模型,得到作文的评语标签;采用基于XGBoost(extreme gradient boosting)的回归模型计算英语作文的评分值;并以900篇大学生英语作文为样本,构造算例进行验证。最后表明,提出的智能评价框架在英语作文自动评分和评语生成的准确性上,都要高于传统方法。  相似文献   

16.
针对公众参与的语言信息多属性群决策问题,研究了考虑参与者满意度的概率语言多属性群决策方法。首先,根据参与者的语言评价信息确定并规范化概率语言决策矩阵。然后,对大群体进行共识分析,由最大化参与者群体的满意度构建线性规划模型,确定参与者群组的权重;构造正、负理想方案的评价向量,构建多目标规划模型,用拉格朗日乘子法求解属性权重;定义各方案的加权贴近度,并以此对方案进行排序和优选。最后,通过新型智慧城市市民获得感评价案例验证了模型的可行性和有效性。  相似文献   

17.
原子事件抽取是将非结构化文本进行结构化表示的重要方法.针对新闻语料,本文提出了一种基于信息单元融合的原子事件抽取方法.在中文分词、词性标注、命名实体识别等自然语言处理技术的基础上,利用语言规则将信息单元标识出来并进行融合,达到浅层句法分析的效果,通过原子事件抽取算法将原子事件从经信息单元融合后的语料中抽取出来.基于信息单元融合的原子事件抽取方法不仅对文本长度没有严格限制,并且不受事件类型的约束;实验结果表明,基于信息单元融合的原子事件抽取方法是有效的.  相似文献   

18.
基于XML扩展的Agent通信语言实现   总被引:1,自引:1,他引:0  
KQML作为一种重要的Agent通信语言,其常用的内容层知识交换语言KIF表示能力存在不足,不能充分表达复杂语义信息。本文提出采用XML扩展KQML通信语言,以增强KQML表达复杂语义的能力,并给出了详细的实现步骤。  相似文献   

19.
面对舆情信息的动态性、跨领域性、面向主题等特点,目前已有的领域本体学习方法难以适应舆情本体知识的自动构建.本文采用信息爬取技术收集热点舆情文本信息,根据构建模型自动识别主题进行归类,并对识别后的主题文本提取名词性词汇或者短语作为候选概念集;采用语义相似度方法计算候选概念间的相关度,根据相关度计算各概念的权值,并进行排序;结合词频变化的方法抽取与主题相关的核心概念.实验结果表明,本文方法可有效地抽取与舆情主题相关的核心概念,对舆情本体的构建以及后期的知识共享和重用起到积极作用.  相似文献   

20.
心血管疾病长期以来一直占据着中国疾病死亡率榜首,并且其死亡率仍在逐年上升。在国内开源的中文医学数据集稀缺的背景下,结合自顶向下和自底向上的方法半自动化构建心脏病中文知识图谱。首先,基于高质量百科数据和医学文献构建心脏病本体,为了保证数据的领域封闭性,根据预先定义的疾病词典从百科类网站和医学网站等异构数据源中获取心血管疾病数据;接着,定义实体相似度计算方法进行更好的知识融合,并在图谱数据上通过模式发现寻找最优的数据模式,实现知识图谱模式层和数据层的共同迭代;最后,在图数据库中对图谱数据进行可视化展示,并根据当前研究动态探讨心脏病知识图谱一些具有前景的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号