首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 8 毫秒
1.
通过探索知识图谱在产业集群的应用,提出了产业集群知识图谱整体设计框架,设计了产业集群知识图谱中实体及其关系本体模型。选取宁波市注塑机产业集群为例,通过互联网平台获取企业数据,经过数据预处理、知识抽取和知识融合,依据本体模型构建了宁波市注塑机产业集群知识图谱,将所构建的所有三元组存储于Neo4j图数据库中。根据所构建的知识图谱,分析注塑机集群整体特性,通过分析发现产业集群在地理位置临近关系上和业务往来有着密切的关系,验证本文提出方法的可行性。  相似文献   

2.
目前知识图谱领域构建的图谱多以静态知识图谱为主,数据集较大时,构建出的静态知识图谱的规模会非常大,且存在可读性差、交互性低等问题,非常不利于信息的动态浏览和筛选.为解决这一问题,应以增加知识图谱的动态交互性为目标来完成动态知识图谱的构建.将从知识图谱的体系架构、本体建模等方面进行系统探索,给出基于本体建模的动态知识图谱...  相似文献   

3.
由于国家在一个时期内的科技投入的方向和强度最能反映出国家未来科技发展趋势,本研究提出构建基于科技投入和核心技术的政策要素知识图谱,意欲分析得出各国科技发展方向及趋势的情报,从而支撑科技发展布局与趋势研判.本研究总结了情报监测的科技政策文本中支撑情报分析的关键要素,提出了基于政策要素的知识图谱模型,探索了智能计算的政策分析方法.通过对美国、英国、法国、德国、日本和韩国近年科技投入的优先领域、技术、资助项目、资助强度等相关知识的信息抽取和内容分析,形成了基于领域的政策知识图谱,并利用两个实例演示了基于知识图谱的情报检索与分析效果.本技术对情报分析人员、决策人员审视宏观科技布局和前瞻科技发展方向有所帮助.  相似文献   

4.
依照所回答的问题类型区分,图像和文本的视觉问答大体分为2类,第1类是可以从图像中直接获取答案的问题,第2类是需借助外部知识获取答案的问题。目前的视觉问答方法只能在一类问题上具有较高的准确率,回答另一类问题的技术尚不成熟。为了扩大可回答的问题类型,设计了一种知识图谱辅助下的视觉问答方法——K-VQA。在基于深度学习VQA的基础上,通过查询知识图谱区分问题类型,对不同类型的问题采用最合适的方法进行回答,对于需借助外部知识进行回答的问题,利用图像和问题中的信息判断回答问题所需的实体和属性,抽取知识图谱中的三元组,获取问题答案。结果表明,不同的视觉问答技术适用于不同类型的问题,K-VQA方法既能回答简单问题也能回答推理性问题,准确率高达56.67%。因此,作为知识图谱辅助下的视觉问答方法,K-VQA可以回答更多类型的问题并获得较高的准确率,对于深入研究VQA和VQA方法具有重要的参考价值。  相似文献   

5.
针对多数据源的融合应用,构建了基于多数据源的知识图谱.首先,对不同领域内的数据源构建相应本体库,并将不同本体库通过数据融合映射到全局本体库;然后,利用实体对齐和实体链接方法进行知识获取和融合;最后,搭建知识图谱应用平台,提供查询和统计等操作.在实体对齐方面,利用传统的基于相似性传播实体对齐方法,获得良好的实体对齐效果;在实体链接方面,提出了基于约束嵌入转换的预测推理方法,实验结果表明,在预测准确率上取得较好的结果.  相似文献   

6.
基于知识图谱嵌入模型, 提出一种知识图谱嵌入评分与链路评分相结合的评分方法, 以解决中文领域的多跳知识图谱问答任务, 与传统的单跳知识问答方法相比适用性更广. 该方法在搜索最优答案的同时构建一个查询链路, 通过查询给出答案集合, 从而有效缓解了现有方法中遗漏答案的情况. 在NLPCC-MH数据集上的实验结果表明, 该方法在多跳问题上的平均F1值为0.653, 显著优于对比方法. 真实知识图谱通常存在链路缺失的情况, 实验以随机丢弃25%三元组的方式模拟了知识图谱的稀疏性, 结果表明该方法在这种情况下仍然有效.  相似文献   

7.
通过梳理知识图谱行业发展脉络,可以得出知识图谱技术概况、分布特征以及目前知识图谱行业的市场需求和研究方向.在文献调查的基础上,运用HimmPat数据库对知识图谱技术专利文献从专利申请趋势、专利技术构成、专利申请地域分布、专利受理地域分布和专利申请人5个方面,进行描述性统计、比较分析和因果分析.结果表明,知识图谱技术正处于高速发展的成长期,其前沿核心技术尚未成熟,专利申请和受理以及全球重要申请人的分布主要表现为中美之间激烈的竞争.  相似文献   

8.
互联网的普及极大地促进了在线招聘平台的发展,如何利用有效的算法在海量的职位和简历库中自动匹配符合岗位要求的简历,是构建在线招聘系统的难点之一.为解决上述问题,本文融合知识图谱和文本语义相似度算法,提出了一种采用字符搜索寻找符合岗位要求的简历子集和根据文本语义相似度对所得子集进行排序的两阶段方法.实验结果表明,基于BER...  相似文献   

9.
通过知识表示学习方法将产品和指标表示为低维分布式向量,为后续的产品指标补全和产品设计方案预测奠定基础。然而现有的知识表示学习方法只处理实体-关系之间的离散型关联,而对于数值型指标的研究尚属空白。为此,文章依托复杂产品指标图谱的实际业务需求,设计了产品数值型指标的表示学习策略。针对关系三元组和指标三元组的语义差异,探索全新的联合学习训练方案。文章在五个前沿知识表示学习算法上进行实验,其中基于依次学习训练方案的ConvE算法,在图谱链接预测任务上Hit@10指标达到了最优的90.27%。实验结果验证了本文数值型指标表示方法和联合训练方案的有效性。  相似文献   

10.
如今随着互联网的发展,数据呈现的方式大不相同,然而知识图谱的出现,给人们提供了一种更好地组织、管理和理解海量信息的能力.知识图谱质量的高低与实体以及实体之间的关系存在密不可分的关系,从实体角度出发,研究实体识别方法.如今大多数深度学习模型对实体识别效果不错,但在语义信息方面没有考虑上下文信息,并且模型体积庞大,参数数量多,导致模型预测结果与真实结果误差大,能耗高.提出了一种ELECTRA模型与神经网络模型结合来进行命名体识别的方法,该方法降低能耗以及提升训练速度,同时又提高了实体识别的准确率等.该组合模型分为三块:首先对ELECTRA模型进行改进,输入文本进行[cls]以及[seq]处理,避免实体边界模糊问题.然后进行随机15%的Mask机制,经生成器预测,再经判别器判别,形成字向量.其次将字向量引入双向长短期记忆网络BiLSTM中,进行上下文语义增强后将句子序列打分.最后通过条件随机场CRF层找到最优的序列标签.实验结果表明,该方法在医疗语料库进行实体识别时,准确率为97.94%、召回率为95.41%、F1值为95.44%、精确率为95.46%,与已有的方法相比,提出的方法效果提升明...  相似文献   

11.
以产科专业叙词表、临床路径和诊疗规范等为数据来源构建了中文产科知识图谱(Chinese obstetric knowledge graph, COKG)。以产科疾病为核心,依据术语标准及已有主题词表,确立了概念分类体系及关系描述体系,形成了COKG模式层;在Bi-LSTM-CRF和PCNN模型的基础上,通过医学专家的指导对多来源的200余万字非结构化文本进行人工校对,并对多源数据进行知识融合,形成了COKG数据层。所构建的COKG包括2 343种疾病、15 249个实体关系,可以为医疗问答系统和智能辅助诊疗等应用提供结构化的知识支持。  相似文献   

12.
为了能够更加及时有效地组织、管理和利用电力系统中的海量数据,需要利用知识图谱技术将其转化为电力相关知识,以帮助电力调度人员进行决策。本文在已有数据库的基础上,通过使用长短期记忆网络(long short-term memory,LSTM)+条件随机场(conditional random field,CRF)结构的框架进行电力知识的实体抽取,再利用脉冲耦合神经网络(pulse coupled neural network,PCNN)神经网络模型对数据库中的实体进行关系抽取,提取相关的电力知识,有效地改善了知识抽取的准确性与抽取速度。  相似文献   

13.
文本观点检索旨在检索出与查询主题相关并且表达用户对主题观点的文档。由于用户查询时输入通常很短,难以准确表示查询的信息需求。知识图谱是结构化的语义知识库,通过知识图谱中的知识有助于理解用户的信息需求。因此,提出了一种基于知识图谱的文本观点检索方法。首先由知识图谱获取候选查询扩展词,并计算每个候选词扩展词分布、共现频率、邻近关系、文档集频率,然后利用4类特征通过SVM分类得到扩展词,最后利用扩展词对产生式观点检索模型进行扩展,实现对查询的观点检索。实验表明,在微博和推特两个数据集上,与基准工作对比,所提出的方法在MAP、NDCG等评价指标上均有显著的提升。  相似文献   

14.
为解决数控(computer numerical control, CNC)机床设计知识图谱构建过程中关键实体的抽取问题,制定了数控机床领域知识分类标准和标注策略,构建了领域数据集,并提出了一种基于RoBERTa(robustly optimized BERT pretraining approach)的数控机床设计知识实体识别方法。首先,利用数控机床领域数据集对RoBERTa模型进行微调,再利用RoBERTa对文本编码,生成向量表示;其次,采用双向长短期记忆(bidirectional long short-term memory, BiLSTM)网络提取向量特征;最后,利用条件随机场(conditional random field, CRF)推理出最优结果,进而为实体打上标签。实验结果表明:模型在数据集上的F1值为86.139%;对多数关键实体的F1值大于85%;相比其他模型提升2%~18%。可见该方法在数控机床设计知识实体识别中具有明显优势,能够识别机床设计知识文本包含的关键实体,为数控机床设计知识图谱构建提供了数据基础。  相似文献   

15.
胡淼  黄清泉  杨爱红  余发新 《江西科学》2023,41(2):244-249+271
为了解猕猴桃相关研究现状及路径变化,利用Citespace软件,对Web of Science核心合集中1992—2021年间发表的猕猴桃相关的3 327篇论文数据,以及CNKI核心期刊1992—2021年间发表的猕猴桃相关的3 462篇文献数据,进行定量可视化分析。结果显示:1992—2021年间,猕猴桃领域年发文数量整体呈波动上升趋势。新西兰和中国的发文量远高于其他国家。分析表明,猕猴桃领域研究集中于脂氧合酶基因表达、酚类化合物、花青素的生物合成、乳胶过敏以及猕猴桃细菌性溃疡病等方面,当前研究热点在酚类化合物、花青素的生物合成、细菌性溃疡病等方面。  相似文献   

16.
17.
如何将材料领域知识与机器学习技术相结合是材料智能研究迫切需要解决的问题. 知识图谱(knowledge graphs, KGs)作为一种高效的知识组织模型, 可以有效地对材料领域知识进行表示、组织和推理, 从而提升材料机器学习算法的智能水平. 研究了基于自然语言处理技术的材料领域知识自动获取方法, 提出了基于双向门控循环单元-图神经网络-条件随机场(bidirectional-gated recurrent unit-graph neural network-conditional random field, Bi-GRU-GNN-CRF) 的材料实体关系联合抽取方法, 以及基于改进 TextRank 算法的材料工艺知识抽取方法, 实现了从专利、论文等材料文献中自动获取材料实体、关系、工艺流程等材料领域知识. 实验结果表明, 所提出的材料知识获取方法具有较好的精度和召回率, 能够有效提升材料知识图谱的知识覆盖度. 基于该方法构建的材料领域知识图谱的知识覆盖率达到了80%, 能够为材料智能研发提供更加全面的知识支撑. 同时, 构建了非调制特殊钢、铝基复合材料、热障陶瓷涂层材料 3 个材料领域知识图谱, 并进行了应用探索, 进一步验证了知识图谱为材料研发提供知识支撑的可能性.  相似文献   

18.
跨境民族文本分类任务是跨境民族文化分析中的基础性工作,其目的是将跨境民族文化文本进行归类处理。针对跨境民族文化数据分类面临类别交叉的问题,提出融合领域知识图谱的跨境民族文本分类方法,利用跨境民族文化知识图谱对文本中的跨境民族实体进行语义扩展,通过实体在知识图谱中的类别特征来增强文本的类别语义特征。此外,通过掩码自注意力机制分别对文本的词级、句子级进行特征提取以此得到文本中句子的局部特征和全局特征。实验表明,本文方法在跨境民族文化数据集中相比基线模型的F1值提升了11.9%。  相似文献   

19.
近年来,基于智能感应材料的增材制造技术即4D打印技术已愈发引起学者和社会的广泛关注。基于中国知识基础设施工程(Chinese knowledge infrastructure engineering search platform, CNKI)检索平台,设计针对4D打印研究领域的文献数据挖掘分析框架,构建数据库,以CiteSpace等软件为支撑进行量化研究。研究结果表明,中国4D打印研究领域科技文献发文量总体呈现指数式增长规律,在历经稳定增长阶段后,进入了快速增长期。该技术领域核心研究机构与核心作者集群重合,且呈现集群内小规模合作、集群间合作不足的特点。在微观技术分化趋势层面,4D打印研究已分化为打印材料、记忆效应、技术应用三大类;在宏观技术热点演化层面,目前该技术研究呈现出从概念集中探索到研究领域多样化的特点,向着基于4D打印超材料的研究方向发展,判断该发展趋势也是该领域未来技术机会。  相似文献   

20.
与现有的根据知识图谱的结构信息或实体属性特征进行相似度匹配的实体对齐的方法不同,提出了一种基于表示学习的知识图谱实体对齐方法.首先,在低维向量空间下,通过机器学习方法学得实体和关系的语义表示,这种表示形式蕴含了知识图谱的内在结构信息及实体属性特征;其次,将人工标注的实体对作为先验知识,学习知识图谱间实体对的映射关系.经实验验证表明:与基于特征匹配的方法SiGMa相比,本文方法能够有效提高知识图谱实体对齐的精确率,同时保持较高的F1值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号