排序方式: 共有60条查询结果,搜索用时 31 毫秒
31.
立场检测任务的目的是通过分析用户对特定话题发表的评论以判断其对该话题是支持还是反对的,该任务的关键是捕捉文本信息与其对应话题的相关特征。针对目前已有的微博立场检测模型存在仅考虑文本特征,而未结合话题特征,以及忽略了情感信息对微博立场检测的影响而导致分类效果差的问题,文章提出基于卷积注意力的情感增强微博立场检测模型。该模型通过卷积注意力对文本信息和其对应的话题信息提取特征,同时捕捉其相关特征,然后通过情感增强中词语级情感增强获得带有情感信息的词向量表示,将其与相关特征点相乘得到针对话题的情感增强句向量,其次通过拼接句子级情感增强特征以丰富最终的语义表示,最后对该语义表示进行分类。该模型在NLPCC-2016数据集中取得了较好的结果,相对于目前最优模型在五个话题上分别提高了7.9%、5.8%、5.3%、1.3%和5.2%。 相似文献
32.
将传统的词袋思想进行扩展,把文档看成由句子组成的句袋,通过依存句法分析得到句袋与查询中词间的依存关系。利用两者依存关系的匹配程度,计算冗长查询和初次检索返回文档之间的相似度,对初始检索结果进行重排序。通过在TREC标准数据集上的实验,证明该方法能够较有效地解决查询的冗长导致偏离查询主题和低召回率情况下相关文档排序靠后的问题。特别是对于低召回率的情况,检索结果的MAP值和P@N都有显著提高。 相似文献
33.
幽默作为一种特殊的语言表达方式,是生活中活跃气氛、化解尴尬的重要元素。随着人工智能的快速发展,如何利用计算机技术识别和生成幽默成为自然语言处理领域热门的研究内容之一,并逐渐形成一个新兴研究领域:幽默计算。幽默计算致力于利用自然语言处理技术理解和识别包含幽默的文本表达,挖掘幽默表达潜在的语义内涵,构建面向幽默表达的计算模型。首先对当前幽默计算的背景进行概述,阐明幽默的可计算性和幽默计算对于人工智能的意义;在此基础上,对幽默研究的发展情况进行回顾,给出幽默研究的语言学基础;然后综述当前幽默计算在幽默识别和幽默生成两个方面的进展情况,分别给出针对幽默识别和幽默生成的计算框架;最后,对幽默计算在聊天机器人、机器翻译、儿童教育软件和外语教学等多个自然语言处理任务中的应用前景和应用模式进行展望。希望通过对幽默计算及其应用研究的总结和概述,完善现有幽默计算模型,增进计算机对于自然语言的理解,推动人工智能的进一步发展。 相似文献
34.
蛋白质关系网络的权重设置对蛋白质络合物的抽取有着较大的影响.综合考虑蛋白质关系网络的拓扑结构特征和生物信息特征,提出一种新的权重设置策略,并向原有蛋白质关系网络中添加高可信度关系.基于修正后的蛋白质关系网络,用监督学习方法抽取蛋白质络合物,在DIP数据集上,F值达到0.5705. 相似文献
35.
隐喻是自然语言中比较常见的语言现象,在情感计算过程中有些句子的情感是由隐喻引起的,因此隐喻问题的解决将影响情感计算的结果.为此结合相关的隐喻理论,从机器学习的角度,对汉语文本中的显性隐喻的识别进行研究.以本体和喻体所属的范畴不同作为切入点,首先利用词性标注和依存句法分析提取句子中的本体词汇和喻体词汇,然后进行范畴划分和词汇语义相似度计算,最后使用支持向量机进行学习,从而对特定的隐喻句子进行识别.这一研究对后续的隐喻自动识别和隐喻理解起到了一定的作用. 相似文献
36.
提出了基于知网概念特征的文本综述方法,探讨了语句相似度计算、主题区域发现、新颖度获取和综述生成等关键技术.通过对知网的改造,获取了关键词的概念特征,实现了同义词概念扩充,在文档语义相关性基础上,实现了多文档的自动综述.采用一种基于综合评价理论的文本综述评价方法,从综述的表达质量、表述内容和基于Q8LA的信息性评价三个方面实现了对综述的评价.实验结果表明该方法有效可行. 相似文献
37.
排序学习已经在信息检索和机器学习领域中获得了广泛的关注,一系列的排序学习理论主要是基于3种排序样本构造方法提出的,分别是:单文档方法(pointwise)、文档对方法(pairwise)、文档列表法(listwise)。特别地,文档列表法中的组排序的方法可以有效地提高排序的性能。将这些方法与损失函数相结合来提高组排序的性能,基本思想是融合不同的损失函数来扩充基于神经网络方法的损失函数。首先,本文提出了一种基于J氏距离(Jeffrey’s divergence)的组样本损失函数的构造方法;然后,基于该组排序的方法,提出了一种与其他损失函数进行融合框架,在LETOR3.0数据集上比较了所提出方法的性能;最后,实验结果表明所提出的加权损失函数融合方法能够有效地提高查询的相关性排序结果。 相似文献
38.
用户成长值反映用户粘性,预测用户成长值有助于实现精准营销。聚焦用户成长性画像研究,针对用户原始数据记录复杂多样、难以提取有效特征的问题,通过散点图分析挖掘影响用户成长值的因素,提取行为特征和相对稳定的时间特征,并对比基于树的特征筛选算法和L1范数进行特征筛选。针对已标注成长值的用户数据不足问题,改进COREG算法,通过半监督学习模型丰富训练数据,提高模型的预测准确度,同时降低原算法的时间复杂度,最后采用模型融合整合不同模型的优势。在CSDN博客平台提供的SMP CUP 2017数据集上进行实验,结果表明,建立的模型有效地提高了泛化能力和预测准确度。 相似文献
39.
本文针对当前股票资讯服务中存在的实时性差、个性化缺乏和准确性不足等问题,设计并实现了一个基于资讯价值的股票资讯移动订阅系统。系统应用开源的Lucene和Weblech工具进行垂直搜索获取资讯,根据经济学知识构建个性化股票本体,通过查询扩展、本体匹配生成个性化的RSS种子,依据资讯价值进行排序,在移动端使用KXML进行解析,实现了资讯订阅。实验结果证明,本系统提供的股票资讯服务是有效的。 相似文献
40.
化学物(药物)致病关系在生物医学领域广受关注。文章提出一种从生物医学文献中抽取化学物致病关系的方法 MICNN,首先基于多示例学习的思想,将化学物疾病实体对与多个示例对齐,然后训练一个文档级别的卷积神经网络,使用多示例同时抽取位于同一文档中句间和句内级别的化学物致病关系,有效减弱了现有方法中因单示例存在噪音而对抽取性能造成的损害。实验结果表明,MICNN仅使用了词向量特征、位置特征和实体特征三种基本特征,就在BioCreative V CDR任务提供的测试集上取得很好的性能表现。 相似文献