排序方式: 共有60条查询结果,搜索用时 0 毫秒
1.
基于情境的文本中的时间信息分析 总被引:3,自引:2,他引:3
情境用来描述文本中具体的动态和静态事件,时间是其重要因素·为了分析文本中的时间信息,本文首先给出了一个基于情境的文本理解的模型,并在时态逻辑的基础上,提出了文本的时间信息分析方法,它是将事物发展变化的时间顺序作为理解文本的一条重要线索·其主要工作包括:讨论了时间的概念、时间的类型和时间单位的转换机制;分析了命题间的时间关系、对象行为间的时间关系以及事件状态与时间过程的关系;并给出了所使用的时态逻辑 相似文献
2.
基于属性约简的方法,放弃以往复杂的规则匹配算法,提出将约简后的多种属性组进行析取,筛选特征项,并构造分类器.实验结果表明,此算法不仅简单,还能降低维数和提高分类结果. 相似文献
3.
隐喻的普遍性以及在情感表达中的重要作用决定了情感隐喻计算在自然语言处理以及人工智能研究中的重要地位.人工智能不仅要让计算机具有超越人类感知计算的能力,而且要让计算机与人进行情感的交流,而情感隐喻在情感交流中发挥着重要的作用.首先对情感隐喻计算研究的历史加以回顾,阐述各个发展阶段的主要特点和主要成果;然后从情感隐喻的理论基础出发,对情感隐喻资源建设、情感隐喻识别与理解相关研究进行深入的分析和总结,并探讨情感隐喻计算的应用途径,最后提出面临的挑战和对未来的展望. 相似文献
4.
结合排序学习方法, 对电影排名预测任务进行研究。通过挖掘和分析电影媒体网站数据, 完成对排名预测相关特征的抽取与扩展及排名标注的对齐和划分等, 并提出面向电影媒体网站的排名预测模型。实验结果显示, 该模型能有效地提高电影排名预测任务的性能, 在为影视院线合理规划同期电影的上映时间及排片比例、为观影者提供优质热门的电影推荐等方面具有一定的应用价值。 相似文献
5.
药物不良反应事件是造成患者发病、死亡的主要原因之一.传统的基于患者自发报告系统存在较为严重的漏报情况,近年来将推特等社交媒体作为数据来源进行药物不良反应事件检测的研究愈发受到重视.各种深度学习模型通常依赖于大量的训练样本,然而受限于数据来源的特质和耗时的数据标注工作,该领域的相关研究面临标注数据规模小、数据噪声大等问题,制约了这些模型发挥良好的效果.据此,在文本表示层面引入基于图嵌入数据增强和对抗训练两种正则化方法,提升模型在低资源高噪声下的药物不良反应事件检测效果.通过实验,具体分析和讨论两种方法的适用范围,结合卷积神经网络,提出一种同时发挥其优势的药物不良反应事件检测模型,实验结果显示其具有良好的适用性. 相似文献
6.
基于概念和统计的问答系统实现机制 总被引:2,自引:0,他引:2
问答系统与搜索引擎相比答案精练准确、“噪音”较少.为此给出了基于概念和统计的问答系统实现机制.首先确定焦点类型和答案类型,对于不同类型的焦点实行分级概念扩充;以段落为基本单元,利用潜在语义分析技术获取相关文本段落;给出了问题与句子的匹配算法和基于问题相似度的答案抽取算法,通过对语料进行潜在语义索引和增加FAQ反馈,不断增强系统的回答能力.依此研制的大学概况问答系统获得了较好的效果. 相似文献
7.
本文就G为幂零群或G可写成两个子群之直和的情形,给G的Davenport常数D(G)一些非平凡的估计. 相似文献
8.
未链接实体分类是实体链指(Entity Linking, EL)任务中的重要研究内容之一。现有方法存在上下文语义信息不充分、分类准确率低等问题,导致实体链指任务表现不佳。本研究提出一种融合生成式模型的知识增强实体链指方法。该方法将实体链指分为两个子模块,即候选实体排序模块和未链接实体分类模块。本研究基于高精度的候选实体排序模块,获得高质量的知识扩展信息,并对未链接实体分类任务进行知识增强;针对未链指实体提及的分类问题,提出一套生成式框架,该框架能够取得超过基线模型的性能。本研究方法在2020年全国知识图谱与语义计算大会(CCKS2020)评测任务二的中文短文本实体链指数据集上取得了目前最佳性能(整体F值为91.76%),证明知识增强和生成式框架的引入能提高模型的泛化能力,缓解未链接实体分类中的信息不充分问题。 相似文献
9.
追踪事件微博报道:一种流的动态话题模型 总被引:1,自引:0,他引:1
为了解决微博中存在的话题漂移和大量噪声问题,提出了基于动态话题模型和微博信息熵相结合的流的动态话题模型。首先利用动态话题模型在整个追踪过程,从正反两个方面增强对追踪话题的描述,进一步克服了话题漂移问题。但由于微博中存在大量中间类微博,所以定义并使用微博信息熵来衡量一条微博对于话题报道的重要性,并将其扩展到动态话题模型中,用于区分新闻类和中间类微博。在超过17万用户的1 200万条微博上进行了话题追踪,实验结果表明,本文算法较之传统的动态话题模型更有效,追踪结果包含更少噪声。 相似文献
10.
提出了一种基于扩展语义向量的特征表示方法,利用机器学习的方法来解决基因提及标准化中的消歧问题。首先应用高性能的命名实体识别系统识别文献中的基因提及;其次采用不同的搜索策略生成候选结果;再次以扩展语义信息作为特征用机器学习的方法进行消歧;最后利用Wikipedia构建后过滤器对候选结果进行过滤处理。在BioCreative Ⅱ GN任务测试集上的试验表明,该方法的F值达到了83.2%。 相似文献