首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
庞宁  杨尔弘 《太原科技》2007,160(5):61-62
人称代词消解是文本信息处理中的一项重要任务,目前,网络上大量涌现关于突发事件的新闻,针对这类语料的人称代词消解技术可以帮助实现网页文本的信息处理。分析了中文突发事件语料中人称代词的特点,提出一种基于语料库,运用最大熵模型与规则预处理方法结合的代词消解方法。实验表明,利用该方法,可使测试语料上算法的F值达到70.9%。  相似文献   

2.
事件指代消解任务比实体指代消解难度大, 主要原因为事件描述在非结构化文本中分布稀疏, 且不具备同指关系的单链占很大比例, 同时事件自身承载的语义信息比实体更加丰富。为了准确地抽取文本中的同指事件, 针对以上特点, 提出一种融合篇章表征的事件指代消解模型。该模型通过CRF有效地区分非事件句、单链以及同指链, 同时利用分层注意力机制捕捉句子级别和篇章级别的重要信息。在KBP2015和2016数据集上进行的事件指代消解实验验证了该模型的有效性, 在CoNLL评测标准下F1值达到43.07%。  相似文献   

3.
生物医学文本中的指代消解是生物医学信息抽取领域的一个重要组成部分.通过引入双代价参数对基本SVM方法进行改进,并在FlyBase语料集上进行了测试,准确率、召回率、F值分别达到53.9%、69.5%、60.7%.同时研究了特征向量的选择和取值对于实验结果的影响.最后与其他先进方法进行了对比.结果表明,在同样的语料上,基于双代价参数SVM方法优于其他先进的方法.  相似文献   

4.
针对中文人称名词短语单复数属性信息不明确,对消解贡献低的问题,利用改进的最大熵模型提出了人称代词消解新的模型.该模型在原有特征的基础上增加了人称名词短语单复数识别的Head特征、Qun特征和Len特征.在真实文本环境下与不使用单复数属性信息方法进行了对比实验,结果表明该方法的F值与不使用单复数属性信息方法的F相比有一定的提高.  相似文献   

5.
中文篇章零元素语料库构建   总被引:1,自引:0,他引:1  
针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作。首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性。然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC语料库的构建。最后, 对该语料库进行一系列详细的统计分析。结果表明, CDZC能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持。  相似文献   

6.
针对指代消解一直是自然语言处理中的核心问题, 提出一种利用DBN (deep belief nets)模型的Deep Learning 学习机制进行基于语义特征的指代消解方法。DBN模型由多层无监督的RBM (restricted Boltzmann machine)网络和一层有监督的BP (back-propagation)网络组成, RBM网络确保特征向量映射达到最优, 最后一层 BP 网络可以对RBM网络的输出特征向量进行分类, 从而训练指代消解分类器。在 ACE04 英文语料及ACE05中文语料上进行测试, 实验结果表明, 增加RBM训练层数可以提高系统性能。此外, 引入对特征集 合的抽象分层因素, 也对系统性能的提升产生积极作用。  相似文献   

7.
中文句子中如果没有主语,句子依然可以是正确的,然而英文的句子如果没有主语往往是错误的。本文采用问卷调查法,试图找出中文零主语现象是否影响学生学习英语效果。结果显示,中文零主语现象对不同专业不同年级学生学习英语影响程度不同。对于中文零主语现象的认识不足,或没有足够的知识来处理两种语言主语差异现象,能影响到英语学习的进步。因而,重视中英文句子主语差异性对教师和学生都非常重要。  相似文献   

8.
以某大学图书馆2009年中文新书为样本,从整体概况、图书分类、图书主题、出版项等指标对零借阅图书进行了统计及分析,并给出了提高图书利用率的建议。  相似文献   

9.
基于语篇表述理论的汉语人称代词的消解研究   总被引:4,自引:0,他引:4  
人称代词的指代消解是自然语言处理中语篇理解的关键问题之一.语篇表述理论(DRT)独特的语篇表述结构(DRS)构造方法为指代消解提供了新的思路.本文在语篇表述理论的基础上,针对汉语书面语,提出一种面向语篇理解的汉语人称代词的指代消解方法,并在语篇表述结构的构造过程中实现汉语人称代词的指代消解.  相似文献   

10.
中文人称代词消解研究   总被引:1,自引:0,他引:1  
代词消解是文本信息处理中的一个重要任务,为了提高中文人称代词消解的准确性,文章在大规模语料的基础上,分析了中文网页突发事件语料中人称代词的特点,提出了最大熵模型算法和决策树算法两种算法,并对比了这两种算法的中文人称代词的消解效果.  相似文献   

11.
汉语的欧化现象一直是众多作家学者讨论的一个热点话题。有人认为汉语语法变化主要是汉语自身不断发展的结果,有人则认为汉语语法变化主要是受英语语法的影响。本文试图通过分析汉语第三人称代词的变化并跟英语第三人称代词进行对比来看待这种欧化现象。另外我们应该辩证地看待”欧化”现象,既防止英语第三人称代词汉译过度欧化,又能恰当地吸收英语中的有益成分来丰富和发展汉语。  相似文献   

12.
汉语方言人称代词声调的相互感染致使我、你、他等同调,这是河南、关中以至于许多南方方言比较普遍的现象,如河南等地第三人称单数他字,受我、你两个上声字的感染作用也读作上声。汉语方言的指示代词应当是近指和远指二分,而不应当有所谓近指、中指、远指的三分或其他多分。学术界应当加强对疑问代词等的研究。客家话等南方方言的本字应当是我。  相似文献   

13.
在简述数值微分零交点法分辨重叠谱的原理基础上,研究了该方法对不同分离度的两组分重叠谱图的分辨效果.结果表明,对于两条高斯型重叠谱线,当分离度R≥0.07时,可有效地分辨两组分的谱图.对于前舌和拖尾的重叠谱体系,实现有效分辨的分离度的最低限也随峰变形程度的增加而增大.以L-色氨酸和DL-酪氨酸两组分重叠紫外光谱图的分辨为例,讨论了方法在两组分同时测定中的应用.  相似文献   

14.
中文句子倾向性分析   总被引:1,自引:0,他引:1       下载免费PDF全文
针对句子的倾向性进行判断,采用SentiWordNet构建中文倾向性词表,通过剔除停用词等降低句子向量的维数,以此来提高句子向量化速度,然后利用支持向量机分类器进行句子倾向性判断,最后提出两种新的置信度计量方法对倾向性句子进行排序.实验结果表明,构建的识别系统在一定程度上能有效识别倾向性句子.  相似文献   

15.
非负矩阵因子分解是对非负数据处理的一种多元统计分析方法.NMF分解结果没有“负值”,易于理解和解释,具有比较明确的物理化学意义.由于其多解的特征,文献介绍的NMF算法并不能直接用于化学混合信号解析.作者根据化学波谱的基本特征(化学波谱的平滑性、色谱的单峰性以及质谱的稀疏性)对NMF算法进行了改进,缩小了其多解范围.应用改进的NMF进行模拟HPLC-DAD型两维数据和苍术GC/MS实验数据解析,得到了比较理想的结果.  相似文献   

16.
文言文与现代汉语差异极大,如何有效提高文言文的学习水平是困扰众多文言文学习者的一大难题,但以文言文与现代汉语的联系为落脚点和出发点,借助现代汉语语法分析并掌握文言文学习中的两大难点却是行之有效的方法。  相似文献   

17.
本文从认知的角度出发,主要以复句、单句以及介于两者之间的紧缩句为对象,对这些句子中的因果关系的表达法及实质作归类总结,试图从认知和句法学的角度找到分析因果关系的契合点,从而探索汉语因果句的英译技巧.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号