基于生存法则的稳定新词识别方法的研究 |
| |
引用本文: | 符贤哲,刘胜全,刘艳,郭竹为,赵美玲.基于生存法则的稳定新词识别方法的研究[J].新疆大学学报(理工版),2018(1). |
| |
作者姓名: | 符贤哲 刘胜全 刘艳 郭竹为 赵美玲 |
| |
作者单位: | 新疆大学软件学院;新疆大学网络与信息技术中心;新疆大学信息科学与工程学院; |
| |
摘 要: | 针对新词识别过程中出现大量噪声词和伪新词的问题,提出一种基于生存法则模型的稳定新词识别方法.该方法借鉴自然法则和遗忘定律,分析候选词串在时序分布中的词频变化,通过词串在语言环境中表现的综合竞争力淘汰突发性特征的噪声词以及词义不稳定的伪新词,识别网络短文本中出现的稳定新词.该方法可以保证网络新词的新颖性和稳定性,可为舆情本体新概念的抽取提供基础支持,有助于提高舆情本体概念抽取的准确率和查全率.
|
本文献已被 CNKI 等数据库收录! |
|