排序方式: 共有73条查询结果,搜索用时 15 毫秒
1.
汉语属于汉藏语系,和英语等语言不同的是:它不是以一个个单词的形式出现,词与词之间没有空格等明显的分割标记。中文分词是现代中文信息处理的基础,是汉语自然语言理解与处理、机器翻译、智能检索、电子词典等信息处理的前提。中文分词系统的好坏将直接影响以中文分词系统为基础的系统的性能。因此对中文分词系统的评测就是一件十分有意义的事。 相似文献
2.
电子化资源的利用能提高语言研究的效率、确保语言研究过程的普遍性、客观性,从而提高语言研究的质量和可信度。无论是调查先行研究还是研究过程中的论证,都可以利用电子化资源辅助。在信息化快速发展的今天,我们还可以自制电子化资源库,以充分利用这一便利的工具合理、循环地为研究服务。 相似文献
3.
In order to improve the naturalness of TTS speech so as to represent the cadence of natural speech, it is necessary to have a study on the pitch of spontaneous speech. Based on the 973 telephone corpus, the pitch ranges and pitch registers of 1084 intonation phrases are analyzed. It is found that intonation phrases can be classified according to their ranges and registers, and this is related to their positions in dialogue exchange. Compared with read speech, the pitch patterns in dialogue are more variable. 相似文献
4.
5.
7.
8.
《现代电子技术》2019,(18):45-49
传统归类方法采用自动标引主题词变换成分类号实现自动分类,该方法分类过程复杂,应用性差。因此,提出一种基于文本特征识别的电子档案自动归类系统。该系统采用电子档案语料库模块根据使用者需求挖掘语料,实现语料库构建、查询、清除和维护等操作;通过电子档案排版模块,基于内容映射的方式排版电子档案;在此基础上采用有限自动机选择法和组合特征选择法选取文本内特征词,识别电子档案文本特征后,通过SVM分类器和类别识别器两次归类过程,判断电子档案最终类别归属。封闭性归类测试和开放性归类测试结果表明,该系统的平均查全率和精度都高于95%,且不同信噪比环境下,系统平均中断概率为0.17%,低于对比系统。 相似文献
9.
10.