首页 | 本学科首页   官方微博 | 高级检索  
     检索      

现代哈萨克语词级标注语料库的构建研究
引用本文:古丽拉·阿东别克,达吾勒·阿布都哈依尔,木合亚提·尼亚孜别克,刘晓洁.现代哈萨克语词级标注语料库的构建研究[J].新疆大学学报(理工版),2009,26(4):394-401.
作者姓名:古丽拉·阿东别克  达吾勒·阿布都哈依尔  木合亚提·尼亚孜别克  刘晓洁
作者单位:新疆大学信息科学与工程学院,新疆乌鲁木齐830046
基金项目:国家自然科学基金项,国家教育部语信司项目 
摘    要:建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨克语语料库构建研究,首先介绍了不同语言语料库的国内外研究现状,随后针对语料库构建中涉及的主要问题,实现了哈萨克语词级基本语料库的设计与构建.

关 键 词:哈萨克语  语料库  语料库构建  词附加成分的切分  词性标注

A Study of Word Tagging Corpus for the Modern Kazakh Language
Gulila Altenbek,Dawel Abilhayer,Muheyat Niyazbek,LIU Xiao-jie.A Study of Word Tagging Corpus for the Modern Kazakh Language[J].Journal of Xinjiang University(Science & Engineering),2009,26(4):394-401.
Authors:Gulila Altenbek  Dawel Abilhayer  Muheyat Niyazbek  LIU Xiao-jie
Institution:(Information Science and Engineering Colleges, Xinjiang University, Urumqi, Xinjiang 830036, China)
Abstract:The basic work for buiding up a high-standard word-tagging corpus lies in the natural language information processing of modern Kazakh language(KML). This paper intruduces the recent developments of corpus research in different languages befor it starts to design and configurate a word-tagging corpus of KML, it carries forward the research of the word-tagging corpus of KML, including the integrating morphological processing, affixe segmentation tagging and part-of speech (POS) tagging in light of the peculiarities of the KML.
Keywords:Kazakh Language  Corpus  Corpus Construction  affixes segmentation  POS
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号