基于隐马尔可夫模型的转录因子文本挖掘算法 |
| |
引用本文: | 吴晓洲,万里明,韩霄松,梁艳春,吴春国.基于隐马尔可夫模型的转录因子文本挖掘算法[J].吉林大学学报(理学版),2012,50(2):320-322. |
| |
作者姓名: | 吴晓洲 万里明 韩霄松 梁艳春 吴春国 |
| |
作者单位: | 1. 吉林大学 计算机科学与技术学院, 符号计算与知识工程教育部重点实验室, 长春 130012;2. 中国人民解放军空军装备研究院 装备总体论证研究所, 北京 100076,3. 上海理工大学 管理学院, 上海 200093 |
| |
基金项目: | 国家自然科学基金(批准号:61073075) |
| |
摘 要: | 提出一种基于隐马尔可夫模型的转录因子文本挖掘算法(HMM-TFM), 该方法通过建立转录因子名称的词库, 利用谓语筛选策略判断句子是否描述转
录因子, 使用隐马尔可夫模型预测单词词性, 并根据前后文单词词性识别转录因子的名称. 实验结果表明, HMM-TFM在英文文献中抽取转录因子名称的查全率和查准率分别可达74.2%和77.9%.
|
关 键 词: | 隐马尔可夫模型 转录因子 文本挖掘 启动子 生物信息 |
收稿时间: | 2011-12-29 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息 |
| 点击此处可从《吉林大学学报(理学版)》下载免费的PDF全文 |
|