首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于核方法的潜在语义文本分类模型
引用本文:罗远胜,王明文,曾雪强.基于核方法的潜在语义文本分类模型[J].清华大学学报(自然科学版),2005,45(9):1853-1856.
作者姓名:罗远胜  王明文  曾雪强
作者单位:江西师范大学,计算机信息工程学院,南昌,330027;江西师范大学,计算机信息工程学院,南昌,330027;江西师范大学,计算机信息工程学院,南昌,330027
基金项目:教育部重点科技资助项目(03070);江西省自然科学基金资助项目(0311041)
摘    要:在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高.为了提高分类性能,通过引入核函数,给出了一种非线性的潜在语义文本分类模型.该模型比LSC模型能更好地表示文档空间的潜在语义结构信息.在Reuter-21578文档集上的实验结果表明,潜在语义文本分类模型有很好的分类性能.

关 键 词:文本分类  核方法  潜在语义索引  偏最小二乘分析  核偏最小二乘分析
文章编号:1000-0054(2005)S1-1853-04
修稿时间:2005年5月20日

A kernel latent semantic classification model
LUO Yuansheng,WANG Mingwen,ZENG Xueqiang.A kernel latent semantic classification model[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1853-1856.
Authors:LUO Yuansheng  WANG Mingwen  ZENG Xueqiang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号