首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于柯南·道尔作品的文本聚类应用与探究
作者单位:;1.新疆财经大学统计与信息学院;2.中国人民大学应用统计科学研究中心;3.中国人民大学统计学院;4.兰州财经大学统计学院
摘    要:风靡世界的侦探小说《福尔摩斯探案集》的写作几乎贯穿作者柯南·道尔爵士的一生,但其写作风格并非一成不变。本文从《福尔摩斯探案集》本身出发,以57篇侦探故事为研究对象,构建词频、词长、单词数、标点出现频率等语言要素指标,利用文本聚类技术对柯南·道尔写作风格进行研究,从统计语言学的角度揭示了不同时期柯南·道尔写作风格的变化。研究结果表明,根据写作风格的不同,柯南·道尔的创作生涯大致可分为两个阶段,且风格的转变与其私人生活的变故、宗教信仰的转变等密切相关。社会大环境的变迁以及作家个人坎坷的人生路程,都是其写作风格发生变化的重要原因。在分析文学作品时,应该紧密联系作者当时所处的社会环境和个人经历,才能对作者有更深刻的理解。通过柯南·道尔作品的文本聚类后,我们对柯南·道尔的生平进行梳理,不难发现1893、1901、1907以及1926年这几个特殊时点可能是与道尔的人生轨迹由第一阶段转变到第二阶段有紧密联系的。

关 键 词:文本聚类  K-means算法  层次聚类算法  柯南·道尔

Application of Text Clustering Technique on Conan Doyle's Works
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号