首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文电子病历文本中的时间识别算法研究
引用本文:孙健,高大启,刘珉,高炬,阮彤.中文电子病历文本中的时间识别算法研究[J].山西大学学报(自然科学版),2018(1).
作者姓名:孙健  高大启  刘珉  高炬  阮彤
作者单位:华东理工大学信息科学与工程学院;上海曙光医院;
摘    要:时间作为电子病历中的一类重要实体,对于标识患者从入院到出院期间不同阶段的病情变化,有着不可替代的作用。电子病历文本中的时间可分为独立时间和基于事件的时间,针对这两类时间分别提出了基于bootstrapping的识别算法和基于条件随机场的识别算法。其中,为了解决基于事件的时间短语太长而不能准确定位其边界的问题,引入了中文症状知识库作为词典特征,有效地提高了条件随机场识别结果的准确率、召回率和F1值。实验结果表明,该方法在独立时间和基于事件的时间识别上的F1值分别达到了92.57%和93.98%。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号