中文电子病历文本中的时间识别算法研究 |
| |
引用本文: | 孙健,高大启,刘珉,高炬,阮彤.中文电子病历文本中的时间识别算法研究[J].山西大学学报(自然科学版),2018(1). |
| |
作者姓名: | 孙健 高大启 刘珉 高炬 阮彤 |
| |
作者单位: | 华东理工大学信息科学与工程学院;上海曙光医院; |
| |
摘 要: | 时间作为电子病历中的一类重要实体,对于标识患者从入院到出院期间不同阶段的病情变化,有着不可替代的作用。电子病历文本中的时间可分为独立时间和基于事件的时间,针对这两类时间分别提出了基于bootstrapping的识别算法和基于条件随机场的识别算法。其中,为了解决基于事件的时间短语太长而不能准确定位其边界的问题,引入了中文症状知识库作为词典特征,有效地提高了条件随机场识别结果的准确率、召回率和F1值。实验结果表明,该方法在独立时间和基于事件的时间识别上的F1值分别达到了92.57%和93.98%。
|
本文献已被 CNKI 等数据库收录! |
|