1/39
0/100
您的浏览器不支持进度条
下载所得到的文件列表
面向中文电子病历的NLP关键技术研究.ppt
文档介绍:
面向中文电子病历的NLP关键技术研究2014年4月13日******@2014HITAllRightsReserved蒋志鹏关毅哈尔滨工业大学计算机学院xyf-3456@电子病历(EMR)医务人员在医疗活动过程中,使用医疗机构信息系统生成的文字、符号、图表、图形、数据、影像等数字化信息,并能实现存储、管理、传输和重现的医疗记录2014年4月13日******@2014HITAllRightsReserved中文电子病历(CEMR)对患者身体状况的半结构化专业描述2014年4月13日******@2014HITAllRightsReserved中文电子病历(CEMR)医疗大数据每天约800份每月约15000份每年约15万份2014年4月13日******@2014HITAllRightsReserved中文电子病历(CEMR)2014年4月13日******@2014HITAllRightsReserved目前在CEMR方面展开的研究工作CEMR句法树库构建2014年4月13日******@2014HITAllRightsReserved语法标注规范制定语法标注结果及分析高精度词性标注系统语法标注规范制定2014年4月13日******@2014HITAllRightsReserved基于PCTB规范进行迭代修订人机互助医生协助一致性评价语法标注规范制定2014年4月13日******@2014HITAllRightsReserved规范中一些重要修订筛选、补充、细化PCTB词性标注规范例如,“伴有视物模糊”中的“视物”提出适用于CEMR的术语切分方案PCTB:“吃饭”不切分,“吃梨”“吃桃”切分CEMR:“持物”“抗凝”是否切分?以“抗凝”为例:语法标注规范制定2014年4月13日******@2014HITAllRightsReserved标注质量控制表1规范修订前后主要词性歧义项分布表2前3次迭代分词和词性标注准确率及一致性PCTB词性标注规范面向电子病历的词性标注规范歧义项数量歧义项数量NNVV89NNVV47JJLC72NNM15MLC64JJNN9NNVA63NNVA9JJNN37NDNN6迭代次数中文分词词性标注A1F1值(%)A2F1值(%)IAA(%)A1Precision(%)A2Precision(%)IAA(%)196.7692.2796.5396.6888.5389.25295.5196.9497.8997.3697.8195.18398.4996.4798.2597.8097.6095.60语法标注规范制定2014年4月13日******@2014HITAllRightsReserved分词、词性标注、句法标注规范 内容来自淘豆网www.taodocs.com转载请标明出处.
非法内容举报中心
文档信息
  • 页数39
  • 收藏数0 收藏
  • 顶次数0
  • 上传人12344
  • 文件大小0 KB
  • 时间2014-08-18
文档标签