文档名:面向儿科疾病的实体及实体关系标注语料库构建
针对当前医学语料库涵盖实体分类以及实体关系难以满足精准医学发展需求的问题,本文从儿科疾病入手,参考现有的医学命名实体和实体关系标注体系,在医学领域专家的指导下,制定了适合儿科学的命名实体和实体关系的标注体系及详细标注规范;利用自行开发的标注工具,在采用机器学习进行预标注实体及实体关系后;以标注规范为指导,进行多轮人工标注,完成了298余万字的儿科医学文本中的实体及关系进行标注,形成了面向儿科疾病的实体及实体关系标注语料库.所构建的语料库包含504种儿科常见疾病,共标注命名实体23,603个,实体关系36,513个,多轮标注一致性分别为0.85和0.82.抽取已构建实体及关系标注语料库中的多元组,形成了儿科医学知识图谱,并开发了基于知识图谱的儿科医学知识问答系统.
作者:昝红英 刘涛 陈俊富 李俊卓 牛常勇 赵悦淑 张坤丽 穗志方
作者单位:郑州大学信息工程学院,河南郑州450001;鹏城实验室,广东深圳518052郑州大学信息工程学院,河南郑州450001鹏城实验室,广东深圳518052;郑州大学第三附属医院,河南郑州450001鹏城实验室,广东深圳518052;北京大学计算语言学教育部重点实验室,北京100871
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:TP3TN9
关键词:儿科疾病 命名实体 实体关系 标注体系 语料库
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 1005.9 KB
- 下载次数:
- 60
-
高速下载
|
|