文档名:AMFRel一种中文电子病历实体关系联合抽取方法
摘要:中文电子病历实体关系抽取是构建医疗知识图谱,服务下游子任务的重要基础.目前,中文电子病例进行实体关系抽取仍存在因医疗文本关系复杂、实体密度大而造成医疗名词识别不准确的问题.针对这一问题,提出了基于对抗学习与多特征融合的中文电子病历实体关系联合抽取模型AMFRel(adversariallearningandmulti-featurefusionforrelationtripleextrac-tion),提取电子病历的文本和词性特征,得到融合词性信息的编码向量;利用编码向量联合对抗训练产生的扰动生成对抗样本,抽取句子主语;利用信息融合模块丰富文本结构特征,并根据特定的关系信息抽取出相应的宾语,得到医疗文本的三元组.采用CHIP2020关系抽取数据集和糖尿病数据集进行实验验证,结果显示:AMFRel在CHIP2020关系抽取数据集上的Precision为63.922%,Recall为57.279%,F1值为60.418%;在糖尿病数据集上的Precision、Recall和F1值分别为83.914%,67.021%和74.522%,证明了该模型的三元组抽取性能优于其他基线模型.
Abstract:TheentityrelationshipextractionofChineseelectronicmedicalrecordsisakeypartforconstructingmedicalknowledgegraphsandservingdownstreamtasks.Duetothecomplexrelationsinmedicaltextsandhighdensityofentities,inaccurateidentificationofmedicaltermsandotherproblemsmayoccur.Toaddresstheseissues,amodelcalledAdversarialLearningandMulti-FeatureFusionforRelationTripleExtraction-AMFRelisproposedinthispaper.Themodelfirstextractstextsandpart-of-speechfeaturesfrommedicaltexttoobtainencodedvectorsthatincorporatepart-of-speechinformation.Then,encodingvectorisemployedtogenerateadversarialsamplesbycombiningtheperturbationsgeneratedbyadversarialtrainingtoextractthesubjectofthesentence.Finally,themodelenrichesthestructuralfeaturesofthetextbyusinganinformationfusionmodule,extractsthecorrespondingobjectbasedonspecificrelationshipinformation,andobtainsatripletofmedicaltext.ExperimentsareconductedontheCHIP2020relationextractiondatasetandthediabetesdataset.OurresultsshowAMFRelachievesaprecisionof63.922%,recallof57.279%,andF1scoreof60.418%ontheCHIP2020relationextractiondataset,andaprecisionof83.914%,recallof67.021%,andF1scoreof74.522%onthediabetesdataset,demonstratingthetripleextractionperformanceofthismodelissuperiortootherbaselinemodels.
作者:余肖生 李琳宇 周佳伦 马洪彬 陈鹏Author:YUXiaosheng LILinyu ZHOUJialun MAHongbin CHENPeng
作者单位:三峡大学湖北省水电工程智能视觉监测重点实验室,湖北宜昌443002;三峡大学计算机与信息学院,湖北宜昌443000
刊名:重庆理工大学学报
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2024, 38(3)
分类号:TP391.1
关键词:关系抽取 联合抽取 对抗学习 多特征融合 关系重叠
Keywords:relationextraction jointextraction adversariallearning multifeaturefusion relationshipoverlap
机标分类号:TP391.1TN722.75R338.1
在线出版日期:2024年3月25日
基金项目:国家重点研究发展计划项目AMFRel:一种中文电子病历实体关系联合抽取方法[
期刊论文] 重庆理工大学学报--2024, 38(3)余肖生 李琳宇 周佳伦 马洪彬 陈鹏中文电子病历实体关系抽取是构建医疗知识图谱,服务下游子任务的重要基础.目前,中文电子病例进行实体关系抽取仍存在因医疗文本关系复杂、实体密度大而造成医疗名词识别不准确的问题.针对这一问题,提出了基于对抗学习与多...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
AMFRel:一种中文电子病历实体关系联合抽取方法 AMFRel:A method for joint extraction of entity relations in Chinese electronic medical records
AMFRel:一种中文电子病历实体关系联合抽取方法.pdf
- 文件大小:
- 875.5 KB
- 下载次数:
- 60
-
高速下载
|
|