文档名:基于伪触发词的并行预测篇章级事件抽取方法
摘要:篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的事件顺序及预定义的角色顺序预测事件论元,使得先抽取的事件并没有考虑到后面抽取的事件.针对以上问题提出一种多任务联合的并行预测事件抽取框架.首先,使用预训练语言模型作为文档句子的编码器,检测文档中存在的事件类型,并使用结构化自注意力机制获取伪触发词特征,预测每种事件类型的事件数量;然后将伪触发词特征与候选论元特征进行交互,并行预测每个事件对应的事件论元,在大幅缩减模型训练时间的同时获得与基线模型相比更好的性能.最终事件抽取结果F1值为78%,事件类型检测子任务F1值为98.7%,事件数量预测子任务F1值为90.1%,实体识别子任务F1值为90.3%.
Abstract:Document-leveleventextractiongenerallydividesthetaskintothreesubtasks:candidateentityrecognition,eventde-tection,andargumentrecognition.Theconventionalapproachinvolvessequentiallyperformingthesesubtasksinacascadingman-ner,leadingtoerrorpropagation.Additionally,mostexistingmodelsimplicitlypredictthenumberofeventsduringthedecodingprocessandpredicteventargumentsbasedonapredefinedeventandroleorder,sothattheformerextractionwillnotconsiderthelatterextractionresults.Toaddresstheseissues,amulti-taskjointandparalleleventextractionframeworkisproposedinthispaper.Firstly,apre-trainedlanguagemodelisusedastheencoderfordocumentsentences.Onthisbasis,theframeworkdetectsthetypesofeventspresentinthedocument.Itutilizesastructuredself-attentionmechanismtoobtainpseudo-triggerwordfea-turesandpredictsthenumberofeventsforeacheventtype.Subsequently,thepseudo-triggerwordfeaturesareinteractedwithcandidateargumentfeatures,andparallelpredictionisperformedtoobtainvariouseventargumentsforeachevent,significantlyreducingmodeltrainingtimewhileachievingperformancecomparabletothebaselinemodel.ThefinalF1scoreforeventextrac-tionis78%,withanF1scoreof98.7%fortheeventtypedetectionsubtask,90.1%fortheeventquantitypredictionsubtask,and90.3%fortheentityrecognitionsubtask.
作者:秦海涛 线岩团 相艳 黄于欣Author:QinHaitao XianYantuan XiangYan HuangYuxin
作者单位:昆明理工大学信息工程与自动化学院,云南昆明650500;昆明理工大学云南省人工智能重点实验室,云南昆明650500
刊名:电子技术应用
Journal:ApplicationofElectronicTechnique
年,卷(期):2024, 50(4)
分类号:TP391
关键词:篇章级事件抽取 多任务联合 预训练语言模型 结构化自注意力机制 并行预测
Keywords:document-leveleventextraction multi-taskjoint pre-trainedlanguagemodel structuredself-attentionmechanism parallelprediction
机标分类号:TP391.1H146.3TP181
在线出版日期:2024年4月26日
基金项目:国家自然科学基金,云南重大科技专项计划课题基于伪触发词的并行预测篇章级事件抽取方法[
期刊论文] 电子技术应用--2024, 50(4)秦海涛 线岩团 相艳 黄于欣篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于伪触发词的并行预测篇章级事件抽取方法 Parallel prediction of document-level event extraction method via pseudo trigger words
基于伪触发词的并行预测篇章级事件抽取方法.pdf
- 文件大小:
- 4.54 MB
- 下载次数:
- 60
-
高速下载
|
|