返回列表 发布新帖

基于伪触发词的并行预测篇章级事件抽取方法

9 0
admin 发表于 2024-12-14 11:44 | 查看全部 阅读模式

文档名:基于伪触发词的并行预测篇章级事件抽取方法
摘要:篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的事件顺序及预定义的角色顺序预测事件论元,使得先抽取的事件并没有考虑到后面抽取的事件.针对以上问题提出一种多任务联合的并行预测事件抽取框架.首先,使用预训练语言模型作为文档句子的编码器,检测文档中存在的事件类型,并使用结构化自注意力机制获取伪触发词特征,预测每种事件类型的事件数量;然后将伪触发词特征与候选论元特征进行交互,并行预测每个事件对应的事件论元,在大幅缩减模型训练时间的同时获得与基线模型相比更好的性能.最终事件抽取结果F1值为78%,事件类型检测子任务F1值为98.7%,事件数量预测子任务F1值为90.1%,实体识别子任务F1值为90.3%.

Abstract:Document-leveleventextractiongenerallydividesthetaskintothreesubtasks:candidateentityrecognition,eventde-tection,andargumentrecognition.Theconventionalapproachinvolvessequentiallyperformingthesesubtasksinacascadingman-ner,leadingtoerrorpropagation.Additionally,mostexistingmodelsimplicitlypredictthenumberofeventsduringthedecodingprocessandpredicteventargumentsbasedonapredefinedeventandroleorder,sothattheformerextractionwillnotconsiderthelatterextractionresults.Toaddresstheseissues,amulti-taskjointandparalleleventextractionframeworkisproposedinthispaper.Firstly,apre-trainedlanguagemodelisusedastheencoderfordocumentsentences.Onthisbasis,theframeworkdetectsthetypesofeventspresentinthedocument.Itutilizesastructuredself-attentionmechanismtoobtainpseudo-triggerwordfea-turesandpredictsthenumberofeventsforeacheventtype.Subsequently,thepseudo-triggerwordfeaturesareinteractedwithcandidateargumentfeatures,andparallelpredictionisperformedtoobtainvariouseventargumentsforeachevent,significantlyreducingmodeltrainingtimewhileachievingperformancecomparabletothebaselinemodel.ThefinalF1scoreforeventextrac-tionis78%,withanF1scoreof98.7%fortheeventtypedetectionsubtask,90.1%fortheeventquantitypredictionsubtask,and90.3%fortheentityrecognitionsubtask.

作者:秦海涛  线岩团  相艳  黄于欣Author:QinHaitao  XianYantuan  XiangYan  HuangYuxin
作者单位:昆明理工大学信息工程与自动化学院,云南昆明650500;昆明理工大学云南省人工智能重点实验室,云南昆明650500
刊名:电子技术应用
Journal:ApplicationofElectronicTechnique
年,卷(期):2024, 50(4)
分类号:TP391
关键词:篇章级事件抽取  多任务联合  预训练语言模型  结构化自注意力机制  并行预测  
Keywords:document-leveleventextraction  multi-taskjoint  pre-trainedlanguagemodel  structuredself-attentionmechanism  parallelprediction  
机标分类号:TP391.1H146.3TP181
在线出版日期:2024年4月26日
基金项目:国家自然科学基金,云南重大科技专项计划课题基于伪触发词的并行预测篇章级事件抽取方法[
期刊论文]  电子技术应用--2024, 50(4)秦海涛  线岩团  相艳  黄于欣篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于伪触发词的并行预测篇章级事件抽取方法  Parallel prediction of document-level event extraction method via pseudo trigger words

基于伪触发词的并行预测篇章级事件抽取方法.pdf
2024-12-14 11:44 上传
文件大小:
4.54 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表