返回列表 发布新帖

基于三元组分类器的电力安全领域知识抽取

12 0
1 黄金阳光 发表于 2024-10-4 00:48 | 查看全部 阅读模式
文档摘要:电力安全三元组抽取是构建电力安全知识图谱及搜索系统的基础.面对特殊语句时,电力安全传统深度学习抽取方法识别率低且容易出现误差传播,而用联合抽取方法无法处理实体对重叠和单实体重叠问题.因此,提出基于三元组分类的联合抽取方法,用分类思想进行电力安全三元组抽取.首先从电力安全文本网站提取电力安全标准文本,并开发插件进行手动标注.然后利用Chinese-bert-wwm-ext(Chinesebidirectionalencoderrepresentationsfromtransformerswholewordmaskingextesion)预训练模型对电力安全文本数据向量化.随后将词向量枚举,将三元组转换为两对向量组,再设计分类器训练联合抽取模型抽取三元组向量,最后解码出三元组.实验结果:在电力安全数据集上取得了90.2%的F1值,比传统流水线方法Bert-BILSTM-CRF(Bidirectionalencoderrepresentationsfromtransformersbidirectionallongshort-termmemoryconditionalrandomfields)高10%,比联合抽取模型TPLinker(Tokenpairlinker)高1.3%.该结果表明所提方法便于后续电力安全知识图谱建立.

Abstract:Powersecuritytripletextractionisthefoundationofpowersecurityknowledgemappingandsearchingsystem.Thetraditionaldeeplearningextractionmethodforpowersecurityhaslowrecognitionrateandeasyerrorpropagationwhendealingwithspecialsentences,andthejointextractionmethodcannothandletheproblemsofentitypairoverlapandsingleentityoverlap.Therefore,acombinedextractionmethodbasedontripletclassificationisproposed,andtheideaofclassificationisusedtoextractpowersecuritytriplet.Firstly,thetextofpowersecuritystandardisextractedfromthepowersecuritytextwebsite,anddeveloppluginsformanualannotation.Secondly,theChinese-bert-wwm-extpre-trainingmodelisusedtovectorizethepowersecuritytextdata,thenthewordvectorsareemunerated,thetripleareintotwopairsofvectorgroups,andtheclassifierisdesignedtotrainthejointextractionmodeltoextractthetripletvector,andfinallydecodethetriplet.TheF1valueof90.2%isobtainedonthepowersecuritydataset,whichis10%higherthanthetraditionalpipelinemethodBILSTM-CRFand1.3%higherthanthetokenpairlinkermodel.Theresultsshowthattheproposedmethodisconvenientforthesubsequentpowersafetyknowledgemapping.

作者:张燎原  李英娜Author:ZHANGLiaoyuan  LIYingna
作者单位:昆明理工大学信息工程与自动化学院,云南昆明650500
刊名:电力科学与工程
Journal:ElectricPowerScienceandEngineering
年,卷(期):2024, 40(6)
分类号:TP391.1TM08
关键词:电力系统运行  电力安全  关系抽取  三元组抽取  Transformer  
Keywords:powersystemoperation  powersecurity  relationextraction  tripletextraction  tansformer  
机标分类号:TP391.1D822.371.2TP18
在线出版日期:2024年7月19日
基金项目:云南省基础研究专项基金资助项目基于三元组分类器的电力安全领域知识抽取[
期刊论文]  电力科学与工程--2024, 40(6)张燎原  李英娜电力安全三元组抽取是构建电力安全知识图谱及搜索系统的基础.面对特殊语句时,电力安全传统深度学习抽取方法识别率低且容易出现误差传播,而用联合抽取方法无法处理实体对重叠和单实体重叠问题.因此,提出基于三元组分类...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

关键词:电力系统运行,电力安全,关系抽取,三元组抽取,Transformer,

2024-10-4 00:48 上传
文件大小:
1.11 MB
下载次数:
0
附件售价:
1 下载券 [赞助会员免费下载]
本地下载 立即购买
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
  • 联系QQ客服
2022-2024 新资汇 - 参考资料分享下载网站
关灯 返回顶部
快速回复 返回顶部 返回列表