文档摘要:电力安全三元组抽取是构建电力安全知识图谱及搜索系统的基础.面对特殊语句时,电力安全传统深度学习抽取方法识别率低且容易出现误差传播,而用联合抽取方法无法处理实体对重叠和单实体重叠问题.因此,提出基于三元组分类的联合抽取方法,用分类思想进行电力安全三元组抽取.首先从电力安全文本网站提取电力安全标准文本,并开发插件进行手动标注.然后利用Chinese-bert-wwm-ext(Chinesebidirectionalencoderrepresentationsfromtransformerswholewordmaskingextesion)预训练模型对电力安全文本数据向量化.随后将词向量枚举,将三元组转换为两对向量组,再设计分类器训练联合抽取模型抽取三元组向量,最后解码出三元组.实验结果:在电力安全数据集上取得了90.2%的F1值,比传统流水线方法Bert-BILSTM-CRF(Bidirectionalencoderrepresentationsfromtransformersbidirectionallongshort-termmemoryconditionalrandomfields)高10%,比联合抽取模型TPLinker(Tokenpairlinker)高1.3%.该结果表明所提方法便于后续电力安全知识图谱建立.
Abstract:Powersecuritytripletextractionisthefoundationofpowersecurityknowledgemappingandsearchingsystem.Thetraditionaldeeplearningextractionmethodforpowersecurityhaslowrecognitionrateandeasyerrorpropagationwhendealingwithspecialsentences,andthejointextractionmethodcannothandletheproblemsofentitypairoverlapandsingleentityoverlap.Therefore,acombinedextractionmethodbasedontripletclassificationisproposed,andtheideaofclassificationisusedtoextractpowersecuritytriplet.Firstly,thetextofpowersecuritystandardisextractedfromthepowersecuritytextwebsite,anddeveloppluginsformanualannotation.Secondly,theChinese-bert-wwm-extpre-trainingmodelisusedtovectorizethepowersecuritytextdata,thenthewordvectorsareemunerated,thetripleareintotwopairsofvectorgroups,andtheclassifierisdesignedtotrainthejointextractionmodeltoextractthetripletvector,andfinallydecodethetriplet.TheF1valueof90.2%isobtainedonthepowersecuritydataset,whichis10%higherthanthetraditionalpipelinemethodBILSTM-CRFand1.3%higherthanthetokenpairlinkermodel.Theresultsshowthattheproposedmethodisconvenientforthesubsequentpowersafetyknowledgemapping.
作者:张燎原 李英娜Author:ZHANGLiaoyuan LIYingna
作者单位:昆明理工大学信息工程与自动化学院,云南昆明650500
刊名:电力科学与工程
Journal:ElectricPowerScienceandEngineering
年,卷(期):2024, 40(6)
分类号:TP391.1TM08
关键词:电力系统运行 电力安全 关系抽取 三元组抽取 Transformer
Keywords:powersystemoperation powersecurity relationextraction tripletextraction tansformer
机标分类号:TP391.1D822.371.2TP18
在线出版日期:2024年7月19日
基金项目:云南省基础研究专项基金资助项目基于三元组分类器的电力安全领域知识抽取[
期刊论文] 电力科学与工程--2024, 40(6)张燎原 李英娜电力安全三元组抽取是构建电力安全知识图谱及搜索系统的基础.面对特殊语句时,电力安全传统深度学习抽取方法识别率低且容易出现误差传播,而用联合抽取方法无法处理实体对重叠和单实体重叠问题.因此,提出基于三元组分类...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:电力系统运行,电力安全,关系抽取,三元组抽取,Transformer,
|
|