文档名:面向计算机科学领域的专业实体识别
摘要:为获取科研学术论文中涉及的专家研究领域等专业实体信息,给学术论文或科技项目评审专家的推荐提供理论参考,面向计算机科学领域,提出了一种基于RoBERTa-wwm的实体识别模型对专家学术论文中包含的专业实体进行识别.首先,以已有的专家基本信息数据表为参照,利用中国知网高级检索功能和爬虫技术获取表中列举专家的学术论文摘要数据;接着,将摘要数据经人工标注后,通过RoBERTa-wwm预训练模型获取具有语义特征的字符向量作为下游模型的输入;最后,将上游的语义字符向量输入BiLSTM-CRF模型中实现对文本中的专业实体识别.通过实验验证,提出的模型在自主标注的数据集中取得了更好的效果.其中,模型F1值达到了89.94%,高于实验中的对比模型,具有良好的识别专业实体的能力.
作者:陈祥 张仰森 李尚美 胡昌秀 成琪昊 Author:CHENXiang ZHANGYangsen LIShangmei HUChangxiu CHENGQihao
作者单位:北京信息科技大学智能信息处理研究所,北京100101北京信息科技大学智能信息处理研究所,北京100101;国家经济安全预警工程北京实验室,北京100044
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2023, 37(21)
分类号:TP391
关键词:专业实体识别 RoBERTa-wwm 专家研究领域 计算机科学
Keywords:professionalentityidentification RoBERTa-wwm expertresearchfield computersci-ence
机标分类号:TP391G311H315
在线出版日期:2023年12月18日
基金项目:国家自然科学基金面向计算机科学领域的专业实体识别[
期刊论文] 重庆理工大学学报--2023, 37(21)陈祥 张仰森 李尚美 胡昌秀 成琪昊为获取科研学术论文中涉及的专家研究领域等专业实体信息,给学术论文或科技项目评审专家的推荐提供理论参考,面向计算机科学领域,提出了一种基于RoBERTa-wwm的实体识别模型对专家学术论文中包含的专业实体进行识别.首先...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
面向计算机科学领域的专业实体识别 Professional entity recognition for computer science
面向计算机科学领域的专业实体识别.pdf
- 文件大小:
- 3.57 MB
- 下载次数:
- 60
-
高速下载
|
|