返回列表 发布新帖

基于RNN的中文二分结构句法分析

13 0
admin 发表于 2024-12-10 13:30 | 查看全部 阅读模式

文档名:基于RNN的中文二分结构句法分析
为了构建一个简单易扩展的中文句法分析器,依据朱德熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个三万甸的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构.本文将中文句法分析转换为迭代二分的序列标注问题,并根据该任务的特点,提出了在词的间隔上进行标记的序列标注模型(RNN-Interval,简称RNN-INT),与常用的循环神经网络(RNN,LSTM)模型和条件随机场(CRF)进行了对比实验,使用mx2交叉验证序贯t-检验来比较模型.实验结果表明,RNN-INT模型在窗口为1的词特征就可达到了最好的性能,并好于其他窗口大小和其他序列标注模型(RNN,LSTM,CRF).最后,在测试集上,在人工分词下,RNN-INT在短语级别的F1值(块F1)达到71.25%,在句子级别的准确率达到了43%.
作者:谷波 王瑞波 李济洪 李国臣
作者单位:山西大学计算机与信息技术学院,山西太原,030006山西大学软件学院,山西太原,030006太原工业学院,山西太原,030008
母体文献:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)论文集
会议名称:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)  
会议时间:2018年10月19日
会议地点:长沙
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:中文句法分析  二分结构  循环神经网络  序列标注模型
在线出版日期:2021年9月13日
基金项目:
相似文献
相关博文
2024-12-10 13:30 上传
文件大小:
1.14 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表