文档名:基于句法依存和CRFs的韵律短语识别
正确划分句子的韵律结构对于提高合成语音的质量具有重要的意义.而特征的选择是韵律结构预测的关键因素之一.在中文信息处理中,文本特征可以分为浅层文本特征与深层文本特征,浅层特征包括词、词性、词长等,深层特征包括句法信息、语义信息等.该文在挖掘剖析句法结构、依存句法结构同韵律结构之间关系的基础上,从文本中获取相关浅层和深层文本特征,并采用条件随机场模型实现韵律短语预测.该文首先以浅层文本特征进行韵律短语识别,然后在此基础上加入句法依存深层文本特征进行模型构建.实验结果证明,加入句法依存特征后,韵律短语预测精确度提高了13.3%,召回率提高了14.7%,F值提高了14.1%.
作者:钱揖丽 张二萌
作者单位:山西大学计算机与信息技术学院,山西太原030006;山西大学计算机智能与中文信息处理教育部重点实验室,山西太原030006山西大学计算机与信息技术学院,山西太原030006
母体文献:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)论文集
会议名称:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)
会议时间:2018年10月19日
会议地点:长沙
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:中文识别 韵律短语 句法依存 条件随机场
在线出版日期:2021年9月13日
基金项目:
相似文献
相关博文
- 文件大小:
- 548.55 KB
- 下载次数:
- 60
-
高速下载
|
|