文档名:基于分布式表示的汉字部件表义能力测量与应用
汉字的表义性是其区别于表音文字的一大特点.部件作为构字单位,同汉字的意义之间有着很大的联系.然而,汉字部件的表义能力究竟如何是学界尚待讨论的课题.针对这一问题,从汉字部件入手,提出了融合部件的字词分布式表示模型,该模型在向量内部评测任务获得了一定提升,在汉字理据性测量任务上也与人工打分的相关系数呈现显著相关.基于该模型,进一步提出了部件表义能力的计算方法,对汉字部件的表义能力做了整体评估,结合部件的构字能力建立了现代汉字部件的等级体系.测量结果显示,现代汉字部件具有一定表义能力,但整体而言表义能力偏低.最后,将测量结果应用对对外汉语教学中,确立了适用于部件教学法的部件范围,并提出了对应的汉字教学顺序方案.
作者:梁诗尘 唐雪梅 胡韧奋 吴金闪 刘智颖
作者单位:北京师范大学中文信息处理研究所,北京市100875;神州泰岳-北京师范大学人工智能联合实验室,北京市100875北京师范大学系统科学学院,北京市100875
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:汉字部件 表义能力 分布式表示
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 650.71 KB
- 下载次数:
- 60
-
高速下载
|
|