文档名:基于多维度分析法的鲁迅三种文体比较研究
该文从鲁迅书信、小说和杂文中提取出387个语言特征,采用随机森林和k-means聚类算法筛选出58个能够对三种文体取得较好区别效果的特征.该文采用比伯的多维度分析法对这些语言特征进行因子分析,得到7个比较重要的因子.该文根据每个因子中具有显著负荷值的语言特征,将7个因子解释为4个能够体现文体在写作角度、叙述视角、形式、语言系统等方面差异的维度,和3个能够体现文体存在某种特点的特征组合.书信和小说在互动性上相似,然而书信更具议论性、文言性和详细的写作特征,小说更具描写性、白话性和简短的写作特征;书信和杂文在议论性和详细的写作特征上相似,而书信互动性较强,杂文互动性较弱;小说和杂文则没有相似的维度.
作者:范楚琳刘颖
作者单位:清华大学人文学院中国语言文学系,北京100084
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:H31S
关键词:鲁迅作品 文体特征 语体属性
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 781.37 KB
- 下载次数:
- 60
-
高速下载
|
|