文档名:细颗粒度汽车评论语料库的构建和分析
产品评论文本是情感分析的重要研究对象,目前已有的产品评论语料库大都较为粗疏,没有完整地标注出对象、属性、极性“三要素”,影响自动分析的应用场景.对此,本文构建了细颗粒度情感语料库,共包含9343句汽车评论短文本,不仅人工标注了“三要素”的具体词语,而且将其对应到产品和属性的知识本体树上.此外,对无情感词的隐含表达、特殊文本(如建议文本、比较句等)也标注出对应的三元组并予以特殊标签.语料统计表明,对象和属性要素的共现率高达77.54%,验证了构建“三要素”齐全标注体系的必要性;基于本语料库的“三要素”自动标注实验F1值可达69.25%,验证了细颗粒度标注体系的可计算性以及语料库构建的规范性和应用价值.该语料库可以为细颗粒度情感分析研究提供基础数据.
作者:曹紫琰 毛雪芬 程宁 宋阳 李斌 冯敏萱
作者单位:南京师范大学文学院,江苏省南京市210097南京大学计算机科学与技术学院,江苏省南京市210023南京师范大学文学院,江苏省南京市210097;哈佛大学计量社会科学研究所,美国剑桥市02138
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:产品评论文本 情感分析 细颗粒度 语料库
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 610.87 KB
- 下载次数:
- 60
-
高速下载
|
|