文档名:基于情感特征向量的Twitter情感分类方法研究
公众情感在包括电影评论、消费者信心、政治选举、股票走势预测等众多领域发挥着越来越大的影响力.面向公共媒体内容开展情感分析是分析公众情感的一项基础工作.经典的基于词频特征向量的特征提取方法,主要利用词频作为文本分类的依据,而词频与情感信息之间的关系并不紧密.针对Twitter推文的特点,本文提出了一种采用基于情感特征向量的Twitter推文情感分类方法.该方法首先通过对推文进行数据清洗、词形还原、词性标注和词汇向量化;其次,将单词匹配到情感词典中;最后,利用每个单词的正向情感、负向情感取值生成情感特征向量,通过MNB、SVM等机器学习方法训练模型,对推文的情感进行分类.实验结果表明采用情感特征向量的Twitter推文情感分类方法能够获得更佳的分类性能.
作者:易顺明 易昊 周国栋
作者单位:沙洲职业工学院电子信息工程系,江苏苏州215600美国Rutgers大学数学系,美国新泽西苏州大学计算机科学与技术学院,江苏苏州215006
母体文献:中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)论文集
会议名称:中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
会议时间:2015年11月13日
会议地点:广州
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:文本处理 情感分类 情感特征向量
在线出版日期:2018年3月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 385.07 KB
- 下载次数:
- 60
-
高速下载
|
|