文档名:微博文本挖掘中模型评估方法比较与分析
微博是现下国内互联网最大交流平台之一,它所产生的庞大数据背后蕴藏着巨大的商业价值和社会价值.人们试图对庞大的微博数据进行各种微博语料分析,以获取所需的字段或者有用信息.本文编码实现逻辑回归、朴素贝叶斯、支持向量机、xgboost、KNN的分类器,实现对微博数据中的文本数据进行分类;采用准确率(ACC)、精确率(PPV)、回召率(SEV)、f1-score(F1)等若干个不同指标,在微博语料集下对不同分类器分类结果进行评估,并通过实验对比,对分类器的分类性能进行对比分析.
作者:于斐钥李陶深
作者单位:广西大学计算机与电子信息学院,南宁,530004
母体文献:2021中国高校计算机教育大会论文集
会议名称:2021中国高校计算机教育大会
会议时间:2021年10月1日
会议地点:南宁
主办单位:全国高等学校计算机教育研究会,教育部
语种:chi
分类号:TP3P20
关键词:微博文本 数据挖掘 分类模型 性能评估
在线出版日期:2022年4月27日
基金项目:
相似文献
相关博文
- 文件大小:
- 758.11 KB
- 下载次数:
- 60
-
高速下载
|
|