文档摘要:由于传统的文字数据分类处理方法通常要求投入高昂的人力和时间成本进行标注分类,所以这些传统文字数据分类方法不再适应当前信息时代的要求.因此,急需一种高效快捷地实现对海量文本数据的主题选择和自主归类管理的新文本分类技术.经过研究,提出了一个新文本分类方案,通过文本向量空间模型(VSM),把大量非结构化的文本数据转化成高度结构化的文本向量,然后采用K-means聚类方法对文本向量进行聚类分析,实验结果证实了这种方法的高可行性.该方法提供了一种高效、快捷的文本处理和分类方式,能够快速实现主题选择和自主归类管理,值得进一步研究和探索.
作者:刘思杰 刘静超 郭冰洁 张程炳 刘一熳Author:
作者单位:西京学院计算机学院,西安710000
刊名:电脑编程技巧与维护
Journal:ComputerProgrammingSkills&Maintenance
年,卷(期):2024, (6)
分类号:
关键词:向量空间模型 文本分类 K-means聚类 高可行性
机标分类号:TP391TM93TP181
在线出版日期:2024年7月2日
基金项目:陕西省大学生创新训练项目基于向量空间模型的文本分类研究[
期刊论文] 电脑编程技巧与维护--2024, (6)刘思杰 刘静超 郭冰洁 张程炳 刘一熳由于传统的文字数据分类处理方法通常要求投入高昂的人力和时间成本进行标注分类,所以这些传统文字数据分类方法不再适应当前信息时代的要求.因此,急需一种高效快捷地实现对海量文本数据的主题选择和自主归类管理的新文...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:
|
|