文档名:社交网络中的敏感内容检测方法研究
社交网络的出现和快速发展使人们可以方便、快捷的进行相互交流与信息共享,但其中不乏黄赌毒信息,甚至还包括暴力恐怖和政治敏感内容,为此需要对社交网络发布的信息进行敏感内容检测.为了有效解决对敏感词进行变形处理而逃避被检测和过滤的问题,首先识别敏感词及敏感词的变形词,并采用敏感词指纹汇聚方法将敏感词的变形词与原词进行关联.在此基础上,采用语义指纹技术检测重复发布的敏感内容.其次,建立基于多任务学习的卷积神经网络模型(MTL-CNN),综合敏感性和情感倾向两个方面对发布文本进行检测.对比实验结果表明,本文提出的敏感内容检测方法具有较高的处理速率和检测准确率.
作者:孟旭阳 徐雅斌
作者单位:北京信息科技大学计算机学院,北京100101北京信息科技大学计算机学院,北京100101;北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:
关键词:社交网络 敏感内容检测 语义指纹 多任务学习 卷积神经网络
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
- 文件大小:
- 568.3 KB
- 下载次数:
- 60
-
高速下载
|
|