文档名:基于关键词提取的网站恶意链接检测
网站上存在恶意链接会对网站造成恶劣的影响,甚至影响网站的正常运行.本文提出了一种基于关键词提取的网站恶意链接检测的方法,使用爬虫爬取网站上所有页面的链接,过滤器过滤后,对可疑链接进行页面内容的抓取,再使用TextRank进行关键词提取,当出现了3个及以上的恶意关键词时,认为该链接可能是恶意链接.最后,使用该方法成功发现了北京大学某网站上存在的恶意链接,验证了该方法的有效性.
作者:赖清楠郭强
作者单位:北京大学计算中心北京100871
母体文献:中国计算机用户协会网络应用分会2021年第二十五届网络新技术与应用年会论文集
会议名称:中国计算机用户协会网络应用分会2021年第二十五届网络新技术与应用年会
会议时间:2021年11月1日
会议地点:北京
主办单位:中国计算机用户协会
语种:chi
分类号:
关键词:网站检测 恶意链接 关键词抽取 网络爬虫
在线出版日期:2022年8月26日
基金项目:
相似文献
相关博文
- 文件大小:
- 2.13 MB
- 下载次数:
- 60
-
高速下载
|
|