文档名:网络爬虫与反爬虫技术的研究
随着"互联网+"的不断发展,获取信息的途径已经从传统的纸质报刊转向为网络.然而,互联网是一个庞大的网页集合,每天都有海量的信息更新,增大了准确地获取到所需信息的难度.搜索引擎的网络爬虫提供了一种机制来生成Web上可用资源的索引,它面临着WWW数量不断增长的挑战.本文对网络爬虫、反爬虫和反反爬虫的工作流程以及方法策略进行研究,给出了网络爬虫、反爬虫和反反爬虫的技术实现方法.
作者:冯雨微 李陶深 葛志辉
作者单位:广西大学计算机与电子信息学院,南宁,530004广西高校并行与分布式计算技术重点实验室,南宁,530004
母体文献:第28届全国计算机新科技与教育学术会议论文集
会议名称:第28届全国计算机新科技与教育学术会议
会议时间:2018年9月26日
会议地点:北京
主办单位:全国高等学校计算机教育研究会
语种:chi
分类号:TP3G25
关键词:信息处理 网络爬虫 反爬虫 反反爬虫
在线出版日期:2022年3月9日
基金项目:
相似文献
相关博文
- 文件大小:
- 499.73 KB
- 下载次数:
- 60
-
高速下载
|
|