Python爬虫流程
2016-06-07 09:58:28 0 举报
网络爬虫简单流程
作者其他创作
大纲/内容
下载器
有待爬URL?
价值数据,新的URL列表
收集有价值的数据
下载URL内容
URL管理器
循环
调度器
URL
URL内容
新增加到待爬的URL
输出价值数据
解析URl内容
解析器
数据库
是/否
获取一个待爬的URL
0 条评论
下一页