scrapyAchitecture

2017-03-05 13:05:46 0 举报
仅支持查看
Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。其架构主要包括以下几个部分:引擎、调度器、爬虫和项目。引擎是整个框架的核心,负责控制数据流在系统中的所有组件之间传输,触发事件。调度器从引擎接收request并将其入队,以便之后引擎请求网页时返回。爬虫负责分析响应并提取item和新的请求。项目则为爬虫提供了一些在其生命周期中需要的配置信息,如起始URL等。Scrapy设计的一个主要特点是它具有很强的可扩展性,可以通过不同的中间件和管道来轻松实现各种功能。
作者其他创作
大纲/内容
评论
0 条评论
下一页
为你推荐
查看更多
抱歉,暂无相关内容