Crawler - crawl system and management plartform 分布式爬虫平台系统
2022-03-13 01:22:09   12  举报             
     
         
 Crawler - spiders, middleservice, spiderweb crawl system; 爬虫生态架构图包含爬虫业务,中间服务,项目管理等多项目,以及对应主要功能。生态主要包括爬虫的正向,逆向,加密,解密,管理,调度,权限等。
    作者其他创作
 大纲/内容
 UA server
  主机管理
  queue message api
  项目
  Kafka
  duplifilter
  cookie server
  任务调度
  MiddleService
      Bussiness Application
  api token 
  pipeline
  Spiders
  消息处理
  Mongodb
  Responses
  Requests
  OCR server
  engine
  HDFS
  SpiderWeb
  http
  spider
  scheduler
  Push / Subscribe
  自定义爬虫
  Internet
  爬虫生态架构图
  downloader
  Data
  数据
  容器
  JS server
  实时分析
  proxy server
  scheduler api
  爬虫管理
  应用
  项目管理
  Redis Cluster
   
 
 
 
 
  0 条评论
 下一页
  
   
   
   
   
  
  
  
  
  
  
  
  
 