数据采集
2025-05-06 09:28:09   0  举报             
     
         
 边缘端数据采集,到中心端数据分析存储的过程
    作者其他创作
 大纲/内容
 KTable
  Flink
    探针
  Spark(分布式批处理框架)
  KStream
  YARN(集群资源管理和调度系统)
  Sqoop(数据库同步)
  探针采集器
  存储缓存
  冷数据
  订阅
  数据存储层
  ES
  LogStash(日志收集)
  应用层
  kafka
  ES集群
  解析清洗去重筛选加工分类转换增加
  第三方数据接收组件
  自定义模块
  数据分析层
  水   印
  DataX/Kettle(ETL工具)
  实时查询
  HDFS(分布式文件存储系统)
  BI
  kafka集群
  Syslog(日志收集)
  SparkStreaming
  采集层
  HBase(分布式实时列式存储数据库)
  上层分析结果存入ES
  离线查询/分析任务
  流处理层
  Hive(离线数据仓库)
  应用数据
  Flume(日志收集)
  Flink(分布式流处理框架)
   
 
 
 
 
  0 条评论
 下一页
  
   
   
   
  
  
  
  
  
  
  
  
 