电商系统数据架构图
2025-11-03 22:51:31   0  举报             
     
         
 这张电商系统数据架构图从下到上分为六层。数据源层包含系统数据(日志、监控、事件)、业务数据(用户、商品、订单、营销)、外部数据(第三方、爬虫);数据采集层通过实时(Canal、Flume 等)、批量(Sqoop、DataX 等)、流式(Kafka Connect、Flink CDC 等)三种方式采集数据;数据存储层涵盖搜索存储(Elasticsearch、Solr)、消息队列(Kafka、RocketMQ)、对象存储(HDFS 等)、OLAP 存储(Hive、ClickHouse 等)、OLTP 存储(MySQL、Redis 等);数据处理层支持流式处理(Flink 等)、批处理(Spark 等)、机器学习(Spark MLlib、TensorFlow 等);数据服务层提供统一数据服务(数据 API、网关等)和查询服务(Presto、Kylin 等);数据应用层落地于 BI 报表(Superset 等)、业务应用(推荐、风控等)、数据产品(用户画像、经营驾驶舱等),实现电商数据从采集存储到价值应用的全链路架构。
    作者其他创作
 大纲/内容
    数据源层(Data Source Layer)
  实时采集
    爬虫数据<竞品·价格·评论>
  数据API<统一数据接口>
  MongoDB<文档存储>
  Hive数仓<离线数据仓库>
  业务应用
  对象存储
  搜索存储
  OLAP存储
  Apache Druid<实时分析 时序数据>
  日志数据<访问·操作·错误>
  业务数据
  Spark Streaming<微批处理>
  流式处理
  商品数据<SPU·SKU·库存>
  PyTorch<深度学习 模型训练>
  系统数据
  对象存储<图片·视频·文档>
  数据集市<数据资产>
  Tableau<商业智能>
  营销数据<活动·优惠券·推广>
  Flink CDC<变更数据捕获>
       Elasticsearch集群<全文检索 日志分析>
  HDFS<分布式文件系统>
  经营驾驶舱<实时大屏>
  Hive SQL<数据仓库 离线分析>
  RocketMQ集群<事务消息 顺序消息>
     数据存储层(Data Storage Layer)
  OLTP存储
  TensorFlow<深度学习 神经网络>
  Doris集群<统一olap多维分析>
  BI报表
     数据应用层(Data Application Layer)
  Redis集群<缓存·会话>
  机器学习
  Grafana<监控面板>
  外部数据
       ApacheKylinOLAP<预计算>
  订单数据<交易·支付·物流>
  Sqoop<关系型数据库>
  查询服务
  API同步<第三方接口>
     Kafka Connect<流数据连接器>
  风控系统<实时风控>
  批量采集
  监控数据<性能·资源·告警>
  用户画像<标签体系>
  Filebeat<文件采集>
  Flume<日志采集>
  流式采集
  批处理
  Presto<交互式查询>
  推荐引擎<个性化推荐>
     数据采集层(Data Collection Layer)
  定价引擎<动态定价>
  用户数据<注册·登录·行为>
  数据网关<访问控制·限流>
  MapReduce<分布式计算>
     数据处理层(Data Processing Layer)
  DataX<异构数据源>
  数据产品
  Solr集群<商品搜索facet查询>
  Spark MLlib<机器学习 特征工程>
     数据服务层(Data Service Layer)
  MySQL集群<主从·分库·分表>
  Storm处理<实时流处理>
  Flink流处理<实时计算 窗口聚合>
  统一数据服务
  Kafka集群<高吞吐消息 事件流>
  Canal<MySQL Binlog>
     ClickHouse集群<实时olap分析报告>
  消息队列
  元数据服务<数据血缘·质量>
  第三方数据<支付·物流·社交>
  Spark批处理<大数据 ETL处理>
      Apache Superset<可视化分析>
  事件数据<消息·通知·状态变更>
   
 
 
 
 
  0 条评论
 下一页