房源项目
2021-03-31 10:18:00   1  举报             
     
         
 真实房源项目 制作不易 求各位大大给张小票票 https://blog.csdn.net/qq_40565265
    作者其他创作
 大纲/内容
 业务服务器(Spring boot)
    ap
  手机品牌
  vn
  flink core、sql消费
  经度
  uid
  操作系统 mac|linux|windows
  ba
  datanode:11台
  程序版本号
  公共字段
  namenode:2台
  (业务日志数据)后端埋点数据
  路线2:业务方直接调用接口将数据写入至kafka中,神策数据等业务场景
  HIve (ods) 原始数据层(dwd) 数据明细层(dws) 数据服务层(ads) 数据应用层
  前端埋点走向: (1.1)7日|30日|累计活跃用户数(uv量) (1.2)7日|30日|累加新增用户数 (1.3)30日平均每日使用时长(启动APP到APP退出) (1.4)30日活跃用户趋势 (1.5)30日启动程序次数(pv量) (1.6)7日内每个工作日时间端访问量 (1.7)30日新用户占比趋势(新用户/总新增用户) (1.8)分析沉默用户 业务交互走向: (2.1)30日签到数量(凌晨进行冷热数据分离) (2.2)30日完善个人信息人数 (2.3)30未完善个人信息进度 (2.4)3天内每日访问页面时长大于1小时人数,获取电话信息 (2.5)连续每日签到大于7|30天用户
  ar
  副本数3
  客户端事件产生时间
  kafka
  SPARK(实时、离线)
  ip
  网络模式(4G|Wifi)
  区域 中国|日本
  CDH
  128G内存20核数cpu8T磁盘空间5w11台+1台跳板机
  离线6人
   (1.1)7日|30日|累计活跃用户数(uv量) (1.2)7日|30日|累加新增用户数 (1.3)30日平均每日使用时长(启动APP到APP退出) (1.4)30日活跃用户趋势 (1.5)30日启动程序次数(pv量) (1.6)7日内每个工作日时间端访问量 (1.7)30日新用户占比趋势(新用户/总新增用户) (1.8)分析沉默用户
  指标1
  项目数据来源(app|pc)
  新手任务
  阿里云服务器
  Web/小程序业务交互(1.1)(1.2)(1.7)(2.1)(2.2)(2.3)(2.4)(2.5)(2.6)
  ett
  事件结果以key-value形式自行定义
  事件字段
  用户分析
  Mysql
  手机型号
  nw
  客户端日志产生时间
  可视化页面
  屏幕宽高
  en
  i
  Hbase:3台
  vc
  技术大佬1人
  实时表日常数据量30w
  数仓(实时、离线)
  nginx
  系统语言
  事件名称和事件日志是根据事件名称的不用
   (2.1)30日签到数量(冷热数据分离) (2.2)30日完善个人信息人数  (2.3)30未完善信息进度(第几步退出) (2.4)3天内每日访问页面时长大于1小时人数,获取电话信息 (2.5)连续每日签到大于7天用户
  指标2
  实时2人左右 
  la
  埋点上报的字段,有具体的业务类型
  路线1:业务数据通过工具例如canal、flinkcdc等操作
  对网站登录用户进行分析,对会员的行为进行分析,统计完善信息人数及比例,同时汇总未完成信息的进度
  用户标识
  ip地址
  数据走向
  程序版本名
  Mysql业务数据(冷热数据分离)
  纬度
  组长1人(前端)
  os
  Flume
  l
  从数据服务层数据导出
  Hbase
  kv
  第三方工具sqoop datax
  kafka:3台
  mid
  rm:2台
  Redis
  考察产品在过去一段时间的用户总量和新增总量反应出目前产品的运营能力和用户增长速度查看用户在过去一段时间的活跃趋势和新增趋势让您得悉用户基数在近期是在增长还是下降
  设备唯一标识
  Web/小程序前端埋点(1.3)(1.4)(1.5)(1.6)
  必要字段
  zookeeper:3台
  md
  ln
  基本pc/app端所包含的信息字段
  路线3 从服务器中获取项目运行日志(例spring项目) ,行为日志
  日志收集服务器
  个人博客:https://blog.csdn.net/qq_40565265后续更新整个项目代码,包含项目说明文档、内涵springcloud spark flink 调度器等工具、实际项目优化方案  真实项目 假一赔十  (^v^)
  hw
  HDFS(hive外部表)
  ods  原始数据层 存放原始数据,保持原貌不做处理dwd  明细数据层 对ods层数据清洗(去除空值,脏数据,超过极限范围的数据)dws  服务数据层 轻度聚合ads  应用数据层 具体需求 
  nginx  + flume + kafka+flume + hdfs = 培训
   
 
 
 
 
  0 条评论
 下一页
  
   
   
   
   
  
  
  
  
  
  
  
  
 