大数据架构详解
2018-05-10 18:48:13 399 举报
AI智能生成
《大数据架构详解:从数据获取到深度学习》读书笔记,这本书作为入门读物,不适合全文阅读,利用思维导图,快速回顾学习大数据基础知识即可,若对哪部分技术感兴趣,需单独深入学习
作者其他创作
大纲/内容
大数据简史
大数据线状
大数据与BI
大数据导论
企业的数据资产
大数据的挑战
一、大数据是什么
五个层次
发展趋势
二、运营商大数据架构
SQM运维质量管理
CSE客户体验提升
MSS市场运维支撑
DMP数据管理平台
三、运营商大数据业务
大数据概述
数据分类
原理
InfiniBand
探针的关键能力
探针
抓取策略
更新策略
系统架构
爬虫
Flume日志收集
数据分发中间件
四、数据获取
算子
流的概念
金融股票k线
电信领域的质差补偿
应用场景
Storm
Spark
Lambda
Flink
Google Cloud Dataflow
融合技术
CEP
机器学习模块
Eagle
结合机器学习
五、流处理
MPP数据仓库架构分类
Greenplum架构
DB2与MPP的区别
Sybase IQ
MPP DB适用场景
典型的MPP数据库
MPP
MPP DB
Hive
Hbase
Phoenix
Impala
SQL on Hadoop
OLTP/OLAP
大数据仓库
六、交互式分析
Map Reduce
Shuffle
PRAM模型
LogP模型
C3模型
BDM模型
一些基本模型
基本原理
特点
评价
BSP与MapReduce
hama
BSP框架
批处理关键技术
七、批处理技术
区别
典型过程
监督式学习
非监督式学习
半监督式学习
强化学习
学习方式
回归算法
基于实例的算法
正则化算法
决策树算法
贝叶斯算法
基于核的算法
聚类算法
关联规则学习
人工神经网络算法
深度学习算法
降低维度法
集成算法
算法类似性
机器学习
交互式分析
机器学习的背景
关于特征
与神经网络
训练过程
深度学习的框架
深度学习的基本思想
深度学习
八、机器学习和数据挖掘
目标和价值
使用限制和难点
基本概念
YARN
Borg
Omega
其他框架
hadoop领域的资源调度框架
资源分配算法
介绍了安装和使用
Marathon
数据中心统一资源调度
数据库三种隔离方法
三种多租户方案
多租户技术
基于应用描述的智能调度
Mesos
九、资源管理
存储硬件
关键指标
RAID
存储接口
读写操作
HDFS
数据组织技术
缓存技术
存储加速技术
十、存储
运行
定义
通信
部署
监控与度量
测试
优势
不足
微服务架构
Docker
应用上云
集群模式
服务模式
大数据上云
十一、大数据云化
大数据技术
十二、开发文化
大数据文化
大数据架构详解
0 条评论
回复 删除
下一页