HIVE 知识导图
2022-04-29 09:32:22 0 举报
AI智能生成
登录查看完整内容
HIVE 知识导图
作者其他创作
大纲/内容
数据归类
面向主题
数据整合
集成性
存量数据
非易失性
周期性更新
时变性
特性
捕获数据
业务数据库(OLTP)
分析数据
数据挖掘
关注点是存量数据分析
OLAP
报表
查询
分析
挖掘
应用数据
聚合数据
多维数据模型
业务模型
数据细节
数据仓库
数据库
文档
日志
源数据
数据模型定义
数据映射配置
元数据管理
extract 抽取
transfer 转化
load 加载
ETL
分层架构
CURD
全局
order
reducer 级别
sort
排序
group
分组
partition
Clusted
分区
类SQL
底层通过MapReduce实现
HSQL
abs
avg
sum
内置函数
UDF
UDAF
自定义函数
函数
Map输出压缩
Reduce 结果压缩
Snappy压缩算法
压缩
TextFile
sequence
行式
orc
Parquet
列式
存储格式
直接IO 读取文件
小任务本地执行
阶段并行运行
分区带字段
排序带Limit
限制笛卡尔积
严格模式
JVM重用
推测执行
调优
HIVE
收藏
收藏
0 条评论
回复 删除
下一页