Hive架构以及计算流程
2023-05-11 17:24:26   10  举报             
     
         
 Hive架构以及计算流程
    作者其他创作
 大纲/内容
 Hive
  数据仓库
  返回MR结果
  元数据
    HDFS(数据存储)
  client
  JDBC
  通过映射关系向表导入数据LOAD DATA
  hive SQL
  WEBUI
  1.将HQL语句解析成抽象语法树并检查语法语义2.将抽象语法树转换成查询块3.将查询块编译成逻辑执行计划4.重写逻辑查询计划,优化逻辑执行计划(基于规则优化RBO基于牺牲的优化CBO)5.将逻辑计划转换为物理计划(MR)6.选择最佳的Join策略,优化物理执行计划,最后执行
  Meta Store
  记录着表和数据的映射,在HDFS的位置
  建表语句
  Result
  执行流程
  Compiler编译器
  Client
  Beline 
  HiveServer2
  Thrift Server
  Query Optimizer优化器
  Hive Driver解析器 编译器 优化器 执行器
  MR
  SQL parser解析器
  元数据包括:表名表结构表所属的数据库表的拥有者(权限信息)列/分区字段表的类型(是否是外部表)表的数据所在目录等元数据一般需要借助于其他的数据载体(Derby或Mysql),默认存放在自带的Derby数据库(单用户局限性)推荐使用mysql进行存储,连接数据库需要提供url、username、password、driver
  Execution优化器
  查询语句
  Hive Shell
  HDFS
  生成MR,生成相应的分析结果
  Yarn(MapReduce分析计算)
  Driver
   
 
 
 
 
  0 条评论
 下一页
  
   
   
   
   
  
  
  
  
  
  
  
  
 