Hive
2016-07-27 22:13:30 0 举报
Hive是一个基于Apache Hadoop的数据仓库软件,它提供了数据汇总、查询和分析的能力。它使用类似于SQL的查询语言(HiveQL)来处理存储在Hadoop分布式文件系统(HDFS)中的大型数据集。Hive的设计目标是让那些熟悉SQL的人能够方便地使用Hadoop进行数据查询和分析,而无需深入了解MapReduce编程模型。Hive的核心组件包括:编译器、优化器、执行引擎和元数据存储。通过这些组件,Hive能够将用户编写的HiveQL语句转换为底层的MapReduce任务,并在Hadoop集群上执行这些任务,从而实现对大型数据的处理和分析。
作者其他创作
大纲/内容
HiveServer2
MapReduce V2/Tez
Thrift Server
Old CLI(hive)
RDBMS (MySql/Derby)
JDBC
New CLI(beenhive)
MetaStore
WEB
Hive
Yarn
HDFS

收藏

收藏
0 条评论
下一页