HIVE基础操作
2023-03-06 21:02:06 13 举报
AI智能生成
hive建表基础语句
作者其他创作
大纲/内容
[COMMENT table_comment] :表的注释
行分隔符:lines terminated by '\' (一般不需指定)
元素分隔符: items terminated by '\\t'
[ROW FORMAT row_format] :指定分隔符
[STORED AS file_format]:表中的数据要以哪种文件格式来存储,默认为TEXTFILE
[LOCATION hdfs_path]:指定hive当前所建表的数据在hdfs上的存储路径
CTS 将另一个表中查询的数据保存到新建表中create table tname as select .... from ....
like 复制表,只复制表结构,不复制表中的数据create table tname like old_name;
hive表创建
show tables;show tables in db;show table like '*';
查看表列表
show create talbe tname;
查看建表语句
desc [extended/formatted]tname;
查看表详细信息
show partitions tname;
查看表分区信息
查看
alter table tname rename to new_name
修改表名称
添加列
alter table tname change col_name new_col_name col_type;
修改列
修改表字段
alter table tname drop partition(p='aa)
删除分区
alter table tname add partition(p='aa') partition(p='bb) ... [location 'usr/hive/ptn']
添加分区
修改分区
修改
truncate table tname;
清空表
drop table tname[cascade]
删除表
删除
create view view_name as select ....;
创建视图
show tables; desc view_name;
查看视图
drop view view_name;
删除视图
视图
默认格式;存储方式为行存储;磁盘开销大 数据解析开销大;使用这种方式,hive不会对数据进行切分,从而无法对数据进行并行操作。
(1)TEXTFILE
(2)SEQUENCEFILE
存储方式:数据按行分块,每块按照列存储;压缩快 快速列存取;读记录尽量涉及到的block最少;读取需要的列只需要读取每个row group 的头部定义;读取全量数据的操作 性能可能比sequencefile没有明显的优势。
(3)RCFILE
(4)ORCFILE(0.11以后出现)
类似于orc,相对于orc文件格式,hadoop生态系统中大部分工程都支持parquet文件。
(5)PARQUET
文件存储格式
HIVE基础操作
0 条评论
回复 删除
下一页