Hive 专题
您的位置:Hive > Hive 专题 > 桶表 bucket
桶表 bucket
作者:--    发布时间:2019-11-22

桶表和分区表有类似的地方,都是将数据文件划分到不同的地方存储。不同的是,分区表是由用户指定数据处处的位置。而桶表是根据数据表的某个字段去hash值,然后模桶的数量,最终放到其中一个桶中,但是最终放到哪一个桶中,用户是不知道的。

桶表的创建语法

create table bucket_table(id string) clustered by(id) into 4 buckets;

往桶表中加载数据

往桶表中加载数据不能再使用LOAD DATA 的方式,要采取以下的方式:

set hive.enforce.bucketing = true;
insert into table bucket_table select name from stu;   
insert overwrite table bucket_table select name from stu;

·         抽样查询

select * from bucket_table tablesample(bucket 1 out of 4 on id);



网站声明:
本站部分内容来自网络,如您发现本站内容
侵害到您的利益,请联系本站管理员处理。
联系站长
373515719@qq.com
关于本站:
编程参考手册