Hive命令导出数据

Hive 导出csv文件

1	Hive -e 'select * from your_Table' \| sed 's/[\t]/,/g' > /home/yourfile.csv

可以在SELECT之前指定属性set Hive.cli.print.header=true，以确保创建标头以及数据并将其复制到文件中。例如：

1	Hive -e 'set Hive.cli.print.header=true; select * from your_Table' \| sed 's/[\t]/,/g' > /home/yourfile.csv

如果您使用的是Hive 11或更高版本，则可以将INSERT语句与LOCAL关键字一起使用。

1
2
3

insert overwrite local directory '/home/carter/staging' row format delimited fields terminated by ',' select * from hugetable;
# 这里会生成大量的随机文件 需要合并 
cat /LocalPath/* > /LocalPath/table.csv

或者利用Beeline

beeline -u "jdbc:hive2://${ip}" -n anbao -p Algorithm_at_g7 --silent=true --outputformat=csv2 --incremental=true -e 'select geohash,course,road_class,province,city,county from dwd_device.dwd_roadtype_baidu_fixed_geohash_f_p_weekly where geohash_type="bd_7";' >  /data/roadtype_data/db/bd_10_cource.csv

浮生若梦

Hive命令导出数据

参考