Hive命令导出数据
Hive 导出csv文件
1 | Hive -e 'select * from your_Table' | sed 's/[\t]/,/g' > /home/yourfile.csv |
可以在SELECT
之前指定属性set Hive.cli.print.header=true
,以确保创建标头以及数据并将其复制到文件中。例如:
1 | Hive -e 'set Hive.cli.print.header=true; select * from your_Table' | sed 's/[\t]/,/g' > /home/yourfile.csv |
如果您使用的是Hive 11或更高版本,则可以将INSERT
语句与LOCAL
关键字一起使用。
1 | insert overwrite local directory '/home/carter/staging' row format delimited fields terminated by ',' select * from hugetable; |
或者利用Beeline
1 | beeline -u "jdbc:hive2://${ip}" -n anbao -p Algorithm_at_g7 --silent=true --outputformat=csv2 --incremental=true -e 'select geohash,course,road_class,province,city,county from dwd_device.dwd_roadtype_baidu_fixed_geohash_f_p_weekly where geohash_type="bd_7";' > /data/roadtype_data/db/bd_10_cource.csv |