如何用Hive 往HBase里面插入大量的数据
发布网友
发布时间:2022-04-21 19:55
我来回答
共1个回答
热心网友
时间:2022-04-12 12:27
利用选项2, 先打通Hive对HBase指定表的全表访问, 再建立一个新的空表, 把查询出来的数据全部导入到新表当中, 以后的所有数据分析操作在新表中完成。
说干就干, 让我们试一个简单的例子。
首先在HBase里面建一个表, 名为 student, 包含 id 和 name 两个column.
hbase shell
create 'student', 'id', 'name'
向表中插入两行数据
put 'student', 'row1', 'id:val', '1'
put 'student', 'row1', 'name:val', 'Tony'
put 'student', 'row2', 'id:val', '2'
put 'student', 'row2', 'name:val', 'Mike'
注意:在插入数据的时候一定要指定column (如id:val, name:value) 直接使用column family (如 id, name) 去存数据会导致后面Hive 建表的时候有问题。
扫描此表, 确定数据已经插入
scan 'student'
ROW COLUMN+CELL
row1 column=id:val, timestamp=1384939342989, value=1
row1 column=name:val, timestamp=1384939365511, value=Tony
row2 column=id:val, timestamp=1384939351444, value=2
row2 column=name:val, timestamp=1384939379245, value=Mike