当前位置 博文首页 > 直到世界的尽头:hadoop组件---面向列的开源数据库(四)---kettle

    直到世界的尽头:hadoop组件---面向列的开源数据库(四)---kettle

    作者:[db:作者] 时间:2021-09-12 12:02

    我们在前面的案例中已经使用kettle把数据导入到hive中。

    本章我们来尝试把数据导入到hbase里。

    参考链接:
    https://wiki.pentaho.com/display/BAD/Loading+Data+into+HBase

    kettle案例七连接hive–抽取mongodb的数据保存到hive

    下载hadoop cluster配置文件

    从服务器hadoop etc的配置文件中下载如下5个配置文件,覆盖kettle的plugins\pentaho-big-data-plugin\hadoop-configurations\hdp25中的5个同名文件。
    core-site.xml
    hdfs-site.xml
    mapred-site.xml
    yarn-site.xml
    hbase-site.xml

    如果是CDH安装的Hadoop,hadoop etc的配置文件在服务器中的路径是/etc/hadoop/。如下:

    ls /etc/h
    cs