当前位置 博文首页 > 孙中明:Hive必知必会(数据仓库)

    孙中明:Hive必知必会(数据仓库)

    作者:[db:作者] 时间:2021-09-04 18:35

    姊妹篇——MySQL必知必会:https://blog.csdn.net/jankin6/article/details/119540143

    文章目录

    • 第1章Hive入门
      • 1.1 什么是Hive
      • 1.2 Hive的优缺点
        • 1.2.1 优点
        • 1.2.2 缺点
      • 1.3 Hive架构原理
      • 1.4 Hive和数据库比较
    • 第2章Hive安装
      • 2.1Hive安装地址
      • 2.2 Hive安装部署
      • 2.3 将本地文件导入Hive案例
      • 2.4 MySql安装
        • 2.4.1 安装包准备
        • 2.4.2 安装MySql服务器
        • 2.4.3 安装MySql客户端
        • 2.4.4 MySql中user表中主机配置
      • 2.5 Hive元数据配置到MySql
        • 2.5.1 驱动拷贝
        • 2.5.2 配置Metastore到MySql
        • 2.5.3 多窗口启动Hive测试
      • 2.6HiveJDBC访问
        • 启动hiveserver2服务
        • 启动beeline
        • 连接hiveserver
      • 2.7 Hive常用交互命令
      • 2.8 Hive其他命令操作
      • 2.9Hive常见属性配置
        • 2.9.1 Hive数据仓库位置配置
        • 2.9.2 查询后信息显示配置
        • 2.9.3 Hive运行日志信息配置——可以但没必要
        • 2.9.4 参数配置方式
        • count 不执行MR任务
    • 第3章Hive数据类型
      • 3.1 基本数据类型
      • 3.2 集合数据类型
      • 3.3 类型转化
    • 第4章DDL数据定义
      • 4.1 创建数据库
      • 4.2 查询数据库
        • 4.2.1 显示数据库
        • 4.2.2 查看数据库详情
        • 4.3.3 切换当前数据库
      • 4.3 修改数据库
      • 4.4 删除数据库
      • 4.5 创建表——重点
        • 4.5.1 管理表——内部表
        • 4.5.2 外部表
        • 4.5.3\管理表与外部表的互相转换
      • 4.6 分区表
        • 4.6.1 分区表基本操作
        • 4.6.2 分区表注意事项
        • 4.6.3 hive的4种排序方式
      • 4.7 修改表
        • 4.7.1 重命名表
        • 4.7.2 增加、修改和删除表分区
        • 4.7.3 增加/修改/替换列信息
      • 4.8 删除表
    • 第5章DML数据操作
      • 5.1 数据导入—— 重要
        • 5.1.1 向表中装载数据(Load)—— 关键
        • 5.1.2 通过查询语句向表中插入数据(Insert)—— 关键
        • 5.1.3 查询语句中创建表并加载数据(As Select)
        • 5.1.4 创建表时通过Location指定加载数据路径——关键
        • 5.1.5 Import数据到指定Hive表中——使用不多
      • 5.2 数据导出
        • 5.2.1 Insert导出
        • 5.2.2 Hadoop命令导出到本地
        • 5.2.3 Hive Shell 命令导出
        • 5.2.4 Export导出到HDFS上
        • 5.2.5 Sqoop导出
      • 5.3 清除表中数据(Truncate)
    • 第6章:补充
      • 6.1存储格式
      • 6.2 内部表和外部表
      • 6.3hive调优方式
      • 6.4踩过的坑
    cs
    下一篇:没有了