快乐学习
前程无忧、中华英才非你莫属!

大数据的仓库入门到精通

hive被大多数企业使用,学习它,利于自己掌握企业所使用的技术,这里从安装使用到概念、原理及如何使用遇到的问题,来讲解hive,希望对大家有所帮助。此篇内容较多:看完之后需要达到的目标1.hive是什么2.明白hive的原理3.会使用hive4.会使用hive编程

1.hive首先我们需要hive是什么?让你真正明白什么是hive上面讲的很明白1.hive是一个数据仓库2.hive基于hadoop。总结为一句话:hive是基于hadoop的数据仓库。hive明白之后,如同我们明白了关系数据库是什么了,那么我们该如何使用操作它:首先我们要安装,安装分为很多种分为单机遇集群安装。可参考下面内容:(正在更新)Hive安装指导HIVE完全分布式集群安装过程(元数据库: MySQL)

上面需要说明的是hive默认元数据库并不是mysql,但是因为默认元数据库存在局限,所以最好使用mysql。下面我们附一张图,先从整体了解。

<ignore_js_op> 安装完毕,那么我们就需要练练手了,可以根据下面内容hive基本操作会了基本的操作还不够,

如同我们需要了解sql语法一样,我们需要了解hive各种语法Hadoop Hive sql语法详解1-认识hive及DDL操作

Hadoop Hive sql语法详解2-修改表结构

Hadoop Hive sql语法详解3–DML 操作:元数据存储

Hadoop Hive sql语法详解4–DQL 操作:数据查询SQL

Hadoop Hive sql语法详解5–HiveQL与SQL区别这里面包含了加载数据、查询数据等各种操作。

上面是一些基本的操作,下面还有一些负责一些操作如:Hive快捷查询:不启用Mapreduce job启用Fetch task三种方式介绍Hive如何执行文件中的sql语句Hive四种数据导入方式介绍Hive中的三种不同的数据导出方式介绍Hive如何创建索引上面基本属于实战类型,我们还需要高级进阶,我们需要了解里面的原理,我们需要知道遇到问题,该如何解决。原理:全面了解hiveHive体系结构介绍hive实现原理hive内部表与外部表区别详细介绍HIVE中Join的专题—Join详解让你彻底明白hive数据存储各种模式Hive配置文件中配置项的含义详解(收藏版)HIVE与传统数据库对比hive详解hive 配置参数说明(收藏版)hive支持sql大全(收藏版)hive 创建/删除/截断 表原理大致懂了,基本操作会了,我们可能又有了更进一步的认识,那么hive如何结合hadoop,hbase发挥作用,该如何发挥它的实际意义,被我们所用。首先我们使用hive的时候,很多都与hbase相结合,这样发挥hive的长处,在各种查询数据方面相比hbase使用更方便。

hive为什么与hbase整合Hive与HBase整合完整指导hadoop、hbase、hive版本对应关系

上面是与hbase结合使用,那么我们该如何与编程语言向结合,可以参考下面内容:

通过JDBC驱动连接Hive操作实例Hive:用Java代码通过JDBC连接Hiveserver介绍从 MapReduce 到 Hive 实战分析hive实战

上面或许你已经对hive有所了解,下面的面试及遇到的问题,

大家可参考hive找不到创建的表了Shark对Hive的支持与不支持的语法介绍面试题:分别使用Hadoop MapReduce、hive统计手机流量hive面试题目:表大概有2T左右,对表数据转换hive如何通过设置日志定位错误

hive在腾讯分布式数据库时间分享

打赏

未经允许不得转载:同乐学堂 » 大数据的仓库入门到精通

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

特别的技术,给特别的你!

联系QQ:1071235258QQ群:226134712
error: Sorry,暂时内容不可复制!