Hive快速编程之关系运算编程实践 | AiTi修炼|重剑无锋,拈花微笑
Header
Header

Hive快速编程之关系运算编程实践

1、什么是Hive
  •  hive是由Facebook开源的,是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能;
  •  hive 中定义了简单的类 SQL 查询语言(HQL),本质是将SQL转换为MapReduce程序,允许熟悉传统关系型 SQL 的用户/开发人员快速应用Hadoop分布式能力进行数据存储、查询和分析等;
  • hive其官方网站为http://hive.apache.org/,在其官网有丰富的文档资料供学习参考。


2、为什么学习Hive

  • hive是hadoop生态体系的重要组件,其底层实际不存储和计算数据,依赖于HDFS和MapReduce,巧妙地在sql与MapReduce任务转换之间面向普通用户提供一层透明的代理服务,其源码实现为深入理解hadoop编程应用提供了不少借鉴学习的资料;
  • hive支持标准的SQL语法,免去了用户编写MapReduce程序的过程,大大减少了公司的开发成本,是熟悉传统关系型数据库编程、运维人员切入大数据技术领域学习实践的;    
  • hive是为大数据批量处理/大数据仓库而生的,Hive的出现解决了传统的关系型数据库(MySql、Oracle)在大数据处理上的瓶颈,同时也是很多公司在大数据ETL处理的的一个广泛应用工具。
3、怎么学习Hive
  •  一门大数据IT技术的修炼,其秘诀无他——了解技术背后的原理之后,更加需要在实际从不同的应用场景中,去不断实践、动手编程以及思考总结。
 ——写在前面

    本文是Hive快速编程中关于关系运算编程实践的相关实践总结,在博客进行记录以便后续工作需要可以快速查到。

rscala.com版权所有,本文Hive快速编程之关系运算编程实践转载请注明出处:http://rscala.com/index.php/300.html

该文章归档分类于 Hive实践, 大数据进阶

Leave a Reply

电子邮件地址不会被公开。 必填项已用*标注

*

code