• Archive by category "大数据进阶"
Header
Header

Blog Archives

Azkaban——hadoop/spark/hive等大数据任务调度利器

Azkaban是由Linkedin公司开源的一个批量工作流任务调度器,用于在一个工作流内以一个特定的顺序运行一组工作和流程。在Azkaban中使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流,可以用于调度Hadoop、hive、spark等大数据处理业务场景常见的相互依赖的Job。阅读更多

storm简介以及应用场景

Storm是一个分布式实时流式计算平台,具有以下特点:阅读更多

Hive快速编程之关系运算编程实践

Facebook开源的,是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能;阅读更多