GitPedia

Bigdata hub

数据建设与大数据技术知识体系,包含hadoop、hive、spark、flink主流框架和系列框架,数据中台、数据湖、数据治理、数仓建设、数据化转型等

From fancyChuan·Updated June 16, 2026·View on GitHub·

- 基础框架 - [hadoop](./hadoop):HDFS、MR、YARN及高级话题、企业优化 - [hive](./hive):基础使用、优化、SQL编译过程、数据血缘、进阶、权限控制 - [hive优化](./hive/hive调优) - [hivesql功力提升专项](./hive/HiveSQL功力提升.md):各类难度较高的需求场景的实现方式 - [hive数据血缘](./hive/hive数据血缘) - [数仓工作与建设](./hive/数仓工作与建设) - [数仓建模](./hive/数仓建模) - [spark](./spark):spark-core、spark-sql、streaming、优化、进阶 - [flink](./flink):flink基础知识、API、CEP、CDC、流式架构、案例实践 - 数据存储 - [hbase](./hbase):核心API、进阶、与Hive和MR集成、Phoenix集成 - [kafka](./kafka):命令行、API、企业级实战 - [elasticsearch](./elasticsearch) - [zooke... The project is written primarily in Java, first published in 2019. Key topics include: bigdata, bigdata-construction, bigdata-platform, clickhouse, flink.

bigdata-hub

大数据相关的技术可以分为:传输、存储、计算三大方面

知识体系

程序包下载

学习资料

Contributors

Showing top 1 contributor by commit count.

View all contributors on GitHub →

This article is auto-generated from fancyChuan/bigdata-hub via the GitHub API.Last fetched: 6/19/2026