橙子的短想法
11:11 · Oct 27, 2020 · Tue
鱼儿的博客
hive系列 – 数仓分层Demo
鱼儿的博客
hive系列 - 数仓分层Demo | 鱼儿的博客
大数据越来越重要,要管理与利用好这些数据就需要建设数据仓库。 数仓建设是有一套建模理论的,本文通过一个简单例子来理解数仓分层的基本样貌。 假设我们是天猫商城,需要建设一个数据仓库,那么我们首先hive建库: 数仓的原始数据来自外部系统,可以归纳为2类: 日志通常采用flume工具写入到HDFS,其记录格式一般是JSON。 数据库通常采用sqoop工具从mysql提取数据到HDFS,
Home
Powered by
BroadcastChannel
&
Sepia