大数据离线数仓项目《知行教育》完整资料
项目名称:知行教育数仓项目项目架构:
数据源:电咨、线下面授、在线教育等OLTP系统的数据,大多存储于mysql。
数据抽取:使用sqoop实现关系型数据库和大数据集群的双向同步。 数据存储:HDFS
数据清洗:数据的清洗、转换、统计分析等都是使用基于CM管理的Hive来进行的。
数据分析:数据的清洗、转换、统计分析等都是使用基于CM管理的Hive来进行的。
数据同步:使用sqoop实现关系型数据库和大数据集群的双向同步。 OLAP数据服务:采用常用的Mysql数据库。
开发环境:
jdk:Jdk1.8
Scala:2.11.8
CDH6.2.1: zookeeper-3.4.5-cdh6.2.1、hadoop-3.0.0-cdh6.2.1,hive-2.1.1-cdh6.2.1、hue-4.3.0-cdh6.2.1
Sqoop:sqoop-1.4.7-cdh6.2.1
Mysql:5.7
Zeppelin:0.8.0
项目需求:
4.在线教育业务需求
4.1访问和咨询用户数据看板
4.2意向用户看板
4.3有效线索看板
44报名用户看板
4.5学生出勤看板
**** Hidden Message *****
6666666666666666666 6666666666666666666666 6666666666666666666666 大数据离线数仓项目《知行教育》完整资料 感谢楼主 前来学习!!!! 谢谢分享
页:
[1]