我爱it学习

 找回密码
 立即注册
搜索
123
返回列表 发新帖
楼主: 31653025

[大数据/人工智能] 大数据处理领域重磅项目《物流数仓》(采集系统、离线数仓、实时数仓)完整资料

[复制链接]

0

主题

95

回帖

204

积分

终身VIP

积分
204
发表于 2024-12-21 09:21:47 | 显示全部楼层
感谢大佬分享
回复

使用道具 举报

0

主题

317

回帖

758

积分

终身VIP

积分
758
发表于 2024-12-22 12:34:31 | 显示全部楼层
本套教程堪称物流行业
大数据处理领域的重磅之作,项目借助真实物流行业的海量业务数据,构建了完整的数据采
集、分析、处理、展示通道,严格遵循主流数据仓库建模理论,搭建了高效率、高组织性、
高可实施性的数仓架构体系。

教程共分三大部分:采集系统、离线数仓、实时数仓。项目拥有完善的离线指标体系和实时
指标体系,各指标体系均进行了完整的指标拆解与分析,形成了庞大的指标网络。涵盖 30
多个 Shell 脚本,30 多张业务数据原始表格,100 多张数仓分层表,分析展示了上百个离
线指标、几十个实时指标。

项目采用 FlinkCDC 和 DataX 作为数据采集工具,灵活设计数据采集策略,将采集来的数
据同时服务于离线数仓和实时数仓。结合阿里巴巴成熟的数仓构建实践,总结出一套数仓建
模理论体系,并梳理出通用的数仓建模步骤。分别使用 Hive 和 Flink 构建离线数仓和实时
数仓,采用了流行的任务流调度系统 DolphinScheduler。
回复

使用道具 举报

0

主题

329

回帖

678

积分

终身VIP

积分
678
发表于 2025-1-14 09:37:42 | 显示全部楼层
感谢楼主 前来学习!!!!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

侵权投诉|Archiver|小黑屋|我爱it学习

GMT+8, 2025-4-27 23:02

Powered by Discuz!

© 2001-2023 52itstudy.

快速回复 返回顶部 返回列表