常用的数据仓库

常用的数据仓库

常用的数据仓库

知识百科沸羊羊 发表了文章 • 0 个评论 • 114 次浏览 • 2023-04-14 16:00 • 来自相关话题

大数据技术漫谈 ——从Hadoop、Storm、Spark、HBase到Hive、Flink、Lindorm

网友分享包袋鼠 发表了文章 • 0 个评论 • 1502 次浏览 • 2021-12-24 11:05 • 来自相关话题

一、前言笔者曾效力于新浪广告DMP组,跑过MapReduce,也写过Storm、Spark Streaming、Hive;也曾作为阿里巴巴回血红包的技术负责人,使用Blink扛住双十一80万QPS流量洪峰,负责数十亿现金红包的发放,该项目代码的精简脱敏版本在阿... ...查看全部

数据仓库之数据质量建设(深度好文)

网友分享包袋鼠 发表了文章 • 0 个评论 • 537 次浏览 • 2021-12-24 10:56 • 来自相关话题

数仓建设真正的难点不在于数仓设计,而在于后续业务发展起来,业务线变的庞大之后的数据治理,而数据治理的范围非常广,包含数据本⾝的管理、数据安全、数据质量、数据成本等。在这么多治理内容中,大家想下最重要的治理是什么?当然是数据质量治理,因为数据质量是数据分析结论有... ...查看全部

常用的数据仓库

知识百科沸羊羊 发表了文章 • 0 个评论 • 114 次浏览 • 2023-04-14 16:00 • 来自相关话题

大数据技术漫谈 ——从Hadoop、Storm、Spark、HBase到Hive、Flink、Lindorm

网友分享包袋鼠 发表了文章 • 0 个评论 • 1502 次浏览 • 2021-12-24 11:05 • 来自相关话题

一、前言笔者曾效力于新浪广告DMP组,跑过MapReduce,也写过Storm、Spark Streaming、Hive;也曾作为阿里巴巴回血红包的技术负责人,使用Blink扛住双十一80万QPS流量洪峰,负责数十亿现金红包的发放,该项目代码的精简脱敏版本在阿... ...查看全部

数据仓库之数据质量建设(深度好文)

网友分享包袋鼠 发表了文章 • 0 个评论 • 537 次浏览 • 2021-12-24 10:56 • 来自相关话题

数仓建设真正的难点不在于数仓设计,而在于后续业务发展起来,业务线变的庞大之后的数据治理,而数据治理的范围非常广,包含数据本⾝的管理、数据安全、数据质量、数据成本等。在这么多治理内容中,大家想下最重要的治理是什么?当然是数据质量治理,因为数据质量是数据分析结论有... ...查看全部