在之前三期的实时湖仓系列文章中,我们从业务侧、产品侧、应用侧等几个方向,为大家介绍了实时湖仓方方面面的内容,包括实时湖仓对于企业数字化布局的重要性以及如何进行实时湖仓的落地实践等。
本文将从纯技术的角度,为大家解析实时湖仓的存储原理以及生态选型,为企业建设实时湖仓给出技术方面的参考意见。
实时湖仓能解决什么问题?
大部分人可能都会有这样一个疑问,企业为什么要引入实时湖仓?
如下图所示,引入实时湖仓可以降低运维难度,实现低成本统一存储、中间状态可查,以及提升开发效率。
实时湖仓能够在低成本存储的同时,极大降低数据指标的时延,从传统的 T+1 的时延,降低到到分钟级。
实时湖仓解决方案,利用湖存储的特性和 Flink 的流批计算能力,统一存储和计算,解决业务对数据时效性高要求的需求。
《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu
《数栈V6.0产品白皮书》下载地址:https://fs80.cn/cw0iw1
想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs
同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack