开发人员需要同时学习离线和实时两套技术栈,学习成本高,后期系统复杂度和维护成本高;数据在HDFS 和 Kafka两处存储,存储成本高
流批分离架构,数据处理逻辑不一致、计算口径不统一,数据存储在不同的介质中,难以保证两条链路数据的一致性
离线数据更新为天级和小时级,数据查询与导出进程缓慢,难以满足实时趋势分析、实时报表监控等实时场景需求
Kafka架构和数据保留策略不适合长期存储,无法回溯较久远的数据,业务侧难以复核历史数据,不便于数据分析
数栈产品白皮书
基于数栈多年产品实践经验,从数字技术、产品能力、应用实践、服务支持四个方面进行深度研判,为各行业企业的数字化转型提供参考和指导
数据治理行业实践白皮书
基于袋鼠云在数据治理领域的8年深厚积累与实践服务经验,从专业视角逐步剖析数据治理难题,借助行业实践案例解析,为广大读者提供数据治理新思路