使用袋鼠云数栈的某教育行业客户,在之前的信息化过程中建设了多个系统,已经意识到自身数据孤立的现状,面对TB级的数据量,需要更高效的方式进行数据治理和分析,为业务方提供高质量数据。其实,数据治理不仅仅是教育行业用户的痛点,同样也是其他行业进行大数据平台建设和数据...

互联网和移动互联网技术开启了大规模生产、分享和应用数据的大数据时代。面对如此庞大规模的数据,如何存储?如何计算?各大互联网巨头都进行了探索。 Hadoop技术生态起源1.Google三篇论文揭开Hadoop序幕Google的三篇论文 GFS(2003)、Map...

从直觉上讲,我们都明白数据是有价值的。这就是为什么很多公司都在数据上投入大量资金,也是为什么这么多人选择数据作为职业道路的原因。根据国际财务报告准则(IFRS)(甚至经合组织(OECD)的标准),数据也符合资产的定义。资产是由于过去发生的事件而由实体控制的资源...

“大数据已经不是一个行业,而更是基建。”在中国大数据产业规模稳步增长,数字化转型意识越来越深入人心的今天,这句话显得实在准确。此前中国信息协会大数据分会发布的《2021-2022中国大数据产业发展报告》(以下简称《报告》),以中国大数据行业自2018年以来的行...

一、传统数据界面的问题当我们把企业数据化的事情提升到战略高度时,会发现当前的种种情况,不足以满足这样的定位。传统数据界面的几个最大问题包括:1. 难以形成自驱力企业数据化是复杂工程,涉及到企业中的多种要素,企业数据化整体规划和设计不足,各种问题相互缠绕,数据化...

数据中台之数据集成1在现代企业中,由于使用场景、业务形态、技术选型、开发架构的差异,往往有多个异构的、基于不同的软硬件平台上的信息系统同时运行,这些系统的数据源彼此独立、相互封闭,使得数据难以在系统之间交流、共享和融合,从而形成了「信息孤岛」。随着信息化应用的...

金融业天然就是一个经营数据的行业,一直对数字技术保持高度重视,是数字化转型最早和数字技术应用最广的行业之一。在金融和技术融合过程中,数据治理是关键。当前金融数据治理已由过去局部数据管理,发展到统筹数据整合、智能应用、数据驱动决策和数据开放融合,这对金融数据治理...

数据指标就是将大数据之“大”的精髓给提炼出来,展现每日观察数据的使用者最迫切想要看到的统计量。数据指标体系并不是第三方服务公司的专利,只要对埋点科学地进行数据采集,每个成型的互联网公司都可以自己搭建数据指标体系。数据之大,很多时候人们并不知从哪里着手,甚至弄不...

一、离线数仓建设背景离线数据是相对实时数据而言的数据产出,不同于实时数据,离线数据一般是 T+1 天处理,也就是说昨天产生的数据至少要今天才能看到计算结果。离线数据一般应用于对数据时效要求不高,需要基于一段时间的历史数据计算才能得到结果的场景,我们大致可以分为...

年底啦~2022 年即将走到尾声,不过袋鼠云对产品品质的坚持始终如一,这段时间我们对产品本身以及客户反馈的一些问题进行了持续的更新和优化,例如新增任务告警,进行了 Connector 相关功能优化,以及支持跨时间分区圈群等。以下为袋鼠云产品功能更新报告第三期内...
