互联网和移动互联网技术开启了大规模生产、分享和应用数据的大数据时代。面对如此庞大规模的数据,如何存储?如何计算?各大互联网巨头都进行了探索。 Hadoop技术生态起源1.Google三篇论文揭开Hadoop序幕Google的三篇论文 GFS(2003)、Map...
当前,以数据为关键生产要素的数字经济已经进入全新时代,数据成为了推动社会经济发展的核心动能,数据驱动的数字中国、数字政府和数字企业正在悄然重塑。而数据治理作为数据的核心管理手段和管理范式,急需一套标准化体系框架,中国通信标准化协会于2021年12月发布《数据治...
近年来数字经济日益融入经济社会发展和人民生活的全过程,已成为经济增长的新动能。推动数字经济建设政策不断加码,数字化发展、转型是企业未来的发展趋势。我国“十四五”规划明确提出加快数字化发展,建设数字中国,推动数据赋能全产业链协同转型。全球已有170+国家陆续发布...
从直觉上讲,我们都明白数据是有价值的。这就是为什么很多公司都在数据上投入大量资金,也是为什么这么多人选择数据作为职业道路的原因。根据国际财务报告准则(IFRS)(甚至经合组织(OECD)的标准),数据也符合资产的定义。资产是由于过去发生的事件而由实体控制的资源...
前言近几年来数据的量级在疯狂的增长,由此带来了系列的问题。作为对人工智能团队的数据支撑,我们听到的最多的质疑是 “正确的数据集”,他们需要正确的数据用于他们的分析。我们开始意识到,虽然我们构建了高度可扩展的数据存储,实时计算等等能力,但是我们的团队仍然在浪费时...
Keep It Simple, Stupid.这是开发人耳熟能详的 KISS 原则,也像是一句有调侃意味的善意提醒,提醒每个前端人,简洁易懂的用户体验和删繁就简的搭建逻辑就是前端开发的至简大道。这也是袋鼠云数栈前端开发团队追求的目标。数栈是一个专注一站式产品体...
“大数据已经不是一个行业,而更是基建。”在中国大数据产业规模稳步增长,数字化转型意识越来越深入人心的今天,这句话显得实在准确。此前中国信息协会大数据分会发布的《2021-2022中国大数据产业发展报告》(以下简称《报告》),以中国大数据行业自2018年以来的行...
活动时间2023/01/10 19:00 - 20:30报名地址https://www.slidestalk.com/m/1388开源数据库系统以其免费、开源、透明等特点在广大互联网公司中广为应用且起着至关重要的作用。本次活动邀请了袋鼠云资深Java开发专家赵...
Calcite在大数据系统中有着广泛的运用, 比如Apache Flink, Apache Drill等都大量使用了Calcite,理解Calcite的原理可以说已经成为理解大数据系统中SQL访问层实现原理的必备条件之一。但是不少人在学习Calcite的过程中...
1「数据应用」是数据产生业务价值的最后一环,也是我们所谓的第五个馒头。一切前面的准备都是为了最后的饱腹感和愉悦感。数据应用在业务场景中可以直接定性或定量的体现业务价值,而前面所有步骤的进行,都是以数据应用能够最终产生业务价值为前提。近年来,随着袋鼠云数据中台项...