一、前言笔者曾效力于新浪广告DMP组,跑过MapReduce,也写过Storm、Spark Streaming、Hive;也曾作为阿里巴巴回血红包的技术负责人,使用Blink扛住双十一80万QPS流量洪峰,负责数十亿现金红包的发放,该项目代码的精简脱敏版本在阿...
数仓建设真正的难点不在于数仓设计,而在于后续业务发展起来,业务线变的庞大之后的数据治理,而数据治理的范围非常广,包含数据本⾝的管理、数据安全、数据质量、数据成本等。在这么多治理内容中,大家想下最重要的治理是什么?当然是数据质量治理,因为数据质量是数据分析结论有...
大数据处理的挑战现在已经有越来越多的行业和技术领域需求大数据分析系统,例如金融行业需要使用大数据系统结合 VaR(value at risk) 或者机器学习方案进行信贷风控,零售、餐饮行业需要大数据系统实现辅助销售决策,各种 IOT 场景需要大数据系统持续聚合...
云计算的拐点已至,进入成熟期,云原生成为驱动云计算发展的新动力引擎,致力于成为新型基础设施,不仅是企业数字化转型的最佳技术路径,同时也成为新兴领域,人工智能、大数据、边缘计算、5G 等底层基础平台。云原生充分释放了云计算的红利,未来将有更多的业务应用生于云,长...
作者:企业网D1Net为什么良好的数据治理如此重要?考虑一下没有它可能会导致什么:数据质量差,难以使用,缺乏完整性,容易受到网络安全的威胁,不一致且业务用户并不总是可用的数据。换句话说,从业务角度来看,没有数据治理就没有数据存在的意义。数据治理研究所是一个在该...
数据仓库的数据体系严格、治理容易,业务规模越大,ROI 越高;数据湖的数据种类丰富,治理困难,业务规模越大,ROI 越低,但胜在灵活。现在,鱼和熊掌我都想要,应该怎么办?湖仓一体架构就在这种情况下,快速在产业内普及。要构建湖仓一体架构并不容易,需要解决非常多的...
谈到降维,通常会联想到降维打击,降维究竟是什么?如果大家读过刘慈欣的《三体》,相信最让你感到震撼的片段之一就是三体的水滴对阵人类的末日之战。与星球大战和其他科幻大片中展现的不同,三体人并没有祭出舰队,而是派出了一颗看似简单的水滴状探测器,使用最原始、最简单的“...
数据不能有效共享、数据孤岛不能很好打破,制约了政务数据的开发使用,这是个老问题。在当前强调数据为驱动力的发展阶段,这些问题变得尤其突出。所以本篇我们来讨论《政府数字化转型与数字政府建设》第二关键问题——部门间数据共享实现的机制。01数据共享前的因素考量政府部门...
市场上“中台”概念满天飞,一切早已经不再新鲜!早在2015年阿里去欧洲公司SuperSell参观后,便在中国提出了中台战略,随后数据中台、业务中台,技术中台等这些词也被顺势创造出来。如同2013年被称为大数据元年、2017年被称为人工智能元年一样,中台在201...
来源:谈数据,作者:石秀峰全文共4085个字,建议阅读8分钟Hi,大家好!在上一篇文章《数据中台为什么要建标签体系,分类它不香吗?》中,我们介绍了数据中台的一个颇有争议的功能——“标签体系”。有人认为,多维的数据分类体系已经够用了,标签就是一个“鸡肋”;也有人...