数据湖分析

数据湖分析

基于Hadoop的数据湖建设方案

知识百科数栈君 发表了文章 • 0 个评论 • 63 次浏览 • 2024-03-08 09:37 • 来自相关话题

10月25日直播预约丨《实时湖仓实践五讲》第三讲:实时湖仓在袋鼠云的落地实践之路

活动动态数栈君 发表了文章 • 0 个评论 • 468 次浏览 • 2023-10-23 18:02 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

数据湖架构:设计、部署和管理

网友分享数栈君 发表了文章 • 0 个评论 • 194 次浏览 • 2023-10-20 10:29 • 来自相关话题

随着大数据时代的到来,数据已经成为企业的重要资产,而数据湖架构作为大数据领域中的重要组成部分,为企业提供了一个集中式的数据处理、存储和管理平台。本文将探讨数据湖架构的设计、部署和管理,帮助读者更好地了解和掌握这一关键技术。一、数据湖架构设计数据湖架构的设计应从... ...查看全部

一文详解在数据湖中实现数据治理

网友分享数栈君 发表了文章 • 0 个评论 • 171 次浏览 • 2023-10-20 10:29 • 来自相关话题

随着大数据时代的到来,数据治理已经成为企业数据管理的关键环节。数据治理旨在确保数据的质量、安全性和有效利用,同时降低数据管理的风险和成本。本文将详细探讨在数据湖中如何实现数据治理,帮助企业更好地管理和利用数据资产。一、了解数据治理和数据湖数据治理是指对数据进行... ...查看全部

数据湖和数据仓库有什么区别?

网友分享数栈君 发表了文章 • 0 个评论 • 146 次浏览 • 2023-10-20 10:28 • 来自相关话题

数据湖和数据仓库是两种不同的数据处理和存储方式,它们之间存在一些明显的区别。一、数据湖和数据仓库的基本定义数据湖:数据湖是一个集中式存储和处理大量数据的平台,主要包括存储层、处理层、分析层和应用层四个部分。它以廉价的数据存储硬件为基础,以开源数据处理软件为支撑... ...查看全部

如何利用数据湖进行实时分析?

网友分享数栈君 发表了文章 • 0 个评论 • 149 次浏览 • 2023-10-20 10:28 • 来自相关话题

随着企业数据量的不断增长,实时分析成为了企业的重要需求。数据湖作为一个集中式的数据处理、存储和管理的平台,为企业提供了快速、高效的数据处理和分析能力。本文将探讨如何利用数据湖进行实时分析,帮助企业更好地利用数据资产,提高业务决策的准确性和效率。一、数据湖实时分... ...查看全部

数据湖的相关定义是什么?

网友分享数栈君 发表了文章 • 0 个评论 • 166 次浏览 • 2023-10-20 10:25 • 来自相关话题

近几年数据湖的概念非常火热,但是数据湖的定义并不统一,我们先看下数据湖的相关定义。Wikipedia对数据湖的定义:A data lake is a system or repository of datastored in its natural/raw f... ...查看全部

大数据领域发展20年的变与不变

网友分享数栈君 发表了文章 • 0 个评论 • 167 次浏览 • 2023-10-20 10:24 • 来自相关话题

大数据领域从本世纪初发展到现在,已经历20年。从宏观层面观察其中的发展规律,可以高度概括成如下五个方面:1. 数据保持高速增长- 从5V核心要素看,大数据领域保持高速增长。阿里巴巴经济体,作为一个重度使用并着力发展大数据领域的公司,过去5年数据规模保持高速增长... ...查看全部

数据分析方法论——OSM模型

知识百科数栈君 发表了文章 • 0 个评论 • 740 次浏览 • 2023-07-28 16:40 • 来自相关话题

数据分析方法论——OSM模型OSM模型是一种常见的数据分析方法论,它是先将业务需求转化为数据需求,然后通过数据清洗、数据挖掘、数据可视化等步骤,将数据转化为信息和知识。下面我们就介绍一下OSM模型的基本概念和应用。一、OSM模型的基本概念OSM模型的全称是“O... ...查看全部

数据分析方法论之5W2H分析法

知识百科数栈君 发表了文章 • 0 个评论 • 527 次浏览 • 2023-07-28 16:31 • 来自相关话题

数据分析方法论之5W2H分析法:提升数据分析效率与质量在数据驱动的时代,数据分析已经成为各行业重要的工作之一。5W2H分析法作为数据分析方法论的一种,能够帮助分析师快速、有效地进行数据分析和问题解决。下面我们将介绍5W2H分析法的概念、应用和优势,以及如何结合... ...查看全部

10月25日直播预约丨《实时湖仓实践五讲》第三讲:实时湖仓在袋鼠云的落地实践之路

活动动态数栈君 发表了文章 • 0 个评论 • 468 次浏览 • 2023-10-23 18:02 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

Apache Hudi 在袋鼠云数据湖平台的设计与实践

产品交流数栈君 发表了文章 • 0 个评论 • 361 次浏览 • 2023-05-26 16:38 • 来自相关话题

在大数据处理中,实时数据分析是一个重要的需求。随着数据量的不断增长,对于实时分析的挑战也在不断加大,传统的批处理方式已经不能满足实时数据处理的需求,需要一种更加高效的技术来解决这个问题。Apache Hudi(Hadoop Upserts Deletes an... ...查看全部

数据湖选型指南:Hudi vs Iceberg 数据更新能力深度对比

产品交流数栈君 发表了文章 • 0 个评论 • 644 次浏览 • 2023-03-17 13:43 • 来自相关话题

数据湖作为新一代大数据基础设施,近年来持续火热,许多前线的同学都在讨论数据湖应该怎么建,许多企业也都在构建或者计划构建自己的数据湖。基于此,自然引发了许多关于数据湖选型的讨论和探究。但是经过搜索之后我们发现,网上现存的很多内容都是基于较早之前的开源信息做出的结... ...查看全部

袋鼠云产品功能更新报告03期丨产品体验全面优化,请查收!

产品交流小美 发表了文章 • 0 个评论 • 407 次浏览 • 2023-01-03 17:38 • 来自相关话题

年底啦~2022 年即将走到尾声,不过袋鼠云对产品品质的坚持始终如一,这段时间我们对产品本身以及客户反馈的一些问题进行了持续的更新和优化,例如新增任务告警,进行了 Connector 相关功能优化,以及支持跨时间分区圈群等。以下为袋鼠云产品功能更新报告第三期内... ...查看全部

袋鼠云数栈技术团队获开源中国“2022年度优秀开源技术团队”

开源动态小美 发表了文章 • 0 个评论 • 373 次浏览 • 2022-12-15 15:17 • 来自相关话题

近日,在“开源中国(OSCHINA)”开展的年度评选中,袋鼠云数栈技术团队凭借在2022年间的技术分享频率及质量、运营积极性等多方面的表现,荣获“2022年度优秀开源技术团队”的称号,这也是袋鼠云数栈技术团队连续第二年获得此奖项。开源中国作为国内最大的开源技术... ...查看全部

从数据治理到数据应用,制造业企业如何突破数字化转型困境丨行业方案

最佳实践小美 发表了文章 • 0 个评论 • 376 次浏览 • 2022-12-15 15:14 • 来自相关话题

我国制造业拥有31个大类、179个中类和609个小类,是全球产业门类最齐全、产业体系最完整的制造业。作为世界工厂,中国制造业在拉动本国经济增长、促进本国就业等方面贡献卓越,更是我国民生消费的底层基础。同时,中国从原来的原料出口国,逐步转为工业品中间品、中间品等... ...查看全部

行业方案 | 新规落地,企业集团财务公司如何构建数智财务体系?

最佳实践小美 发表了文章 • 0 个评论 • 379 次浏览 • 2022-12-14 17:46 • 来自相关话题

企业集团财务公司(以下简称财务公司)是指以加强企业集团资金集中管理和提高企业集团资金使用效率为目的,依托企业集团、服务企业集团,为企业集团成员单位提供金融服务的非银行金融机构。通俗来讲财务公司是大型企业集团内部的银行,是需要向央行缴纳存款准备金的一种金融机构。... ...查看全部

袋鼠云数据湖平台「DataLake」,存储全量数据,打造数字底座

产品交流小美 发表了文章 • 0 个评论 • 556 次浏览 • 2022-11-25 11:39 • 来自相关话题

一、什么是数据湖?在探讨数据湖技术或如何构建数据湖之前,我们需要先明确,什么是数据湖?数据湖的起源,应该追溯到 2010 年 10 月。基于对半结构化、非结构化存储的需求,同时为了推广自家的 Pentaho 产品以及 Hadoop,2010 年 Pentaho... ...查看全部

请问有福茶网的数字化转型案例吗?

回复

产品交流小美 回复了问题 • 1 人关注 • 1 个回复 • 452 次浏览 • 2022-12-14 17:55 • 来自相关话题

基于Hadoop的数据湖建设方案

知识百科数栈君 发表了文章 • 0 个评论 • 63 次浏览 • 2024-03-08 09:37 • 来自相关话题

10月25日直播预约丨《实时湖仓实践五讲》第三讲:实时湖仓在袋鼠云的落地实践之路

活动动态数栈君 发表了文章 • 0 个评论 • 468 次浏览 • 2023-10-23 18:02 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

数据湖架构:设计、部署和管理

网友分享数栈君 发表了文章 • 0 个评论 • 194 次浏览 • 2023-10-20 10:29 • 来自相关话题

随着大数据时代的到来,数据已经成为企业的重要资产,而数据湖架构作为大数据领域中的重要组成部分,为企业提供了一个集中式的数据处理、存储和管理平台。本文将探讨数据湖架构的设计、部署和管理,帮助读者更好地了解和掌握这一关键技术。一、数据湖架构设计数据湖架构的设计应从... ...查看全部

一文详解在数据湖中实现数据治理

网友分享数栈君 发表了文章 • 0 个评论 • 171 次浏览 • 2023-10-20 10:29 • 来自相关话题

随着大数据时代的到来,数据治理已经成为企业数据管理的关键环节。数据治理旨在确保数据的质量、安全性和有效利用,同时降低数据管理的风险和成本。本文将详细探讨在数据湖中如何实现数据治理,帮助企业更好地管理和利用数据资产。一、了解数据治理和数据湖数据治理是指对数据进行... ...查看全部

数据湖和数据仓库有什么区别?

网友分享数栈君 发表了文章 • 0 个评论 • 146 次浏览 • 2023-10-20 10:28 • 来自相关话题

数据湖和数据仓库是两种不同的数据处理和存储方式,它们之间存在一些明显的区别。一、数据湖和数据仓库的基本定义数据湖:数据湖是一个集中式存储和处理大量数据的平台,主要包括存储层、处理层、分析层和应用层四个部分。它以廉价的数据存储硬件为基础,以开源数据处理软件为支撑... ...查看全部

如何利用数据湖进行实时分析?

网友分享数栈君 发表了文章 • 0 个评论 • 149 次浏览 • 2023-10-20 10:28 • 来自相关话题

随着企业数据量的不断增长,实时分析成为了企业的重要需求。数据湖作为一个集中式的数据处理、存储和管理的平台,为企业提供了快速、高效的数据处理和分析能力。本文将探讨如何利用数据湖进行实时分析,帮助企业更好地利用数据资产,提高业务决策的准确性和效率。一、数据湖实时分... ...查看全部

数据湖的相关定义是什么?

网友分享数栈君 发表了文章 • 0 个评论 • 166 次浏览 • 2023-10-20 10:25 • 来自相关话题

近几年数据湖的概念非常火热,但是数据湖的定义并不统一,我们先看下数据湖的相关定义。Wikipedia对数据湖的定义:A data lake is a system or repository of datastored in its natural/raw f... ...查看全部

大数据领域发展20年的变与不变

网友分享数栈君 发表了文章 • 0 个评论 • 167 次浏览 • 2023-10-20 10:24 • 来自相关话题

大数据领域从本世纪初发展到现在,已经历20年。从宏观层面观察其中的发展规律,可以高度概括成如下五个方面:1. 数据保持高速增长- 从5V核心要素看,大数据领域保持高速增长。阿里巴巴经济体,作为一个重度使用并着力发展大数据领域的公司,过去5年数据规模保持高速增长... ...查看全部

数据分析方法论——OSM模型

知识百科数栈君 发表了文章 • 0 个评论 • 740 次浏览 • 2023-07-28 16:40 • 来自相关话题

数据分析方法论——OSM模型OSM模型是一种常见的数据分析方法论,它是先将业务需求转化为数据需求,然后通过数据清洗、数据挖掘、数据可视化等步骤,将数据转化为信息和知识。下面我们就介绍一下OSM模型的基本概念和应用。一、OSM模型的基本概念OSM模型的全称是“O... ...查看全部

数据分析方法论之5W2H分析法

知识百科数栈君 发表了文章 • 0 个评论 • 527 次浏览 • 2023-07-28 16:31 • 来自相关话题

数据分析方法论之5W2H分析法:提升数据分析效率与质量在数据驱动的时代,数据分析已经成为各行业重要的工作之一。5W2H分析法作为数据分析方法论的一种,能够帮助分析师快速、有效地进行数据分析和问题解决。下面我们将介绍5W2H分析法的概念、应用和优势,以及如何结合... ...查看全部