数据中台数据中台
申请试用
新闻动态
了解袋鼠云最新动态
新闻动态>数据湖是什么?>
数据湖是什么?
20211213|文章来源:-

据湖(Data Lake)是Pentaho公司CTO James Dixon提出来的一种数据存储理念—即在系统或存储库中以自然格式存储数据的方法。

数据湖作为一个集中的存储库,可以在其中存储任意规模的结构化和非结构化数据。

在数据湖中,可以存储不需要对其进行结构化的数据,这样就可以运行不同类型的分析。下面的定义是维基百科所给出的“数据湖”定义。

数据湖的权威定义:[来自:维基百科]

数据湖(Data Lake)是一个存储企业的各种各样原始数据的大型仓库,其中的数据可供存取、处理、分析及传输。数据湖是以其自然格式存储的数据的系统或存储库,通常是对象Blob或文件。

数据湖通常是企业所有数据的单一存储,包括源系统数据的原始副本,以及用于报告、可视化、分析和机器学习等任务的转换数据。

数据湖可以包括来自关系数据库(行和列)的结构化数据,半结构化数据(CSV,日志,XML,JSON),非结构化数据(电子邮件,文档,PDF)和二进制数据(图像,音频,视频)。

数据湖能够帮助企业实现数据的集中式管理等多种能力;

数据湖融合了先进的数据科学、机器学习和人工智能技术,帮助企业构建更加优化的数据运营模型,为企业提供预测分析、推荐模型等能力,这些模型能够刺激企业能力的持续增长,不断赋能于企业增长。

数据湖能从以下方面帮助到企业:
一、实现数据治理;

二、通过应用机器学习与人工智能技术实现商业智能

三、预测分析和模型推荐,例如:领域特定的推荐引擎 ;

四、信息追踪与一致性保障;

五、基于历史数据分析生成新的数据维度,挖掘数据深度价值;

六、提供集中式存储的企业数据中心,并提供基于数据传输优化的数据服务;

七、协助企业实现灵活的增长决策。

 

 

免费试用袋鼠云数字化基础软件,开启企业数字化增长之旅
免费试用袋鼠云数字化基础软件,开启企业数字化增长之旅
袋鼠云立体IP
在线咨询
在线咨询
电话咨询
电话咨询
微信社群
微信社群
资料下载
资料下载
返回顶部
返回顶部