实时湖仓实践五讲

实时湖仓实践五讲

Spark-机器学习(5)分类学习之朴素贝叶斯算法

技术共享数栈君 发表了文章 • 0 个评论 • 12 次浏览 • 3 天前 • 来自相关话题

一、朴素贝叶斯什么是朴素贝叶斯 朴素贝叶斯 朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理与特征之间强(朴素)独立假设的分类方法。它简单、易于实现,并且在很多情况下都有不错的分类效果。朴素贝叶斯分类器常用于文本分类,如垃圾邮件的识别。这里的“朴素”一... ...查看全部

12月20日直播预约丨《实时湖仓实践五讲》第五讲:实时湖仓领域的最佳实践解析

活动动态数栈君 发表了文章 • 0 个评论 • 326 次浏览 • 2023-12-19 10:09 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

12月6日直播预约丨《实时湖仓实践五讲》第四讲:实时湖仓架构与技术选型

活动动态沸羊羊 发表了文章 • 0 个评论 • 388 次浏览 • 2023-12-05 11:22 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

如何构建新一代实时湖仓?袋鼠云基于数据湖的探索升级之路

产品交流数栈君 发表了文章 • 0 个评论 • 350 次浏览 • 2023-11-10 11:45 • 来自相关话题

在之前的实时湖仓系列文章中,我们已经介绍了实时湖仓对于当前企业数字化转型的重要性,实时湖仓的功能架构设计,以及实时计算和数据湖结合的应用场景。在本篇文章中,将介绍袋鼠云数栈在构建实时湖仓系统上的探索与落地实践,及未来规划。数栈为什么选择实时湖仓数栈作为一个数据... ...查看全部

10月25日直播预约丨《实时湖仓实践五讲》第三讲:实时湖仓在袋鼠云的落地实践之路

活动动态数栈君 发表了文章 • 0 个评论 • 516 次浏览 • 2023-10-23 18:02 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

从理论到实践,实时湖仓功能架构设计与落地实战

产品交流数栈君 发表了文章 • 0 个评论 • 342 次浏览 • 2023-10-17 17:42 • 来自相关话题

在上篇文章中,我们向大家解释了为什么实时湖仓是当前企业数字化转型过程中的解决之道,介绍了实时计算和数据湖结合的应用场景。(“数据驱动”时代,企业为什么需要实时湖仓?)在这篇文章中,我们将详细介绍在数栈实时开发平台内,实时湖仓的功能架构设计和具体实操案例。功能架... ...查看全部

10月11日直播预告丨《实时湖仓实践五讲》第二讲:实时湖仓功能架构设计与落地实战

活动动态沸羊羊 发表了文章 • 0 个评论 • 664 次浏览 • 2023-10-10 10:42 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

“数据驱动”时代,企业为什么需要实时湖仓?

产品交流数栈君 发表了文章 • 0 个评论 • 654 次浏览 • 2023-09-05 17:42 • 来自相关话题

当谈到数据湖的时候,大家都在说,可以把所有数据(结构化/半结构化/非结构化)一股脑都丢进去,进行统一的元数据管理。然后上层计算对接,进行流批计算/OLAP 分析/算法分析。这个没问题,数据湖确实能承接底层的这部分能力,但是同时出现的问题也是不容忽视的。本文将关... ...查看全部

8月30日直播预告丨《实时湖仓实践五讲》第一讲:企业为什么需要实时湖仓?

活动动态沸羊羊 发表了文章 • 0 个评论 • 405 次浏览 • 2023-08-28 18:01 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

重磅预告丨《实时湖仓实践五讲》开讲啦,带你深入浅出了解实时湖仓

活动动态沸羊羊 发表了文章 • 0 个评论 • 370 次浏览 • 2023-08-25 14:10 • 来自相关话题

在数字化转型背景下,企业的数据量已由GB增长到TB、PB甚至EB;在数据类型上,不仅可以处理结构化数据,还能处理图片、视频等非结构化数据;在数据分析时效性上,已经从离线过渡到近实时,分钟级实时,秒级实时……大规模、高时效、智能化数据处理已是“刚需”,企业需要更... ...查看全部

如何构建新一代实时湖仓?袋鼠云基于数据湖的探索升级之路

产品交流数栈君 发表了文章 • 0 个评论 • 350 次浏览 • 2023-11-10 11:45 • 来自相关话题

在之前的实时湖仓系列文章中,我们已经介绍了实时湖仓对于当前企业数字化转型的重要性,实时湖仓的功能架构设计,以及实时计算和数据湖结合的应用场景。在本篇文章中,将介绍袋鼠云数栈在构建实时湖仓系统上的探索与落地实践,及未来规划。数栈为什么选择实时湖仓数栈作为一个数据... ...查看全部

10月25日直播预约丨《实时湖仓实践五讲》第三讲:实时湖仓在袋鼠云的落地实践之路

活动动态数栈君 发表了文章 • 0 个评论 • 516 次浏览 • 2023-10-23 18:02 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

10月11日直播预告丨《实时湖仓实践五讲》第二讲:实时湖仓功能架构设计与落地实战

活动动态沸羊羊 发表了文章 • 0 个评论 • 664 次浏览 • 2023-10-10 10:42 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

“数据驱动”时代,企业为什么需要实时湖仓?

产品交流数栈君 发表了文章 • 0 个评论 • 654 次浏览 • 2023-09-05 17:42 • 来自相关话题

当谈到数据湖的时候,大家都在说,可以把所有数据(结构化/半结构化/非结构化)一股脑都丢进去,进行统一的元数据管理。然后上层计算对接,进行流批计算/OLAP 分析/算法分析。这个没问题,数据湖确实能承接底层的这部分能力,但是同时出现的问题也是不容忽视的。本文将关... ...查看全部

8月30日直播预告丨《实时湖仓实践五讲》第一讲:企业为什么需要实时湖仓?

活动动态沸羊羊 发表了文章 • 0 个评论 • 405 次浏览 • 2023-08-28 18:01 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

重磅预告丨《实时湖仓实践五讲》开讲啦,带你深入浅出了解实时湖仓

活动动态沸羊羊 发表了文章 • 0 个评论 • 370 次浏览 • 2023-08-25 14:10 • 来自相关话题

在数字化转型背景下,企业的数据量已由GB增长到TB、PB甚至EB;在数据类型上,不仅可以处理结构化数据,还能处理图片、视频等非结构化数据;在数据分析时效性上,已经从离线过渡到近实时,分钟级实时,秒级实时……大规模、高时效、智能化数据处理已是“刚需”,企业需要更... ...查看全部

Spark-机器学习(5)分类学习之朴素贝叶斯算法

技术共享数栈君 发表了文章 • 0 个评论 • 12 次浏览 • 3 天前 • 来自相关话题

一、朴素贝叶斯什么是朴素贝叶斯 朴素贝叶斯 朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理与特征之间强(朴素)独立假设的分类方法。它简单、易于实现,并且在很多情况下都有不错的分类效果。朴素贝叶斯分类器常用于文本分类,如垃圾邮件的识别。这里的“朴素”一... ...查看全部

12月20日直播预约丨《实时湖仓实践五讲》第五讲:实时湖仓领域的最佳实践解析

活动动态数栈君 发表了文章 • 0 个评论 • 326 次浏览 • 2023-12-19 10:09 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

12月6日直播预约丨《实时湖仓实践五讲》第四讲:实时湖仓架构与技术选型

活动动态沸羊羊 发表了文章 • 0 个评论 • 388 次浏览 • 2023-12-05 11:22 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

如何构建新一代实时湖仓?袋鼠云基于数据湖的探索升级之路

产品交流数栈君 发表了文章 • 0 个评论 • 350 次浏览 • 2023-11-10 11:45 • 来自相关话题

在之前的实时湖仓系列文章中,我们已经介绍了实时湖仓对于当前企业数字化转型的重要性,实时湖仓的功能架构设计,以及实时计算和数据湖结合的应用场景。在本篇文章中,将介绍袋鼠云数栈在构建实时湖仓系统上的探索与落地实践,及未来规划。数栈为什么选择实时湖仓数栈作为一个数据... ...查看全部

10月25日直播预约丨《实时湖仓实践五讲》第三讲:实时湖仓在袋鼠云的落地实践之路

活动动态数栈君 发表了文章 • 0 个评论 • 516 次浏览 • 2023-10-23 18:02 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

从理论到实践,实时湖仓功能架构设计与落地实战

产品交流数栈君 发表了文章 • 0 个评论 • 342 次浏览 • 2023-10-17 17:42 • 来自相关话题

在上篇文章中,我们向大家解释了为什么实时湖仓是当前企业数字化转型过程中的解决之道,介绍了实时计算和数据湖结合的应用场景。(“数据驱动”时代,企业为什么需要实时湖仓?)在这篇文章中,我们将详细介绍在数栈实时开发平台内,实时湖仓的功能架构设计和具体实操案例。功能架... ...查看全部

10月11日直播预告丨《实时湖仓实践五讲》第二讲:实时湖仓功能架构设计与落地实战

活动动态沸羊羊 发表了文章 • 0 个评论 • 664 次浏览 • 2023-10-10 10:42 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

“数据驱动”时代,企业为什么需要实时湖仓?

产品交流数栈君 发表了文章 • 0 个评论 • 654 次浏览 • 2023-09-05 17:42 • 来自相关话题

当谈到数据湖的时候,大家都在说,可以把所有数据(结构化/半结构化/非结构化)一股脑都丢进去,进行统一的元数据管理。然后上层计算对接,进行流批计算/OLAP 分析/算法分析。这个没问题,数据湖确实能承接底层的这部分能力,但是同时出现的问题也是不容忽视的。本文将关... ...查看全部

8月30日直播预告丨《实时湖仓实践五讲》第一讲:企业为什么需要实时湖仓?

活动动态沸羊羊 发表了文章 • 0 个评论 • 405 次浏览 • 2023-08-28 18:01 • 来自相关话题

如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋... ...查看全部

重磅预告丨《实时湖仓实践五讲》开讲啦,带你深入浅出了解实时湖仓

活动动态沸羊羊 发表了文章 • 0 个评论 • 370 次浏览 • 2023-08-25 14:10 • 来自相关话题

在数字化转型背景下,企业的数据量已由GB增长到TB、PB甚至EB;在数据类型上,不仅可以处理结构化数据,还能处理图片、视频等非结构化数据;在数据分析时效性上,已经从离线过渡到近实时,分钟级实时,秒级实时……大规模、高时效、智能化数据处理已是“刚需”,企业需要更... ...查看全部

在数字化转型背景下,企业的数据量已由GB增长到TB、PB甚至EB;在数据类型上,不仅可以处理结构化数据,还能处理图片、视频等非结构化数据;在数据分析时效性上,已经从离线过渡到近实时,分钟级实时,秒级实时……

大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。

《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋战于企业数字化一线的核心产品&技术专家,结合实践案例分析,和听众共同探讨实时湖仓领域的前沿技术。