数据中台

数据中台

Spark-机器学习(8)分类学习之随机森林

知识百科数栈君 发表了文章 • 0 个评论 • 31 次浏览 • 2024-05-10 11:50 • 来自相关话题

 一、随机森林随机森林模型什么是随机森林?随机森林(Random Forest) 是一种基于决策树的集成学习算法,由多棵决策树组成,且每棵树的建立都依赖于一个独立抽取的样本集。在分类问题中,随机森林通过集成学习的思想将多棵树(决策树)的预测结果进行汇总,从而得... ...查看全部

私域流量优化:如何利用 AIPL 模型洞察客户生命周期价值

产品交流数栈君 发表了文章 • 0 个评论 • 42 次浏览 • 2024-05-10 10:40 • 来自相关话题

在当今这个数字化时代,商业战场的硝烟从未如此浓烈。随着互联网红利的逐渐消退,公域流量的成本水涨船高,企业间对于有限用户资源的争夺已进入白热化阶段。每一次点击、每一个曝光背后,都是企业不得不承担的高昂代价。在此背景下,传统的依赖公域流量获取新客的模式正遭受前所未... ...查看全部

大数据在电力需求侧管理中的应用与效益分析

知识百科数栈君 发表了文章 • 0 个评论 • 33 次浏览 • 2024-05-09 13:46 • 来自相关话题

随着全球能源消耗的持续增长和环境保护意识的提升,电力需求侧管理(Demand Side Management, DSM)成为电力系统高效运作的重要组成部分。电力需求侧管理指的是通过技术和经济手段调整和控制电力消费的时间、方式和结构,以提高能源效率和经济效益,同... ...查看全部

大数据赋能零售业:基于购物行为的店铺布局优化

知识百科数栈君 发表了文章 • 0 个评论 • 38 次浏览 • 2024-05-09 13:46 • 来自相关话题

随着科技的不断进步,大数据已经成为了各个领域的重要工具。在零售行业中,大数据的应用也日益显现出其独特的价值。通过对海量购物行为的数据分析,零售商可以优化店铺布局,提升销售业绩。一、购物行为数据分析购物行为数据分析是优化店铺布局的基础。通过收集和分析顾客在店内的... ...查看全部

bigtable,分布式数据库的鼻祖

知识百科数栈君 发表了文章 • 0 个评论 • 45 次浏览 • 2024-05-09 11:46 • 来自相关话题

1.概述本文是作者阅读完bigtable论文后对bigtable进行的一个梳理,只涉及核心概念不涉及具体实操,具体实操会在后续的文章中推出。GFS的出现虽然解决了海量数据的存储问题,但是还是存在一个问题就是如果我存放的数据是结构化的,对结构化数据的使用往往是希... ...查看全部

实时流处理在电商促销活动中的动态定价策略

知识百科沸羊羊 发表了文章 • 0 个评论 • 32 次浏览 • 2024-05-07 16:20 • 来自相关话题

随着电子商务的迅猛发展,市场竞争日趋激烈。为了吸引消费者并提高销售,电商平台经常举办各种促销活动。在这些活动中,如何制定有效的定价策略是至关重要的。实时流处理技术的应用为电商促销提供了新的可能性,使得电商平台能够根据市场需求和竞争环境的变化动态调整价格,从而提... ...查看全部

基于大数据的智能城市水资源管理解决方案

知识百科沸羊羊 发表了文章 • 0 个评论 • 19 次浏览 • 2024-05-07 16:20 • 来自相关话题

大数据与人工智能在金融科技的深度融合

知识百科沸羊羊 发表了文章 • 0 个评论 • 20 次浏览 • 2024-05-07 16:19 • 来自相关话题

数据伦理框架构建:确保大数据使用的公平与责任

知识百科沸羊羊 发表了文章 • 0 个评论 • 32 次浏览 • 2024-05-07 16:19 • 来自相关话题

随着大数据技术的快速发展,数据已经成为现代社会的重要资源。然而,大数据的使用也引发了一系列伦理问题,如个人隐私保护、数据歧视、数据安全等。因此,构建一个确保大数据使用公平与责任的数据伦理框架显得尤为重要。一、数据伦理框架的核心原则1. 尊重个人隐私:个人隐私是... ...查看全部

从数据治理到数据文化:组织变革的驱动力

知识百科沸羊羊 发表了文章 • 0 个评论 • 32 次浏览 • 2024-05-07 16:18 • 来自相关话题

在数字化时代,数据已经成为推动组织变革的重要力量。数据治理作为确保数据质量和安全的关键机制,其重要性不言而喻。然而,随着数据在组织中的作用日益增强,仅仅依靠数据治理已经无法满足需求。构建一种以数据为核心的文化,将数据的价值深植于组织的每个层面,是实现全面数字化... ...查看全部

发现数据异常波动怎么办?别慌,指标监控和归因分析来帮你

产品交流数栈君 发表了文章 • 0 个评论 • 184 次浏览 • 2024-03-28 10:12 • 来自相关话题

企业搭建完善、全面的指标体系是企业用数据指导业务经营决策的第一步。但是做完指标之后,对指标的监控,经常被大家忽视。当指标发生了异常波动(上升或下降),需要企业能够及时发现,并快速找到背后真实的原因,才能针对性地制定相应策略,否则就是盲打,原地打转。指标异常波动... ...查看全部

分钟级实时数据分析的背后——实时湖仓产品解决方案

产品交流数栈君 发表了文章 • 0 个评论 • 248 次浏览 • 2024-01-26 11:07 • 来自相关话题

随着信息技术的深入应用,企业对市场的响应速度也在不断提升,而且这种响应速度正在变得越来越快,没有最快只有更快。对数据实时性要求的提高,是眼下很多企业遇到的一个新的挑战。从生产侧的视角来看,系统实时监控与实时健康状态检测已成为确保系统稳定性和可靠性不可或缺的关键... ...查看全部

如何构建新一代实时湖仓?袋鼠云基于数据湖的探索升级之路

产品交流数栈君 发表了文章 • 0 个评论 • 363 次浏览 • 2023-11-10 11:45 • 来自相关话题

在之前的实时湖仓系列文章中,我们已经介绍了实时湖仓对于当前企业数字化转型的重要性,实时湖仓的功能架构设计,以及实时计算和数据湖结合的应用场景。在本篇文章中,将介绍袋鼠云数栈在构建实时湖仓系统上的探索与落地实践,及未来规划。数栈为什么选择实时湖仓数栈作为一个数据... ...查看全部

捷报 | 台州银行与袋鼠云达成合作

公司动态数栈君 发表了文章 • 0 个评论 • 453 次浏览 • 2023-10-19 13:47 • 来自相关话题

近日,台州银行与袋鼠云达成合作,携手打造数据采集平台,将客户数据进行统一汇聚、计算,建立统一的数据标准,解决数据开发不规范等问题,从而形成数据资产,保障数据分析的效率和准确性。据了解,近年来,台州银行在传统小微金融经验中融入新的科技技术,努力构建小微金融服务智... ...查看全部

袋鼠云数栈 DataOps 数据生产力实践,实现数据流程的自动化和规范化

产品交流数栈君 发表了文章 • 0 个评论 • 617 次浏览 • 2023-08-11 20:05 • 来自相关话题

袋鼠云产品团队在帮助企业进行数字化转型实践的过程中,发现很多企业在数据生产链路上都有着相同的问题。包括数据团队聚焦于业务需求短期内的快速交付,内部缺少自顶向下的数据生产管理制度,在数据标准、数据生产流程到研发规范的各个层面均存在不完善与不规范之处;很多环节依赖... ...查看全部

揭秘|来看看袋鼠云数栈内部的数据资产血缘方案设计与实现

产品交流数栈君 发表了文章 • 0 个评论 • 579 次浏览 • 2023-07-19 16:51 • 来自相关话题

数据资产现在需要接入数栈内部相关应用的时候,支持查看血缘的类型从表、离线任务增加到需要表、离线任务、实时任务、API任务、指标、标签等,需要支持数栈现有的所有应用任务,最终实现在数据资产平台查看任务的完整应用链路。虽然增加不同的任务,现阶段资产实现的血缘大体上... ...查看全部

袋鼠云产品功能更新报告06期(指标管理篇)|数栈产品功能升级,做产品我们是认真的!

产品交流数栈君 发表了文章 • 0 个评论 • 832 次浏览 • 2023-07-13 10:35 • 来自相关话题

指标管理平台新增功能更新1.指标 API 生成的 Hive 大宽表支持生命周期设置  新增功能说明  背景:指标 API 生成过程中会在 Hive 中存储一份数据,需要同步支持生命周期设置。新增功能说明:指标 API 设置中,区分 Hive、HBase 数据源... ...查看全部

袋鼠云产品功能更新报告06期(数据服务篇)|数栈产品功能升级,做产品我们是认真的!

产品交流数栈君 发表了文章 • 0 个评论 • 433 次浏览 • 2023-07-13 10:32 • 来自相关话题

数据服务平台新增功能更新1.SQL 生成 API 操作符支持修改  新增功能说明  背景:生成 API SQL 中参数的操作符由平台自动解析,不支持修改,存在解析错误的情况。新增功能说明:操作符仍由平台自动解析,如解析有问题可手动修改(注意此处仅做显示的修改,... ...查看全部

袋鼠云产品功能更新报告06期(数据资产篇)|数栈产品功能升级,做产品我们是认真的!

产品交流数栈君 发表了文章 • 0 个评论 • 464 次浏览 • 2023-07-13 10:30 • 来自相关话题

数据资产平台新增功能更新1.监控数据变更  新增功能说明  背景:客户希望某些场景发生数据变更的时候,支持对比前后不同时间的数据,比如需要对比昨天和今天不同分区的数据,此场景可以通过对接控制台自定义参数来满足。新增功能说明:数据质量支持对接控制台自定义参数,涉... ...查看全部

袋鼠云产品功能更新报告06期(实时开发篇)|数栈产品功能升级,做产品我们是认真的!

产品交流数栈君 发表了文章 • 0 个评论 • 434 次浏览 • 2023-07-13 10:28 • 来自相关话题

实时开发平台新增功能更新1.新增【运维总览】模块  新增功能说明  背景:之前实时平台的运维都是针对单任务的,缺乏全局性的运维统计和分析能力,并且缺乏对运行中任务的监控分析。因为实时任务一旦运行失败,就会立即对线上数据服务产生影响,我们希望能在任务失败之前,就... ...查看全部

产品支持的部署模式有哪些?

回复

产品交流数栈君 回复了问题 • 1 人关注 • 1 个回复 • 404 次浏览 • 2023-05-08 17:14 • 来自相关话题

大佬们好,弱弱问下,如果sink和source字段不一致,我该怎么通过名称做映射,去配置chunjun的json啊

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 368 次浏览 • 2023-03-28 11:38 • 来自相关话题

这个是什么问题呀?这玩意每天晚上扫描整个磁盘建索引

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 357 次浏览 • 2023-03-16 13:54 • 来自相关话题

Taier是不是这里有问题,普罗米修斯没有配置成功

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 354 次浏览 • 2023-03-13 16:23 • 来自相关话题

大佬,请教下,我用周期实例跑增量任务,但是实际效果还是全量追加的形式,请问是还需要怎么配置吗?

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 302 次浏览 • 2023-03-13 16:22 • 来自相关话题

请问有人在配置sftp的时候遇到这个问题吗?taier的版本是1.3.0

回复

Taier群内解答 回复了问题 • 1 人关注 • 3 个回复 • 571 次浏览 • 2023-03-13 16:21 • 来自相关话题

源端如果是一个多表联合查询的sql,来进行数据同步,这种源端插件应该怎么传参呢?

回复

ChunJun数栈君 发起了问题 • 1 人关注 • 0 个回复 • 397 次浏览 • 2023-02-21 19:36 • 来自相关话题

有没有chunjun on k8s application模式的 启动命令呀

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 585 次浏览 • 2023-02-20 18:54 • 来自相关话题

我创建了greenplum数据源,但是任务类型里面也没有greenplum_sql类型的任务可选,这块功能是不是还未实现呢

回复

Taier群内解答 回复了问题 • 1 人关注 • 2 个回复 • 469 次浏览 • 2023-02-15 13:51 • 来自相关话题

Spark-机器学习(8)分类学习之随机森林

知识百科数栈君 发表了文章 • 0 个评论 • 31 次浏览 • 2024-05-10 11:50 • 来自相关话题

 一、随机森林随机森林模型什么是随机森林?随机森林(Random Forest) 是一种基于决策树的集成学习算法,由多棵决策树组成,且每棵树的建立都依赖于一个独立抽取的样本集。在分类问题中,随机森林通过集成学习的思想将多棵树(决策树)的预测结果进行汇总,从而得... ...查看全部

私域流量优化:如何利用 AIPL 模型洞察客户生命周期价值

产品交流数栈君 发表了文章 • 0 个评论 • 42 次浏览 • 2024-05-10 10:40 • 来自相关话题

在当今这个数字化时代,商业战场的硝烟从未如此浓烈。随着互联网红利的逐渐消退,公域流量的成本水涨船高,企业间对于有限用户资源的争夺已进入白热化阶段。每一次点击、每一个曝光背后,都是企业不得不承担的高昂代价。在此背景下,传统的依赖公域流量获取新客的模式正遭受前所未... ...查看全部

大数据在电力需求侧管理中的应用与效益分析

知识百科数栈君 发表了文章 • 0 个评论 • 33 次浏览 • 2024-05-09 13:46 • 来自相关话题

随着全球能源消耗的持续增长和环境保护意识的提升,电力需求侧管理(Demand Side Management, DSM)成为电力系统高效运作的重要组成部分。电力需求侧管理指的是通过技术和经济手段调整和控制电力消费的时间、方式和结构,以提高能源效率和经济效益,同... ...查看全部

大数据赋能零售业:基于购物行为的店铺布局优化

知识百科数栈君 发表了文章 • 0 个评论 • 38 次浏览 • 2024-05-09 13:46 • 来自相关话题

随着科技的不断进步,大数据已经成为了各个领域的重要工具。在零售行业中,大数据的应用也日益显现出其独特的价值。通过对海量购物行为的数据分析,零售商可以优化店铺布局,提升销售业绩。一、购物行为数据分析购物行为数据分析是优化店铺布局的基础。通过收集和分析顾客在店内的... ...查看全部

bigtable,分布式数据库的鼻祖

知识百科数栈君 发表了文章 • 0 个评论 • 45 次浏览 • 2024-05-09 11:46 • 来自相关话题

1.概述本文是作者阅读完bigtable论文后对bigtable进行的一个梳理,只涉及核心概念不涉及具体实操,具体实操会在后续的文章中推出。GFS的出现虽然解决了海量数据的存储问题,但是还是存在一个问题就是如果我存放的数据是结构化的,对结构化数据的使用往往是希... ...查看全部

实时流处理在电商促销活动中的动态定价策略

知识百科沸羊羊 发表了文章 • 0 个评论 • 32 次浏览 • 2024-05-07 16:20 • 来自相关话题

随着电子商务的迅猛发展,市场竞争日趋激烈。为了吸引消费者并提高销售,电商平台经常举办各种促销活动。在这些活动中,如何制定有效的定价策略是至关重要的。实时流处理技术的应用为电商促销提供了新的可能性,使得电商平台能够根据市场需求和竞争环境的变化动态调整价格,从而提... ...查看全部

基于大数据的智能城市水资源管理解决方案

知识百科沸羊羊 发表了文章 • 0 个评论 • 19 次浏览 • 2024-05-07 16:20 • 来自相关话题

大数据与人工智能在金融科技的深度融合

知识百科沸羊羊 发表了文章 • 0 个评论 • 20 次浏览 • 2024-05-07 16:19 • 来自相关话题

数据伦理框架构建:确保大数据使用的公平与责任

知识百科沸羊羊 发表了文章 • 0 个评论 • 32 次浏览 • 2024-05-07 16:19 • 来自相关话题

随着大数据技术的快速发展,数据已经成为现代社会的重要资源。然而,大数据的使用也引发了一系列伦理问题,如个人隐私保护、数据歧视、数据安全等。因此,构建一个确保大数据使用公平与责任的数据伦理框架显得尤为重要。一、数据伦理框架的核心原则1. 尊重个人隐私:个人隐私是... ...查看全部

从数据治理到数据文化:组织变革的驱动力

知识百科沸羊羊 发表了文章 • 0 个评论 • 32 次浏览 • 2024-05-07 16:18 • 来自相关话题

在数字化时代,数据已经成为推动组织变革的重要力量。数据治理作为确保数据质量和安全的关键机制,其重要性不言而喻。然而,随着数据在组织中的作用日益增强,仅仅依靠数据治理已经无法满足需求。构建一种以数据为核心的文化,将数据的价值深植于组织的每个层面,是实现全面数字化... ...查看全部