大数据平台

大数据平台

Hadoop集群部署与YARN资源调优实战

知识百科数栈君 发表了文章 • 0 个评论 • 228 次浏览 • 2026-03-30 13:58 • 来自相关话题

Hadoop集群部署与YARN资源调优实战在企业构建数据中台、支撑数字孪生系统与实现高精度数字可视化的过程中,Hadoop作为分布式计算与存储的基石,其稳定性和资源利用率直接决定了上层应用的响应速度与数据处理能力。许多企业在部署Hadoop集群时,往往只关注“... ...查看全部

矿产业指标平台建设:基于大数据的实时监测系统

知识百科数栈君 发表了文章 • 0 个评论 • 161 次浏览 • 2026-03-30 13:55 • 来自相关话题

矿产业指标平台建设:基于大数据的实时监测系统在数字化转型加速的背景下,矿产业正从传统经验驱动向数据驱动模式跃迁。过去,矿山运营依赖人工巡检、定期报表和静态分析,信息滞后、决策迟缓、风险不可控成为行业痛点。如今,通过构建矿产业指标平台建设,企业可实现对生产、安全... ...查看全部

Kerberos高可用部署:多KDC主从同步方案

知识百科数栈君 发表了文章 • 0 个评论 • 238 次浏览 • 2026-03-30 13:09 • 来自相关话题

Kerberos高可用部署:多KDC主从同步方案在现代企业数据中台、数字孪生系统和可视化平台的底层架构中,身份认证是保障数据访问安全的第一道防线。Kerberos协议作为企业级单点登录(SSO)的核心组件,广泛应用于Hadoop、Spark、Kafka、Hiv... ...查看全部

Kerberos票据生命周期调优配置指南

知识百科数栈君 发表了文章 • 0 个评论 • 182 次浏览 • 2026-03-30 12:35 • 来自相关话题

Kerberos 票据生命周期调整是企业级身份认证体系中至关重要的一环,尤其在构建数据中台、数字孪生系统和可视化分析平台时,安全与效率的平衡直接影响系统稳定性与用户体验。Kerberos 作为广泛应用于 Hadoop、Spark、Kafka、Hive 等大数据... ...查看全部

Kerberos高可用部署:多KDC主从同步方案

知识百科数栈君 发表了文章 • 0 个评论 • 152 次浏览 • 2026-03-29 11:11 • 来自相关话题

Kerberos高可用部署:多KDC主从同步方案在现代企业数据中台架构中,身份认证是保障系统安全的第一道防线。Kerberos协议作为广泛应用于Hadoop生态、大数据平台和分布式系统的集中式认证机制,其稳定性直接关系到整个数据平台的可用性与安全性。当Kerb... ...查看全部

多模态大数据平台构建与跨模态融合技术实现

知识百科数栈君 发表了文章 • 0 个评论 • 208 次浏览 • 2026-03-29 08:26 • 来自相关话题

多模态大数据平台构建与跨模态融合技术实现 🌐在数字化转型加速的今天,企业数据不再局限于结构化表格或文本日志。图像、视频、语音、传感器数据、地理信息、社交媒体内容、3D点云等非结构化与半结构化数据正以指数级增长。这些异构数据源共同构成了“多模态数据生态”,而如何... ...查看全部

汽配指标平台建设:基于大数据的实时库存预测系统

知识百科数栈君 发表了文章 • 0 个评论 • 188 次浏览 • 2026-03-28 20:34 • 来自相关话题

在汽车后市场快速扩张的背景下,汽配企业面临的库存管理挑战日益复杂。传统依赖人工经验与静态历史数据的库存模式,已无法应对市场需求的波动性、供应链的不确定性以及客户对交付时效的高要求。构建一个基于大数据的实时库存预测系统,已成为实现精细化运营、降低资金占用、提升客... ...查看全部

Kerberos票据生命周期调优配置指南

知识百科数栈君 发表了文章 • 0 个评论 • 201 次浏览 • 2026-03-28 17:11 • 来自相关话题

Kerberos 票据生命周期调整是企业级身份认证体系中至关重要的一环,尤其在构建数据中台、数字孪生系统和可视化分析平台时,安全与效率的平衡直接影响系统稳定性和用户体验。Kerberos 作为广泛应用于 Hadoop、Spark、Kafka、Hive 等大数据... ...查看全部

Hadoop集群部署与YARN资源调优实战

知识百科数栈君 发表了文章 • 0 个评论 • 216 次浏览 • 2026-03-27 19:00 • 来自相关话题

Hadoop集群部署与YARN资源调优实战在现代企业数据中台建设中,Hadoop作为分布式存储与计算的核心框架,承担着海量数据处理的基石角色。无论是构建数字孪生模型所需的时空数据聚合,还是支撑可视化分析的实时计算需求,Hadoop集群的稳定性与资源利用率直接决... ...查看全部

多模态大数据平台构建与跨模态融合引擎实现

知识百科数栈君 发表了文章 • 0 个评论 • 162 次浏览 • 2026-03-27 09:24 • 来自相关话题

构建一个高效、可扩展的多模态大数据平台,是企业实现数字孪生、智能决策与可视化洞察的核心基础设施。随着物联网设备、传感器网络、视频监控、语音交互、文本日志、遥感图像等异构数据源的爆炸式增长,单一模态的数据分析已无法满足复杂业务场景的需求。企业亟需一个能够统一采集... ...查看全部

HDFS迁移:企业数据迁移的高效之旅与优化攻略

产品交流数栈君 发表了文章 • 0 个评论 • 1139 次浏览 • 2025-07-02 17:00 • 来自相关话题

在数字化浪潮的冲击下,企业数据量呈爆炸式增长,大数据迁移成为企业优化数据架构、提升数据价值的关键举措。而 HDFS(Hadoop Distributed File System)作为分布式存储的基石,其数据迁移操作尤为重要。HDFS DistCp(分布式拷贝)... ...查看全部

探索大模型:袋鼠云在 Text To SQL 上的实践与优化

产品交流数栈君 发表了文章 • 0 个评论 • 2543 次浏览 • 2024-07-10 16:41 • 来自相关话题

Text To SQL 指的是将自然语言转化为能够在关系型数据库中执行的结构化查询语言(简称 SQL)。近年来,伴随人工智能大模型技术的不断进步,Text To SQL 任务的成功率显著提升,这得益于大模型的推理、理解以及指令遵循等能力。对于大数据平台来说,集... ...查看全部

数栈+AI:数栈V6.2创新发布,让数据开发更智能

产品交流数栈君 发表了文章 • 0 个评论 • 2051 次浏览 • 2024-04-18 09:24 • 来自相关话题

近日,以“Data+AI,构建新质生产力”为主题的袋鼠云春季发布会圆满落幕,大会带来了一系列“+AI”的数字化产品与最新行业沉淀,旨在将数据与AI紧密结合,打破传统的生产力边界,赋能企业实现更高质量、更高效率的数字化发展。会上,袋鼠云数栈产品负责人偷天带来了融... ...查看全部

大数据计算引擎 EasyMR:拥抱开源,引领技术创新

产品交流小美 发表了文章 • 0 个评论 • 2512 次浏览 • 2023-03-22 10:12 • 来自相关话题

140页深度干货,囊括15个典型成功案例,覆盖金融、集团、政务、制造、港口5大行业,全书从方法论到实践全面解码数据治理,开辟数据治理新范式,丰富内容可免费获取!免费获取链接:https://fs80.cn/4w2atu身处数字经济时代,随着大数据应用越来越广泛... ...查看全部

袋鼠云数栈UI5.0焕新升级,全新设计语言DT Design,更懂视觉更懂你!

技术共享数栈君 发表了文章 • 0 个评论 • 3440 次浏览 • 2023-02-10 10:55 • 来自相关话题

数栈作为袋鼠云打造的一站式数据开发与治理平台,从2016年发布第⼀个版本开始,就始终坚持着以技术为核⼼、安全为底线、提效为⽬标、中台为战略的思想,坚定不移地⾛国产化信创路线,不断推进产品功能迭代、技术创新、服务细化和性能升级。伴随业务的⻜速发展,数栈设计团队也... ...查看全部

大型集团企业数据治理实践,推进全域数据资产体系建设 | 数字化标杆

最佳实践数栈君 发表了文章 • 0 个评论 • 2641 次浏览 • 2023-02-10 10:48 • 来自相关话题

数据治理是推动大型集团企业转型升级、提升竞争优势、实现高质量发展的重要引擎。通过全链数据结构化,实现业务对象、业务规则、业务流程数字化,推进全链业务深度数字化,夯实数据运营底座。某大型实业集团创立于1980年,主要业务涵盖供应链运营、城市建设与运营、旅游会展、... ...查看全部

基于数据中台的大数据治理,数字化运营组织

技术共享数栈君 发表了文章 • 0 个评论 • 3827 次浏览 • 2023-01-13 10:09 • 来自相关话题

1在互联网企业,业务和数据团队是无缝衔接的。本身互联网企业的业务运营对技术和数据就是极度的依赖,所以业务的同学对技术和数据具有天生的敏感性。基于这个前提,业务团队对数据团也是非常直接的喊着“要、要、要”。在这样的场景下,说明业务团队能够明确地提出数据需求,且数... ...查看全部

大数据开源讲解:基于Apache Calcite框架的SQL语法扩展探索

技术共享数栈君 发表了文章 • 0 个评论 • 3699 次浏览 • 2023-01-12 16:36 • 来自相关话题

Calcite在大数据系统中有着广泛的运用, 比如Apache Flink, Apache Drill等都大量使用了Calcite,理解Calcite的原理可以说已经成为理解大数据系统中SQL访问层实现原理的必备条件之一。但是不少人在学习Calcite的过程中... ...查看全部

DAG任务调度系统 Taier 演进之道,探究DataSourceX 模块

Taier数栈君 发表了文章 • 0 个评论 • 3789 次浏览 • 2022-12-28 13:41 • 来自相关话题

熟悉Taier的小伙伴们应该都知道,在11月7日发布的Taier1.3新版本中,我们融合了「DataSourceX 模块」。这是十分重要的一个变化,移除Taier外部插件依赖,新增数据源插件相关特性,支持后续Taier对接更多的RDBMS类型的SQL任务。本篇... ...查看全部

数据中台实战:袋鼠云基于Iceberg构建的湖仓一体数据架构探索及实践,快速落地大数据转移、大数据平台开发

技术共享数栈君 发表了文章 • 0 个评论 • 4147 次浏览 • 2022-12-21 11:28 • 来自相关话题

“数据湖”、“湖仓一体”及“流批一体”等概念,是近年来大数据领域热度最高的词汇,在各大互联网公司掀起了一波波的热潮,各家公司纷纷推出了自己的技术方案,其中作为全链路数字化技术与服务提供商的袋鼠云,在探索数据湖架构的早期,就调研并选用了Iceberg作为基础框架... ...查看全部

请教一下,更新最新版本代码window部署好像有问题耶

回复

Taier群内解答 回复了问题 • 1 人关注 • 1 个回复 • 2658 次浏览 • 2023-03-24 11:26 • 来自相关话题

大佬,请教一下,怎么文件导入数据,支持local本地数据文件导入吗,我看现在界面上都是ftp的模式

回复

Taier群内解答 回复了问题 • 1 人关注 • 3 个回复 • 2988 次浏览 • 2023-03-24 11:25 • 来自相关话题

Chunjun提供了哪些类型的catalog? 支持kafka json么?

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 5 个回复 • 3124 次浏览 • 2023-03-20 11:41 • 来自相关话题

chunjun在mysql 同步中,customSql和transformSql有什么区别?

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 2622 次浏览 • 2023-03-20 11:38 • 来自相关话题

计算组件选用flink是不是必须要配置prometheus?

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 2426 次浏览 • 2023-02-23 16:49 • 来自相关话题

大佬们好,chunjun为什么hdfs的csv文件同步到kafka, 每条数据多了

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 3871 次浏览 • 2023-01-10 10:08 • 来自相关话题

taier的datasourcex下能看到mongodb插件,就是添加mongodb数据源测试链接报错

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 2654 次浏览 • 2023-01-10 10:02 • 来自相关话题

SQL Server中 SMALLINT 范围是±32767 这里的转换器使用了Short.byteValue 导致大于127的值都是错误的~ 是有啥特殊原因吗?

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 2751 次浏览 • 2022-12-27 18:00 • 来自相关话题

Hadoop集群部署与YARN资源调优实战

知识百科数栈君 发表了文章 • 0 个评论 • 228 次浏览 • 2026-03-30 13:58 • 来自相关话题

Hadoop集群部署与YARN资源调优实战在企业构建数据中台、支撑数字孪生系统与实现高精度数字可视化的过程中,Hadoop作为分布式计算与存储的基石,其稳定性和资源利用率直接决定了上层应用的响应速度与数据处理能力。许多企业在部署Hadoop集群时,往往只关注“... ...查看全部

矿产业指标平台建设:基于大数据的实时监测系统

知识百科数栈君 发表了文章 • 0 个评论 • 161 次浏览 • 2026-03-30 13:55 • 来自相关话题

矿产业指标平台建设:基于大数据的实时监测系统在数字化转型加速的背景下,矿产业正从传统经验驱动向数据驱动模式跃迁。过去,矿山运营依赖人工巡检、定期报表和静态分析,信息滞后、决策迟缓、风险不可控成为行业痛点。如今,通过构建矿产业指标平台建设,企业可实现对生产、安全... ...查看全部

Kerberos高可用部署:多KDC主从同步方案

知识百科数栈君 发表了文章 • 0 个评论 • 238 次浏览 • 2026-03-30 13:09 • 来自相关话题

Kerberos高可用部署:多KDC主从同步方案在现代企业数据中台、数字孪生系统和可视化平台的底层架构中,身份认证是保障数据访问安全的第一道防线。Kerberos协议作为企业级单点登录(SSO)的核心组件,广泛应用于Hadoop、Spark、Kafka、Hiv... ...查看全部

Kerberos票据生命周期调优配置指南

知识百科数栈君 发表了文章 • 0 个评论 • 182 次浏览 • 2026-03-30 12:35 • 来自相关话题

Kerberos 票据生命周期调整是企业级身份认证体系中至关重要的一环,尤其在构建数据中台、数字孪生系统和可视化分析平台时,安全与效率的平衡直接影响系统稳定性与用户体验。Kerberos 作为广泛应用于 Hadoop、Spark、Kafka、Hive 等大数据... ...查看全部

Kerberos高可用部署:多KDC主从同步方案

知识百科数栈君 发表了文章 • 0 个评论 • 152 次浏览 • 2026-03-29 11:11 • 来自相关话题

Kerberos高可用部署:多KDC主从同步方案在现代企业数据中台架构中,身份认证是保障系统安全的第一道防线。Kerberos协议作为广泛应用于Hadoop生态、大数据平台和分布式系统的集中式认证机制,其稳定性直接关系到整个数据平台的可用性与安全性。当Kerb... ...查看全部

多模态大数据平台构建与跨模态融合技术实现

知识百科数栈君 发表了文章 • 0 个评论 • 208 次浏览 • 2026-03-29 08:26 • 来自相关话题

多模态大数据平台构建与跨模态融合技术实现 🌐在数字化转型加速的今天,企业数据不再局限于结构化表格或文本日志。图像、视频、语音、传感器数据、地理信息、社交媒体内容、3D点云等非结构化与半结构化数据正以指数级增长。这些异构数据源共同构成了“多模态数据生态”,而如何... ...查看全部

汽配指标平台建设:基于大数据的实时库存预测系统

知识百科数栈君 发表了文章 • 0 个评论 • 188 次浏览 • 2026-03-28 20:34 • 来自相关话题

在汽车后市场快速扩张的背景下,汽配企业面临的库存管理挑战日益复杂。传统依赖人工经验与静态历史数据的库存模式,已无法应对市场需求的波动性、供应链的不确定性以及客户对交付时效的高要求。构建一个基于大数据的实时库存预测系统,已成为实现精细化运营、降低资金占用、提升客... ...查看全部

Kerberos票据生命周期调优配置指南

知识百科数栈君 发表了文章 • 0 个评论 • 201 次浏览 • 2026-03-28 17:11 • 来自相关话题

Kerberos 票据生命周期调整是企业级身份认证体系中至关重要的一环,尤其在构建数据中台、数字孪生系统和可视化分析平台时,安全与效率的平衡直接影响系统稳定性和用户体验。Kerberos 作为广泛应用于 Hadoop、Spark、Kafka、Hive 等大数据... ...查看全部

Hadoop集群部署与YARN资源调优实战

知识百科数栈君 发表了文章 • 0 个评论 • 216 次浏览 • 2026-03-27 19:00 • 来自相关话题

Hadoop集群部署与YARN资源调优实战在现代企业数据中台建设中,Hadoop作为分布式存储与计算的核心框架,承担着海量数据处理的基石角色。无论是构建数字孪生模型所需的时空数据聚合,还是支撑可视化分析的实时计算需求,Hadoop集群的稳定性与资源利用率直接决... ...查看全部

多模态大数据平台构建与跨模态融合引擎实现

知识百科数栈君 发表了文章 • 0 个评论 • 162 次浏览 • 2026-03-27 09:24 • 来自相关话题

构建一个高效、可扩展的多模态大数据平台,是企业实现数字孪生、智能决策与可视化洞察的核心基础设施。随着物联网设备、传感器网络、视频监控、语音交互、文本日志、遥感图像等异构数据源的爆炸式增长,单一模态的数据分析已无法满足复杂业务场景的需求。企业亟需一个能够统一采集... ...查看全部