大数据开源

大数据开源

数据科学在电影票房预测中的模型与策略

知识百科数栈君 发表了文章 • 0 个评论 • 105 次浏览 • 2024-05-09 13:52 • 来自相关话题

随着大数据和机器学习技术的不断进步,数据科学已经成为电影产业中不可或缺的一部分。特别是在电影票房预测领域,数据科学的应用正逐渐改变着传统电影产业的运作模式。通过对大量数据的挖掘和分析,电影制作方、发行商和影院可以更准确地预测电影的票房表现,从而制定更有针对性的... ...查看全部

机器学习在安全领域的应用:从大数据中识别潜在安全威胁

技术共享数栈君 发表了文章 • 0 个评论 • 175 次浏览 • 2024-05-08 14:38 • 来自相关话题

1. 概述当谈到机器学习在安全领域的应用时,不可否认其在提升安全保障能力方面的重要性。机器学习技术的迅猛发展和不断完善,为威胁检测、视频监控和自然语言处理等安全领域带来了前所未有的机遇和挑战。本博客将深入探讨机器学习在安全领域的广泛应用,以及其对安全保障能力的... ...查看全部

基于Zookeeper 简单实现分布式任务协调组件

技术共享数栈君 发表了文章 • 0 个评论 • 91 次浏览 • 2024-05-08 14:35 • 来自相关话题

一、什么是 ZookeeperZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分... ...查看全部

实时大数据处理在电子商务推荐系统中的优化

知识百科沸羊羊 发表了文章 • 0 个评论 • 50 次浏览 • 2024-05-07 16:16 • 来自相关话题

大数据与公共健康:疫情预测与响应策略

知识百科沸羊羊 发表了文章 • 0 个评论 • 86 次浏览 • 2024-05-07 16:16 • 来自相关话题

在21世纪的今天,随着信息技术的飞速发展,大数据已经成为了我们生活中不可或缺的一部分。在公共健康领域,大数据技术的应用更是显得尤为重要。通过对大量数据的分析和挖掘,我们可以更好地预测和应对各种疫情,保障人民群众的生命安全和身体健康。本文将探讨大数据在疫情预测与... ...查看全部

数据中台建设:企业数据资产化的关键路径

知识百科沸羊羊 发表了文章 • 0 个评论 • 58 次浏览 • 2024-05-07 16:15 • 来自相关话题

图神经网络在复杂网络大数据分析中的优势

知识百科沸羊羊 发表了文章 • 0 个评论 • 97 次浏览 • 2024-05-07 16:15 • 来自相关话题

随着数字化时代的到来,大数据已成为推动社会进步和发展的重要力量。其中,复杂网络作为大数据的一种重要类型,其分析和挖掘对于理解现实世界中的复杂系统具有重要意义。而图神经网络(GNN)作为一种新兴的深度学习模型,在复杂网络大数据分析中展现出了巨大的优势。一、图神经... ...查看全部

大数据在精准农业中的土壤健康监测应用

知识百科沸羊羊 发表了文章 • 0 个评论 • 77 次浏览 • 2024-05-07 16:14 • 来自相关话题

随着全球人口的不断增长,粮食安全和可持续农业生产成为世界关注的焦点。在这样的背景下,精准农业作为一种新型的农业生产模式,通过利用现代信息技术来提高农业生产的效率和环境可持续性。其中,大数据技术在精准农业中的土壤健康监测中发挥着重要的作用。一、土壤健康的重要性土... ...查看全部

大数据安全审计:确保数据操作合规透明

知识百科沸羊羊 发表了文章 • 0 个评论 • 45 次浏览 • 2024-05-07 16:14 • 来自相关话题

深度学习在语音识别大数据处理中的进展

知识百科沸羊羊 发表了文章 • 0 个评论 • 69 次浏览 • 2024-05-07 16:14 • 来自相关话题

随着科技的不断发展,人工智能技术逐渐渗透到各个领域,其中语音识别技术作为人工智能的重要组成部分,近年来取得了显著的进步。深度学习作为机器学习的一个重要分支,在语音识别领域中的应用也取得了突破性的进展。本文将探讨深度学习在语音识别大数据处理中的进展及其带来的变革... ...查看全部
条新动态, 点击查看
这部分官网上是有的,你再仔细找找想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新... 显示全部 »
这部分官网上是有的,你再仔细找找想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack/chunjun  

ChunJun FTP Connector 功能扩展解读

ChunJun数栈君 发表了文章 • 0 个评论 • 349 次浏览 • 2023-05-31 17:35 • 来自相关话题

本文将从 FTP Connector 的功能详解,自定义文件切割及自定义 FileFormat 三个方面为大家带来 ChunJun FTP Connector 的功能扩展分享。FTP Connector 详解FTP 是用于在网络上进行文件传输的一套标准协议,它... ...查看全部

技术干货|如何利用 ChunJun 实现数据离线同步?

ChunJun数栈君 发表了文章 • 0 个评论 • 411 次浏览 • 2023-05-19 10:08 • 来自相关话题

ChunJun 是⼀款稳定、易⽤、⾼效、批流⼀体的数据集成框架,基于计算引擎 Flink 实现多种异构数据源之间的数据同步与计算。ChunJun 可以把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从⽽为企业提供全⾯的数据共享,目前已在上千家公司部... ...查看全部

新起点!大数据分布式可视化的 DAG 任务调度系统 Taier 正式发布1.4版本

Taier数栈君 发表了文章 • 0 个评论 • 484 次浏览 • 2023-04-18 18:50 • 来自相关话题

我们很高兴向大家宣布,2023年4月14日,Taier(github.com/DTStack/Taier)正式发布 1.4 版本。自2022年2月份 Taier 正式开源以来,收到了很多开发者和行业用户的积极评价,在诸多生产环境中已得到充分应用。Taier 1... ...查看全部

袋鼠云数栈离线开发平台在小文件治理上的探索实践之路

产品交流数栈君 发表了文章 • 0 个评论 • 529 次浏览 • 2023-03-29 11:23 • 来自相关话题

日常生产中 HDFS 上小文件产生是一个很正常的事情,同时小文件也是 Hadoop 集群运维中的常见挑战,尤其对于大规模运行的集群来说可谓至关重要。数据地图是离线开发产品的基本使用单位,包含全部表和项目的相关信息,可以对表做相关的权限管理和脱敏管理操作,以及可... ...查看全部

ChunJun 顺利晋级“2022 年中国开源创新大赛”决赛,并荣获“优秀开源项目/社区”奖项

ChunJun数栈君 发表了文章 • 0 个评论 • 392 次浏览 • 2023-03-14 11:13 • 来自相关话题

日前,“2022年中国开源创新大赛”初赛晋级名单公布,易用、稳定、高效的批流统一的数据集成框架 ChunJun 顺利晋级决赛,并荣获“2022年中国开源创新大赛优秀开源项目/社区”奖项。感谢组委会专家的认可,ChunJun也将继续秉承技术初心,砥砺前行,不遗余... ...查看全部

一看就懂!任务提交的资源判断在Taier中的实践

Taier小美 发表了文章 • 0 个评论 • 467 次浏览 • 2023-02-01 10:17 • 来自相关话题

Taier 介绍Taier 是袋鼠云开源项目之一,是一个分布式可视化的DAG任务调度系统。旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在 Taier 直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工... ...查看全部

袋鼠云基于Calcite框架的SQL语法扩展探索

技术共享数栈君 发表了文章 • 0 个评论 • 536 次浏览 • 2023-01-16 16:47 • 来自相关话题

Calcite在大数据系统中有着广泛的运用, 比如Apache Flink, Apache Drill等都大量使用了Calcite,理解Calcite的原理可以说已经成为理解大数据系统中SQL访问层实现原理的必备条件之一。但是不少人在学习Calcite的过程中... ...查看全部

基于数据中台的大数据治理,数字化运营组织

技术共享数栈君 发表了文章 • 0 个评论 • 672 次浏览 • 2023-01-13 10:09 • 来自相关话题

1在互联网企业,业务和数据团队是无缝衔接的。本身互联网企业的业务运营对技术和数据就是极度的依赖,所以业务的同学对技术和数据具有天生的敏感性。基于这个前提,业务团队对数据团也是非常直接的喊着“要、要、要”。在这样的场景下,说明业务团队能够明确地提出数据需求,且数... ...查看全部

大数据开源讲解:基于Apache Calcite框架的SQL语法扩展探索

技术共享数栈君 发表了文章 • 0 个评论 • 1080 次浏览 • 2023-01-12 16:36 • 来自相关话题

Calcite在大数据系统中有着广泛的运用, 比如Apache Flink, Apache Drill等都大量使用了Calcite,理解Calcite的原理可以说已经成为理解大数据系统中SQL访问层实现原理的必备条件之一。但是不少人在学习Calcite的过程中... ...查看全部

DAG任务调度系统 Taier 演进之道,探究DataSourceX 模块

Taier数栈君 发表了文章 • 0 个评论 • 760 次浏览 • 2022-12-28 13:41 • 来自相关话题

熟悉Taier的小伙伴们应该都知道,在11月7日发布的Taier1.3新版本中,我们融合了「DataSourceX 模块」。这是十分重要的一个变化,移除Taier外部插件依赖,新增数据源插件相关特性,支持后续Taier对接更多的RDBMS类型的SQL任务。本篇... ...查看全部

你好想问下提交flinksql任务的时候 Configuration 下面的 Interval Periodic checkpoints disabled

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 353 次浏览 • 2023-06-21 17:03 • 来自相关话题

chunjun支持实时mysql迁移到clickhouse吗?有没有已经在正常运行的json做参考

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 317 次浏览 • 2023-06-21 17:02 • 来自相关话题

大神们,请问1.16什么时候release有计划吗?

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 322 次浏览 • 2023-06-21 17:01 • 来自相关话题

mysql迁移到clickhouse,大字段 容易出现clickhouse response超时 是什么原因呢

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 322 次浏览 • 2023-06-21 17:00 • 来自相关话题

老师们早上好,binlog同步MySQL,出现这个错误是bug么?

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 330 次浏览 • 2023-06-21 16:59 • 来自相关话题

老师,请问rabbitMQ支持sslConfig吗(开启ssl连接认证),看着elasticSearch是支持的

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 320 次浏览 • 2023-06-21 16:59 • 来自相关话题

各位大佬,native-k8s模式如何使用,有没有一个quickstart

回复

ChunJun匿名用户 发起了问题 • 2 人关注 • 0 个回复 • 309 次浏览 • 2023-06-21 16:58 • 来自相关话题

数据还原,支持DDL的变更, 有这样的mysql 到mysql的模版吗?chunjun v1.12.8的。

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 317 次浏览 • 2023-06-21 16:55 • 来自相关话题

老师您好,想要实现mongo到mongo的数据传输,

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 2 个回复 • 341 次浏览 • 2023-06-21 16:54 • 来自相关话题

chunjun支持实时采集Oracle 吗

回复

ChunJun群内解答 回复了问题 • 1 人关注 • 1 个回复 • 380 次浏览 • 2023-06-21 16:53 • 来自相关话题

数据科学在电影票房预测中的模型与策略

知识百科数栈君 发表了文章 • 0 个评论 • 105 次浏览 • 2024-05-09 13:52 • 来自相关话题

随着大数据和机器学习技术的不断进步,数据科学已经成为电影产业中不可或缺的一部分。特别是在电影票房预测领域,数据科学的应用正逐渐改变着传统电影产业的运作模式。通过对大量数据的挖掘和分析,电影制作方、发行商和影院可以更准确地预测电影的票房表现,从而制定更有针对性的... ...查看全部

机器学习在安全领域的应用:从大数据中识别潜在安全威胁

技术共享数栈君 发表了文章 • 0 个评论 • 175 次浏览 • 2024-05-08 14:38 • 来自相关话题

1. 概述当谈到机器学习在安全领域的应用时,不可否认其在提升安全保障能力方面的重要性。机器学习技术的迅猛发展和不断完善,为威胁检测、视频监控和自然语言处理等安全领域带来了前所未有的机遇和挑战。本博客将深入探讨机器学习在安全领域的广泛应用,以及其对安全保障能力的... ...查看全部

基于Zookeeper 简单实现分布式任务协调组件

技术共享数栈君 发表了文章 • 0 个评论 • 91 次浏览 • 2024-05-08 14:35 • 来自相关话题

一、什么是 ZookeeperZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分... ...查看全部

实时大数据处理在电子商务推荐系统中的优化

知识百科沸羊羊 发表了文章 • 0 个评论 • 50 次浏览 • 2024-05-07 16:16 • 来自相关话题

大数据与公共健康:疫情预测与响应策略

知识百科沸羊羊 发表了文章 • 0 个评论 • 86 次浏览 • 2024-05-07 16:16 • 来自相关话题

在21世纪的今天,随着信息技术的飞速发展,大数据已经成为了我们生活中不可或缺的一部分。在公共健康领域,大数据技术的应用更是显得尤为重要。通过对大量数据的分析和挖掘,我们可以更好地预测和应对各种疫情,保障人民群众的生命安全和身体健康。本文将探讨大数据在疫情预测与... ...查看全部

数据中台建设:企业数据资产化的关键路径

知识百科沸羊羊 发表了文章 • 0 个评论 • 58 次浏览 • 2024-05-07 16:15 • 来自相关话题

图神经网络在复杂网络大数据分析中的优势

知识百科沸羊羊 发表了文章 • 0 个评论 • 97 次浏览 • 2024-05-07 16:15 • 来自相关话题

随着数字化时代的到来,大数据已成为推动社会进步和发展的重要力量。其中,复杂网络作为大数据的一种重要类型,其分析和挖掘对于理解现实世界中的复杂系统具有重要意义。而图神经网络(GNN)作为一种新兴的深度学习模型,在复杂网络大数据分析中展现出了巨大的优势。一、图神经... ...查看全部

大数据在精准农业中的土壤健康监测应用

知识百科沸羊羊 发表了文章 • 0 个评论 • 77 次浏览 • 2024-05-07 16:14 • 来自相关话题

随着全球人口的不断增长,粮食安全和可持续农业生产成为世界关注的焦点。在这样的背景下,精准农业作为一种新型的农业生产模式,通过利用现代信息技术来提高农业生产的效率和环境可持续性。其中,大数据技术在精准农业中的土壤健康监测中发挥着重要的作用。一、土壤健康的重要性土... ...查看全部

大数据安全审计:确保数据操作合规透明

知识百科沸羊羊 发表了文章 • 0 个评论 • 45 次浏览 • 2024-05-07 16:14 • 来自相关话题

深度学习在语音识别大数据处理中的进展

知识百科沸羊羊 发表了文章 • 0 个评论 • 69 次浏览 • 2024-05-07 16:14 • 来自相关话题

随着科技的不断发展,人工智能技术逐渐渗透到各个领域,其中语音识别技术作为人工智能的重要组成部分,近年来取得了显著的进步。深度学习作为机器学习的一个重要分支,在语音识别领域中的应用也取得了突破性的进展。本文将探讨深度学习在语音识别大数据处理中的进展及其带来的变革... ...查看全部