大数据开发

大数据开发

大数据开发之CDH使用搭建大数据平台

知识百科数栈君 发表了文章 • 0 个评论 • 77 次浏览 • 2023-08-04 10:02 • 来自相关话题

1、CDH介绍它是Cloudera公司提供的一种大数据平台解决方案。CDH的全称是Cloudera’s Distribution including Apache Hadoop,它是一个开放源代码的大数据平台,基于Apache Hadoop和其他相关的开源技术... ...查看全部

大数据治理的中观层

知识百科沸羊羊 发表了文章 • 0 个评论 • 77 次浏览 • 2023-07-31 14:16 • 来自相关话题

大数据治理的中观层:构建高效的数据管理体系随着大数据时代的到来,数据已经成为企业和社会重要的战略资源。大数据治理是确保数据质量、提高数据利用效率和降低数据风险的关键。而在大数据治理中,中观层的构建是实现高效数据管理的关键所在。一、中观层的概念与目标大数据治理的... ...查看全部

Flink保姆级教程,超全五万字,学习与面试收藏这一篇就够了

网友分享数栈君 发表了文章 • 0 个评论 • 86 次浏览 • 2023-07-21 10:27 • 来自相关话题

一、Flink 简介1. Flink 发展这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展... ...查看全部

一文看懂数据仓库

网友分享数栈君 发表了文章 • 0 个评论 • 82 次浏览 • 2023-07-21 10:27 • 来自相关话题

数据仓库的概念数据仓库(Data Warehouse)是来自一个或多个不同源的集成数据的中央存储库,通过对数据仓库中的数据分析,可以帮助企业,改进业务流程,控制成本,提高产品质量等。数据仓库的两个主要功能:存储分析数据和处理分析数据。数据仓库的主要特征(1)面... ...查看全部

软件开发中的理性和感性决定

网友分享数栈君 发表了文章 • 0 个评论 • 85 次浏览 • 2023-07-21 10:27 • 来自相关话题

CSDN 这个 “软件” (网站,app,开发云、猿如意、插件、公众号等)在过去的很多年中,有很多用户使用,也有不少用户喜欢,还有更少的用户为之付钱。我们在商言商,怎么能让更多的人付钱使用我们的产品呢?用户的决定是怎么做的呢,我们有什么办法来影响用户的决定呢?... ...查看全部

什么是深度学习?从图灵测试谈到ChatGPT

网友分享数栈君 发表了文章 • 0 个评论 • 91 次浏览 • 2023-07-21 10:26 • 来自相关话题

1 图灵测试:机器有智能吗?机器有智能吗?英国数学家艾伦·图灵(Alan Turing)在1950年发问,并提出图灵测试,目的是判断一台机器是否具有人类水平的智能。图灵测试的基本思路是:一个人与一台机器在隔开的房间里进行对话,另一个人需要根据对话内容来判断哪个... ...查看全部

ES学习看这一篇文章就够了5

网友分享数栈君 发表了文章 • 0 个评论 • 78 次浏览 • 2023-07-21 10:25 • 来自相关话题

第七章 ES和MYSQL数据同步第1节 logstash简介Logstash是一款开源的数据收集引擎,具备实时管道处理能力。简单来说,logstash作为数据源与数据存储分析工具之间的桥梁,结合ElasticSearch以及Kibana,能够极大方便数据的处理... ...查看全部

ES学习看这一篇文章就够了4

网友分享数栈君 发表了文章 • 0 个评论 • 60 次浏览 • 2023-07-21 10:24 • 来自相关话题

第六章 ES和SpringBoot整合(Spring-data版本使用)第1节 分词器介绍1.1 分词器的作用1将原始内容进行拆分,将一段话拆分成单词或者一个一个的字,或者语义单元1.2 常见分词器standars1ES默认分词器,将词汇单元转成小写,取出一些... ...查看全部

ES学习看这一篇文章就够了3

网友分享数栈君 发表了文章 • 0 个评论 • 66 次浏览 • 2023-07-21 10:23 • 来自相关话题

第五章 高级查询(Kibana)第1节 Kibana安装1.1 Kibana简介1Kibana是一个针对Elasticsearch的开源分析及可视化平台,用来搜索、查看交互存储在Elasticsearch索引中的数据.使用Kibana,可以通过各种图表进行高级... ...查看全部

ES学习看这一篇文章就够了2

网友分享数栈君 发表了文章 • 0 个评论 • 66 次浏览 • 2023-07-21 10:21 • 来自相关话题

第四章 基本用法第1节 ES 的 RESTFul APIAPI的基本格式1http://<ip>:<port>/<索引>/<类型>/<文档id&gt;常用的HTTP动作1GET/POST/PUT/D... ...查看全部

揭秘|来看看袋鼠云数栈内部的数据资产血缘方案设计与实现

产品交流数栈君 发表了文章 • 0 个评论 • 163 次浏览 • 2023-07-19 16:51 • 来自相关话题

数据资产现在需要接入数栈内部相关应用的时候,支持查看血缘的类型从表、离线任务增加到需要表、离线任务、实时任务、API任务、指标、标签等,需要支持数栈现有的所有应用任务,最终实现在数据资产平台查看任务的完整应用链路。虽然增加不同的任务,现阶段资产实现的血缘大体上... ...查看全部

基于袋鼠云实时开发平台开发 FlinkSQL 任务的实践探索

产品交流数栈君 发表了文章 • 0 个评论 • 282 次浏览 • 2023-07-06 11:43 • 来自相关话题

随着业务的发展,实时场景在各个⾏业中变得越来越重要。⽆论是⾦融、电商还是物流,实时数据处理都成为了其中的关键环节。Flink 凭借其强⼤的流处理特性、窗⼝操作以及对各种数据源的⽀持,成为实时场景下的⾸选开发⼯具。FlinkSQL 通过 SQL 语⾔⾯向数据开发... ...查看全部

研产供销数据一体化,解码汽车集团企业的数据治理之道

最佳实践数栈君 发表了文章 • 0 个评论 • 269 次浏览 • 2023-07-06 11:40 • 来自相关话题

通过对数据质量的持续关注与不断改进,使OTA安全可靠地服务于客户,提升OTA升级成功率,实现“可进化的汽车”“无需到店即可升级”“车辆常用常新”。OTA(Over-The-Air,空中下载技术),是汽车使用的一种远程无线升级技术。车主只要保持联网的状态,汽车就... ...查看全部

《数据治理行业实践白皮书》正式发布,开辟数据治理新范式(附下载)

技术共享数栈君 发表了文章 • 0 个评论 • 232 次浏览 • 2023-03-01 16:22 • 来自相关话题

近日,作为首届未来数商大会协办单位之一,袋鼠云承办“首届未来数商大会——业数融合创新论坛”,与参会嘉宾共同探讨数据驱动企业业务增长提效的新思路。袋鼠云联合创始人、易知微CEO 宁海元发表主题演讲《数智视融合,构建数字产业生态链,释放数据价值》,并带来了本次论坛... ...查看全部

袋鼠云高教行业数字化转型方案,推进数字化技术和学校教育教学深度融合

最佳实践数栈君 发表了文章 • 0 个评论 • 148 次浏览 • 2023-02-16 09:54 • 来自相关话题

在当前的数字化转型浪潮下,“基础设施、配套设备、应用探索”的数字校园1.0阶段即将步入尾声、亦或已经完结,不同地区和类型的高校通过各类信息化系统和基础设施已经初步实现了业务数字化,整个数字校园的信息基础设施底座已有一定基础、信息时代教育治理新模式正在逐步呈现、... ...查看全部

袋鼠云数栈UI5.0焕新升级,全新设计语言DT Design,更懂视觉更懂你!

技术共享数栈君 发表了文章 • 0 个评论 • 261 次浏览 • 2023-02-10 10:55 • 来自相关话题

数栈作为袋鼠云打造的一站式数据开发与治理平台,从2016年发布第⼀个版本开始,就始终坚持着以技术为核⼼、安全为底线、提效为⽬标、中台为战略的思想,坚定不移地⾛国产化信创路线,不断推进产品功能迭代、技术创新、服务细化和性能升级。伴随业务的⻜速发展,数栈设计团队也... ...查看全部

基于数据中台的大数据治理,数字化运营组织

技术共享数栈君 发表了文章 • 0 个评论 • 232 次浏览 • 2023-01-13 10:09 • 来自相关话题

1在互联网企业,业务和数据团队是无缝衔接的。本身互联网企业的业务运营对技术和数据就是极度的依赖,所以业务的同学对技术和数据具有天生的敏感性。基于这个前提,业务团队对数据团也是非常直接的喊着“要、要、要”。在这样的场景下,说明业务团队能够明确地提出数据需求,且数... ...查看全部

大数据开源讲解:基于Apache Calcite框架的SQL语法扩展探索

技术共享数栈君 发表了文章 • 0 个评论 • 441 次浏览 • 2023-01-12 16:36 • 来自相关话题

Calcite在大数据系统中有着广泛的运用, 比如Apache Flink, Apache Drill等都大量使用了Calcite,理解Calcite的原理可以说已经成为理解大数据系统中SQL访问层实现原理的必备条件之一。但是不少人在学习Calcite的过程中... ...查看全部

taier的datasourcex下能看到mongodb插件,就是添加mongodb数据源测试链接报错

回复

Taier匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 153 次浏览 • 2023-01-10 10:02 • 来自相关话题

1.12.7版本的,断点续传加hdfs路径的命令改成什么了?

回复

ChunJun匿名用户 发起了问题 • 1 人关注 • 0 个回复 • 151 次浏览 • 2022-12-28 19:19 • 来自相关话题

大数据开发之CDH使用搭建大数据平台

知识百科数栈君 发表了文章 • 0 个评论 • 77 次浏览 • 2023-08-04 10:02 • 来自相关话题

1、CDH介绍它是Cloudera公司提供的一种大数据平台解决方案。CDH的全称是Cloudera’s Distribution including Apache Hadoop,它是一个开放源代码的大数据平台,基于Apache Hadoop和其他相关的开源技术... ...查看全部

大数据治理的中观层

知识百科沸羊羊 发表了文章 • 0 个评论 • 77 次浏览 • 2023-07-31 14:16 • 来自相关话题

大数据治理的中观层:构建高效的数据管理体系随着大数据时代的到来,数据已经成为企业和社会重要的战略资源。大数据治理是确保数据质量、提高数据利用效率和降低数据风险的关键。而在大数据治理中,中观层的构建是实现高效数据管理的关键所在。一、中观层的概念与目标大数据治理的... ...查看全部

Flink保姆级教程,超全五万字,学习与面试收藏这一篇就够了

网友分享数栈君 发表了文章 • 0 个评论 • 86 次浏览 • 2023-07-21 10:27 • 来自相关话题

一、Flink 简介1. Flink 发展这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展... ...查看全部

一文看懂数据仓库

网友分享数栈君 发表了文章 • 0 个评论 • 82 次浏览 • 2023-07-21 10:27 • 来自相关话题

数据仓库的概念数据仓库(Data Warehouse)是来自一个或多个不同源的集成数据的中央存储库,通过对数据仓库中的数据分析,可以帮助企业,改进业务流程,控制成本,提高产品质量等。数据仓库的两个主要功能:存储分析数据和处理分析数据。数据仓库的主要特征(1)面... ...查看全部

软件开发中的理性和感性决定

网友分享数栈君 发表了文章 • 0 个评论 • 85 次浏览 • 2023-07-21 10:27 • 来自相关话题

CSDN 这个 “软件” (网站,app,开发云、猿如意、插件、公众号等)在过去的很多年中,有很多用户使用,也有不少用户喜欢,还有更少的用户为之付钱。我们在商言商,怎么能让更多的人付钱使用我们的产品呢?用户的决定是怎么做的呢,我们有什么办法来影响用户的决定呢?... ...查看全部

什么是深度学习?从图灵测试谈到ChatGPT

网友分享数栈君 发表了文章 • 0 个评论 • 91 次浏览 • 2023-07-21 10:26 • 来自相关话题

1 图灵测试:机器有智能吗?机器有智能吗?英国数学家艾伦·图灵(Alan Turing)在1950年发问,并提出图灵测试,目的是判断一台机器是否具有人类水平的智能。图灵测试的基本思路是:一个人与一台机器在隔开的房间里进行对话,另一个人需要根据对话内容来判断哪个... ...查看全部

ES学习看这一篇文章就够了5

网友分享数栈君 发表了文章 • 0 个评论 • 78 次浏览 • 2023-07-21 10:25 • 来自相关话题

第七章 ES和MYSQL数据同步第1节 logstash简介Logstash是一款开源的数据收集引擎,具备实时管道处理能力。简单来说,logstash作为数据源与数据存储分析工具之间的桥梁,结合ElasticSearch以及Kibana,能够极大方便数据的处理... ...查看全部

ES学习看这一篇文章就够了4

网友分享数栈君 发表了文章 • 0 个评论 • 60 次浏览 • 2023-07-21 10:24 • 来自相关话题

第六章 ES和SpringBoot整合(Spring-data版本使用)第1节 分词器介绍1.1 分词器的作用1将原始内容进行拆分,将一段话拆分成单词或者一个一个的字,或者语义单元1.2 常见分词器standars1ES默认分词器,将词汇单元转成小写,取出一些... ...查看全部

ES学习看这一篇文章就够了3

网友分享数栈君 发表了文章 • 0 个评论 • 66 次浏览 • 2023-07-21 10:23 • 来自相关话题

第五章 高级查询(Kibana)第1节 Kibana安装1.1 Kibana简介1Kibana是一个针对Elasticsearch的开源分析及可视化平台,用来搜索、查看交互存储在Elasticsearch索引中的数据.使用Kibana,可以通过各种图表进行高级... ...查看全部

ES学习看这一篇文章就够了2

网友分享数栈君 发表了文章 • 0 个评论 • 66 次浏览 • 2023-07-21 10:21 • 来自相关话题

第四章 基本用法第1节 ES 的 RESTFul APIAPI的基本格式1http://<ip>:<port>/<索引>/<类型>/<文档id&gt;常用的HTTP动作1GET/POST/PUT/D... ...查看全部