离线开发篇丨袋鼠云产品更新报告09期

离线开发平台新增功能更新1.任务模版  新增功能说明  背景:客户希望将日常通用的代码模板在离线中进行维护,在进行数据开发时可以直接引用。模板与组件的差异:1、模板代码引用后支持编辑,组件引用后不支持编辑  2、模板变更后不影响引用的任务,组件变更后会影响引用...

   数栈君  发表于2024-02-23 09:57  162  0

CDH实操--修改集群主机名

1、停止集群2、停止cmsystemctl stop cloudera-scm-serversystemctl stop cloudera-scm-agnet3、修改服务器主机名修改下列配置文件下的主机名(永久修改):/etc/hosts/etc/hostna...

   数栈君  发表于2024-02-21 10:19  177  0

Clickhouse表引擎介绍丨技术干货

引擎分类ClickHouse表引擎一共分为四个系列,分别是Log、MergeTree、Integration、Special。其中包含了两种特殊的表引擎Replicated、Distributed,功能上与其他表引擎正交,根据场景组合使用。Log系列Log系列...

   数栈君  发表于2024-02-21 10:18  186  0

Clickhouse MergeTree 原理(一)丨技术干货

MergeTree是Clickhouse里最核心的存储引擎。Clickhouse里有一系列以MergeTree为基础的引擎(见下图),理解了基础MergeTree,就能理解整个系列的MergeTree引擎的核心原理。本文对MergeTree的基本原理进行介绍。...

   数栈君  发表于2024-02-21 10:16  196  0

在K8S上使用Clickhouse丨技术干货

介绍clickhouse是一款开源的分析型数据库,性能强大。本文介绍如何在K8S环境中部署和使用clickhouse。我们使用开源的clickhouse operator: 相关依赖:k8s 1.15+。我们使用了k8s 1.20。8C16G 3节点。存储CS...

   数栈君  发表于2024-02-21 10:15  312  0

NLP大模型如何应用到时间序列?5类方法大汇总!

近期,加利福尼亚大学发表了一篇时间序列大语言模型工作综述,这篇文章主要介绍的是将NLP领域预训练好的大语言模型应用到时间序列预测领域的方法总结,总结了5种类型NLP大模型应用于时间序列领域的方法。下面给大家介绍一下这篇总结的5种方法。论文标题:Large La...

   数栈君  发表于2024-02-19 11:35  345  0

关于深度学习和大模型的基础认知

这年头,作为一个技术人,话头里没有“大模型”,和人聊天都聊不下去。为了让自己和大家能更好的参与话头,特撰写此文,提供一些对大模型的基础认知能力(门外汉,浅尝辄止)。旨在解自己的一些困惑,比如,模型是什么意思?千亿/万亿参数意味着什么?为什么大模型如此耗费算力?...

   数栈君  发表于2024-02-19 11:32  119  0

Hive压测之开源Hive基准测试工具(hive-testbench-hive14)

概述Hive基准测试工具工具,可用来造数测试Hive基本性能。TPC-DS:提供一个公平和诚实的业务和数据模型,99个案例TPC-H:面向商品零售业的决策支持系统测试基准,定义了8张表,22个查询压测扩展:TPC-DSTPC-DS测试基准是TPC组织推出的用于...

   数栈君  发表于2024-02-19 11:27  290  0

大数据监控系列(一)——Prometheus+Grafana监控概述

1 概述这是介绍Prometheushe和Grafana主要是为了监控大数据产品,数栈平台也是使用Prometheushe+Grafana作为底层大数据组件的监控,并且均有配置模板,导入即在Grafana上监控到所要看的信息指标,开源的CDH等也有很多公司使用...

   数栈君  发表于2024-02-19 11:23  268  0

大数据监控系列(二)——Prometheus+Grafana在CDH使用实践(包含Altermanager告警)

1 概述我们之前在《大数据监控系列(一)——Promehteus+Grafana监控概述》中对Promehteus和Grafana的基本概念做了介绍,这里将介绍Promehteus和Grafana在cdh监控中的实践,本文主要以监控hadoop和yarn为案例...

   数栈君  发表于2024-02-19 11:18  300  0
1881条数据,每页显示10条
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群