演化中的个人数据开发利用新范式

在所有数据资产类型中,个人数据的开发利用潜在价值巨大。个人数据在过去几十年里,已经得到前所未有的开发和利用,推动了经济增长和社会发展。但与此同时,也逐渐引发越来越凸出的经济、社会和伦理道德问题。App应用服务包罗万象,几乎涵盖了个人生活、工作和学习等方方面面。...

   数栈君  发表于2023-06-26 16:03  637  0

从开发和业务两个方面总结10条数据开发实用技能

开发类Article 6关联数据之前,先检查维度表,各维度的值是否有异常,比如null,空值,异常值等等。Article 5进行聚合操作后,检查聚合后的数据值是否合理,比如sum求和后的值,找一些已有的数据做核对。Article 4left join之后的数据...

   数栈君  发表于2023-06-26 16:00  503  0

关于未来数据开发技术的发展方向

数据开发技术的3个方向未来数据开发技术方向,我认为有三个,首先是流批一体成为主流开发模式,其次是代码自动化技术走向成熟,第三是 OLAP Cubes 终将衰落。一、流批一体成为主流开发模式先说说我看到的数据开发的历史。“远古”时代,通过写 SQL 脚本抽取 O...

   数栈君  发表于2023-06-26 15:59  898  0

一文详解数据开发流程及规范

一、背景在大数据时代,规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会降低研发效率,增加成本与风险。数...

   数栈君  发表于2023-06-26 15:43  2170  0

[大数据]数据可视化 -- 练习卷(上)

一、填空题 1.反映发展趋势的可视化图表有___________、____________和_____________。 2.___________是指发现并纠正数据文件中可识别错误的最后一道程序,是对数据的完整性、一致性和准确性进行重新审查和校验的过程。 ...

   数栈君  发表于2023-06-25 11:59  2089  0

数据挖掘--神经网络

神经网络简介神经网络是一种计算模型,它受到人脑处理信息的生物神经网络过程的启发。人工神经网络(ANN)一般也称为神经网络(Neural Network,NN)。 神经网络是由多个神经元组成的,每个神经元都有一个输入和一个输出,它们之间通过权重进行连接。当输入...

   数栈君  发表于2023-06-25 11:58  565  0

数据挖掘--数据仓库

一、数据库1.简介数据库因数据处理的需要而产生。例如,在20世纪60年代后期,美国为了战争的需要,将各种情报收集在一起,存储隐藏在计算机内,这就是数据库的起源。随着计算机技术的发展,数据库从文件系统阶段发展为数据库阶段,再到高级数据库阶段。现在,数据库已经广泛...

   数栈君  发表于2023-06-25 11:52  622  0

性能提升30%!袋鼠云数栈基于 Apache Hudi 的性能优化实战解析

Apache Hudi 是一款开源的数据湖解决方案,它能够帮助企业更好地管理和分析海量数据,支持高效的数据更新和查询。并提供多种数据压缩和存储格式以及索引功能,从而为企业数据仓库实践提供更加灵活和高效的数据处理方式。在金融领域,企业可以使用 Hudi 来处理大...

   数栈君  发表于2023-06-21 14:10  3758  0

【Spring从成神到升仙系列 五】从根上剖析 Spring 循环依赖

我们上几篇文章讲解了 IOC、AOP的源码实现,如果没有看过的同学可以去看一下:Spring IOC 源码剖析Spring AOP 源码剖析如果上面的文章你已经熟悉了,那么对于循环依赖的理解就会变得很简单,甚至你自己都能够想明白整个运行原理我们首先介绍一下循环...

   数栈君  发表于2023-06-21 10:59  492  0

拉链表详解

一、拉链表概念 拉链表是一种数据模型,主要是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。拉链表可以避免按每一天存储所有记录造成的海量存储问题,同时也是处理缓慢变...

   数栈君  发表于2023-06-20 15:45  762  0
2259条数据,每页显示10条
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群