博客 袋鼠云数据中台专栏(二) :数据资源规划与获取

袋鼠云数据中台专栏(二) :数据资源规划与获取

   包袋鼠   发表于 2021-11-25 16:00  513  0

10年以上技术应用经验沉淀,在金融、政府、互联网行业领域具有资深背景。曾担任过多个大型项目的项目经理或咨询总监,服务过云上贵州、浙江交通运输厅、天弘基金、新网银行等多家大型企事业单位。


正文:正文


  “人类已经由IT时代进入了DT时代,数据取代了石油成为了最核心的资源,在未来,数据会成为像水、电、石油一样的公共资源。”


——马云 2015年在杭州云栖大会发言


数据是未来社会最重要的资源之一。近年来由于互联网与大数据技术的不断发展,越来越多的企业也渐渐意识到对数据的开发和利用在企业发展过程中变得越来越重要。


但是由于企事业部门之间的系统分散开发或者些单位系统重建或引进系统开发项目,导致很多单位内部之间的信息不能共享,产生数据与信息孤岛;或者没有统一的数据规范和标准,造成数据整合的不便。数据还仅仅停留在散乱的资源阶段,离数据“变现”,形成数据资产的理想阶段,还相距甚远。


为解决上述问题,就需要企业自身进行合理有效的数据资源规划,梳理清楚企业自身的“数据家底,从而掌握企业当前数据资源的详实状况,明确企业的数据种类、未来可能获取的数据种类,以及这些数据的数据量、数据质量、数据用途等等。


数据资源规划是数据治理,数据建模,数据资产管理,数据指标体系规范等工作的前置环节和必要条件,因此数据资源规划的作用至关重要,包括数据资源梳理、数据资源规划实施、数据资源可视化、数据资源分析报告四部分内容。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/0124a415f234aa8b58b3fdb431475bbe..jpg


数据资源梳理:即企业需要梳理清楚:数据来自谁,用在何处,如何存储?一般而言,业内会从三个维度,来对数据资源进行分类管理,数据产生主体、数据来源、存储形式等。



2018年5月25日生效的GDPR法案要求, 企业必须明确满足数据主体的信息权,获取权,纠正权,限制处理权,反对权,删除权和数据可移动权等。


为了满足法案要求,合规,企业首先就要知道自己有哪些数据,数据存储在哪里,需要一个完整的数据地图,对每一个信息进行分类,为企业提供一个所有物理和数字信息的360度的视图,确保企业可有快速定位,评估和监控正在进行的基础上的所有数据。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/dd1488c8e6f9d5fa6d000e5e3624bd3a..jpg


袋鼠云数据资源规划与获取服务,则无疑在思路、技术上都可以满足企业GDPR法案合规需求。



企业内外部数据资源可通过不同的渠道和方式获取,内部数据资源大多通过企业内部业务和应用系统数据库为数据源,外部数据资源主要通过埋点、爬虫等技术手段来获取。


埋点数据:通过App或网站埋点采集用户行为数据,典型的埋点数据应用场景包括用户行为分析,线上广告营销转化率分析等。


爬虫数据:使用爬虫程序获取第三方系统或网站的数据,典型的爬虫数据可应用于网络舆情分析和价格监测等场景。


日志数据:借助日志采集工具采集机器和应用产生的日志数据,典型的日志数据可用于系统服务异常监控,安全合规审计等场景。



数据资源规划实施:企业在数据资源规划与获取的过程中,除了需要企业内部提供有效的组织保障,包括数据管理人员、数据分析人员和业务使用人员之间的紧密协作,而且还需要全面的对整个企业或政府部门组织需求分析调研,这样才可有效帮助企业理清数据资源家底,明确数据资源获取与使用的方式方法。


数据资源可视化:


在数据中台理念下,我们所指的数据资源规划和获取一定是企业全局性的考量和行为。“牵一发而动全身”这必然会牵扯到各部门和各层级组织架构的利益。


如果能将现有数据资源梳理结果进行可视化呈现,让各子公司、各部门、各业务需求方都可以清晰了解自身数据资源现状,以及要满足自身数据应用需求,还需要获取哪些数据资源,还需要增加多少量的数据存储空间,还需要补充哪些外部数据,现有数据质量又如何,则可以大规模提高企业数据资源利用的效率。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/c2c69c23698700d0f5468d488fcbda8f..jpg


数据资源分析报告:企业以前对自身数据资源的认识是模糊的,企业需要一份完整详备的数据资源分析报告,指导后续数据治理和数据资产管理平台的建设,最终服务于企业数据应用场景。为了满足客户的这一需求痛点,袋鼠云便将数据资源分析报告作为“数据资源规划与获取服务”的交付产出物之一。


“虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题”。


——维克托·迈尔·舍恩伯格《大数据时代》


数据资源规划与获取是袋鼠云数据中台7大服务中的基础服务之一,从数据资源到数据资产,还必须经过数据治理和数据整体建模,即我们数据中台专栏下期要讲的,基于数据中台策略的数据整体建模和数据资产管理。


  • 袋鼠云在大数据领域深耕7年,拥有丰富的大数据平台建设经验和成熟的产品体系,想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

    同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群