数据中台数据中台
申请试用
新闻动态
了解袋鼠云最新动态
新闻动态>「数据资产管理」数据资产管理视角下网络技术数据质量点评评价指标体系科学研究>
「数据资产管理」数据资产管理视角下网络技术数据质量点评评价指标体系科学研究
20201215|文章来源:-

「数据资产管理」数据资产管理视角下网络技术数据质量点评评价指标体系科学研究,互联网大数据情况下,数据信息已变成网络技术公司的核心资产。殊不知互联网大数据自然环境下,巨大的信息量和繁杂的算法设计,加重了低质量数据信息造成的风险性,给网络技术数据质量管理方法产生挑戰,对公司数据资产使用价值完成及其公司竞争优势造成重特大危害。朝向数据资产管理,以数据资产使用价值完成为要明,创建网络技术数据质量点评规范已变成实践活动急切要求。

「数据资产管理」数据资产管理视角下网络技术数据质量点评评价指标体系科学研究,有关数据质量点评一直是学术界关心的热点话题之一,专家学者们对于不一样行业、从不一样角度已明确提出了一些有象征性的评价指标体系及评价指标体系,包含用户需求角度、商品角度、Web自然环境下根据客户体验的角度、根据数据信息生命期角度、根据应用逻辑角度、数据信息长期性储存的角度,及其互联网大数据自然环境下的数据信息利用质量的2A评价指标体系、因素实体模型、根据前后文认知的评定实体模型、大数据质量架构。目前评价指标体系各有特色和优点,但并未产生普遍认同的评价指标体系管理体系。当今对数据质量的叙述维度各有不同,涉及到生产制造、开发设计、经营、管理方法、成本费等众多作用要素,目前成效为本科学研究确立了牢靠的基本。根据世界各国数据质量点评研究现状,并出自于我國网络技术数据质量管理方法的实际要求考虑到,本科学研究以网络技术公司有着的结构型或半结构型的客户个人行为数据信息、产品数据信息、买卖数据信息、系统软件造成的别的业务流程数据信息等关键数据信息为关键研究对象,就下列3个层面难题进行科学研究:1)数据资产管理视角下数据质量点评立足点是啥?2)怎样根据数据资产管理角度搭建网络技术数据质量点评评价指标体系?3)各指标值的精确测量规则和精确测量项是啥?

1点评维度以及指标值的基础理论剖析

为了更好地降低德尔菲法操作流程中专家访谈轮次,本科学研究最先根据对当今科学研究的基础理论剖析,明确提出基本的点评维度以及指标值,为权威专家出示情况材料。

「数据资产管理」数据资产管理视角下网络技术数据质量点评评价指标体系科学研究,有关数据质量是一个繁杂的、多维度的定义范围。目前科学研究现有许多有关“数据质量”内函的科研成果,虽然对数据质量的内涵有不一样的观点,但一般觉得数据质量是能够由多个数据质量维度来考量,即一般用维度一词来明确数据信息的哪几个方面是能够精确测量的,并根据他们来叙述和量化分析数据质量。当今数据质量的科学研究早已获得一定成效,在其中以WangR等明确提出的质量叙述架构为典型性意味着:包含原有质量、获得质量、表述质量、与自然环境有关的质量4个维度,该架构适用传统式数据信息自然环境下,数据信息关键来自公司系统软件內部,信息量比较有限、算法设计比较单一的状况,但互联网大数据自然环境下,数据信息自身、数据组织及运用与传统式数据信息自然环境对比造成众多差别,对数据质量的点评也相对产生变化。针对互联网大数据自然环境下的数据质量,MerinoJ等明确提出了在互联网大数据自然环境下的数据信息利用质量实体模型,包含自然环境适用范围、及时性、实际操作适用范围3个维度。LoshinD等觉得数据质量的维度有不一样区划规范,践行者应当从便于具体应用考虑趋向于这些便于精确测量、合适在公司内营销推广的维度,明确提出了本质维度、前后文维度、判定维度。

之上成效是根据不一样的选题背景和立足点所造成的结果,可是针对数据资产管理视角下网络技术数据质量不可以简易地套入传统式数据质量规范或是大数据质量规范来考量,缘故取决于:1)从数据信息组成及数据信息经营规模看来,网络技术的数据信息既包含来自公司本身业务管理系统的结构型的、可控性的数据信息,也包含相对来说不可控性的、半非结构化数据、外界协作得到 的数据信息,就数据来源和数据类型的复杂性来讲,网络技术的数据信息接近传统式数据信息和基本实际意义上的互联网大数据中间。2)从数据信息利用要求和目地看来,网络技术数据信息利用要求有其与众不同的领域特点。不同于公共性数据信息、科学研究数据信息,商务接待数据信息利用要求充分体现在对客户满意度的发掘、对销售市场机遇的发觉等商业服务要求,场景化、预测性是其关键特点。3)从数据资产管理视角看来,便是要根据对数据信息开展财产化管理方法促使数据信息可以变成公司核心资产,集中体现数据资产使用价值,进而提高公司管理能力和运营经济效益,最后提升 公司竞争能力。从数据信息的资产特性视角考虑到,必定对数据质量造成相对的规定。因此 ,本科学研究在数据资产管理角度下,将考量网络技术数据质量的立足点梳理为:一是反映网络技术领域的数据信息利用要求特点,及其公司市场拓展对数据质量的规定,可以为企业经营管理决策出示精确、真正、可靠、立即、细腻、全方位的客户资料及其有关运营数据,考虑数据驱动、情景驱动器的网络技术运营要求。二是反映数据信息做为公司财产特性所要考虑的质量规定,即必须具有数据信息资产转现使用价值,及其为公司商业服务总体目标服务项目等质量规定。

本科学研究在当今科研成果基本上,根据数据资产管理视角下网络技术数据质量的点评立足点,并资询了俩位网络技术数据专家(各自为大数据中心责任人和大数据分析师)建议,参照国际性数据库管理研究会(DAMAInternational)对数据质量维度以及指标值应具有可衡量性、可预测性、可追踪性[14]的标准,依照由低无上的等级构思,基本整理出以下点评维度以及很有可能的指标值:

1.1数据信息值层级的质量维度

数据信息值层级的质量维度关心的是数据信息值自身所具备的质量特性,关键叙述数据信息值的构造、文件格式、含意、值域,但不关心数据信息值的情况信息内容等别的质量特性。数据信息值质量维度其本质便是数据库的质量,是考量数据质量最基础的维度,是数据信息利用的基本。数据信息值质量维度下的二级指标值有:

1)精确性:就是指数据信息与数据信息所表明的实体线的具体值中间的一致水平,包含数据信息內容和方式上的精确,即数据信息的种类、文件格式、精密度及值域范畴的精确[15]。

2)追朔性:数据信息的追朔性就是指能够追朔数据信息的前因后果,是对数据信息生命期的全方位跟踪,追朔性指标值是用于叙述对数据信息形成和处理方式信息内容的把握水平,数据信息是不是追朔是危害数据资产真实度的关键要素。

3)词义唯一性:词义唯一性规定数据信息集中化类似数据信息目标的名字和含意一致。词义一致是确保数据信息在企业内部开展互换和共享资源的必要条件。

1.2数据层级的质量维度

数据资产是一个有机化学联络的总体,在数据信息值的基本上,还必须考虑数据信息元、数据信息纪录、数据等不一样数据信息层级中间数据信息的一致性、一致性、实效性。数据信息值维度与情景质量维度相互组成数据信息运用质量的基本。本科学研究将数据信息情景维度的二级指标值梳理为下列好多个层面:

1)一致性:是叙述数据信息的详细水平,包含数据信息纪录一致性和数据库查询一致性2个层面。数据信息纪录一致性就是指数据信息元自身的健全水平,包含2个方面:一是纪录方面的详细,即数据库查询内沒有纪录遗失;二是每一条数据信息纪录的特性值是详细的,沒有缺少值。

2)一致性:就是指数据信息的标值、标志、约束等的一致水平。不一样数据库查询/表中间意味着同样实体线的标值是同样的、同一个数据信息目标在不一样客户同一时间浏览时的值是同样的。

3)可辨识度:就是指对关键定义目标的唯一取名和表明,换句话说同一条纪录在系统软件中只出現1次,及其对具备本质逻辑联系的数据信息中间创建关系搭配,可以将具备业务流程关联性的分散化在多各库表中的特性值关系起來。数据信息可辨识度是客户画像、客户模型的提早标准。

1.3数据信息运用层级的质量维度

数据信息运用质量就是指对数据信息利用要求的考虑水平,是创建在数据信息本质质量和情景质量的基本以上,在数据信息运用全过程中反映出去的质量。数据信息运用质量是考量数据质量的关键维度,是决策数据资产使用价值的首要条件。包括下列二级指标值:

1)便捷性:就是指数据信息被利用的非常容易水平,包含2个方面的含意,一是用于叙述数据信息的表述质量,包含數据的标志符号、界定的清楚水平和简约水平,数据信息的业务流程标准是不是确立通俗易懂沒有模棱两可。另一个方面是叙述数据信息便于实际操作解决的水平。

2)实效性:这儿的数据有效性是相对性于失效数据信息来讲的,可以用虚报数据信息、缓存溢出、脏数据、违反规定违反规定数据信息等失效数据信息所占的占比水平来考量,失效数据信息比例越高数据有效性越差。比如,商家店铺违背服务平台标准根据淘宝虚假交易开展“刷销量”造成的订单信息数据信息便是虚报数据信息。

3)时效性:是数据信息考虑利用者及时性规定的水平。一方面指数据信息自身升级的时效性;另一方面就是指大数据中心给出的数据汇报等数据产品的时效性。数据信息的时效性是相对性的。

4)合理化:就是指数据信息值尤其是重要业务流程指标的起伏力度在有效范畴内。数据信息是业务流程转变的反映,基本状况下,业务流程数据信息都是会在一个相对性平稳的区段内起伏,假如发现异常转变很有可能就预兆了数据处理方法程序流程、标准等出現难题造成 数据质量难题。

1.4数据资产层级的质量维度

在网络技术行业,数据信息的财产使用价值关键反映为数据信息的效应使用价值、转现使用价值。依据调查状况,并融合专家访谈結果,数据资产维度的二级指标值关键有:

1)数据信息容积:一是数据信息总产量尺寸,即数据信息的经营规模,包含公司各业务管理系统之中形成的业务流程数据信息、储存在网络服务器中的日志数据信息,及其根据协作或企业企业兼并等方式得到 的外界数据信息。二是数据信息粒度分布是不是能用,它是数据驱动管理决策的前提条件,一般作法是将数据储存为最弹性散射。

2)使用价值相对密度:网络技术行业高使用价值相对密度的数据资产关键反映为根据数据信息可以完成对顾客社会属性、生活方式、消费者行为、个人信用状况等开展全方位勾勒,为公司出示了充足的信息内容,可以协助公司迅速、精确地精准定位总体目标客户人群及其得到 详尽用户需求等更普遍的意见反馈信息内容。

2点评维度以及指标值调整

本科学研究应用德尔菲法对评价方法开展调整,现有11位权威专家参加了资询,包含网络技术企业的大数据中心承担人1名、大数据挖掘权威专家2名、高級产品运营2名、杰出大数据分析师1名、总经理1名,及其学术界图情权威人物2名、博士生2名(出自于保密性服务承诺,这里屏蔽掉权威专家的名字及公司名称)。因为事先曾与这种权威专家经历协作或联络,因此 有较高的回应率。

依据上文根据数据资产管理角度对数据质量点评维度及指标值的剖析結果,于2018年12月根据电子邮箱或手机微信总共派发3轮问卷调查,历经约一个半个月左右。第一轮问卷调查回到率是100%,高效率为92%;在第一轮权威专家建议的基本上对指标值开展了改动后再度传出问卷调查,第二轮问卷调查回到率是92%,高效率为100%;在第二轮权威专家建议的基本上对问卷调查开展第二轮改动。第三轮资询回到

免费试用袋鼠云数字化基础软件,开启企业数字化增长之旅
免费试用袋鼠云数字化基础软件,开启企业数字化增长之旅
袋鼠云立体IP
在线咨询
在线咨询
电话咨询
电话咨询
微信社群
微信社群
资料下载
资料下载
返回顶部
返回顶部