数据中台数据中台
申请试用
新闻动态
了解袋鼠云最新动态
新闻动态>企业数据中台资产层主要有哪些方面组成?>
企业数据中台资产层主要有哪些方面组成?
2021325|文章来源:-

企业数据中台资产层主要有哪些方面组成?数据资产层是数据中心层,依靠工具平台层,这层有什么内容?答案因企业业务和行业而异,但总体上可分为主题区域模型区域、标签模型区域和算法模型区域。


1)主题域模型。
主题域模式是指面向业务分析,将业务流程或维度抽象化集合。业务流程可以概括为订单、合同、营销等不可分割的行为事件。
为了保障整个系统的生命力,主题域即数据域需要抽象提炼,长期维护和更新,但不容易变动。在分割数据域时,必须复盖当前所有业务的需求,保证新业务无影响地包含在现有的数据域中,或者容易扩展新的数据域。
数据域的划分首先需要充分调查业务系统。将业务流程划分到哪个数据域没有绝对的对错,但是会影响报表开发商对数据的定位效率,因此也需要从开发商定位效率的角度进行综合划分。
2)标签模型。
标签模型的设计与主题域模型的方法相似,同样需要结合业务流程进行设计,充分理解业务流程。标签通常涉及企业经营过程中的实体目标,如会员、商品、商店、经销商等。这些主体一般插入各业务流程,如会员插入关注、注册、阅览、订单、评价、服务等环节。
设计标签时,必须充分理解这些业务流程,在流程中发现标签的应用点,结合这些应用点构建企业的标签系统。
标签模型按计算模式一般分为客观标签和主观标签,客观标签可量化,主观标签不量化。根据实现方式,标签可分为事实标签、模型标签、算法标签等,根据业务场景,标签可分为基础信息标签、喜好标签、价值标签等。
设计标签模型时非常重要的因素是标签模型必须具有可扩展性。毕竟,标签这种数据资产需要持续运营,也有生命周期,运营过程中可能随时增加新的标签。
3)算法模型。
算法模型更贴近业务场景。在设计算法模型时,重复推进算法模型使用的场景,包括模型的冷启动等问题。整个模型的构筑过程包括定场景、数据来源准备、特征工程、模型设计、模型训练、正式在线、参数调整7个环节。
企业数据中台资产层主要有哪些方面组成?以新零售企业为例,常用的机器学习算法有决策树、神经网、相关规则、聚类、贝叶斯、支持向量机等。这些算法已经非常成熟,可以用于实现商品个性化推荐、销售预测、流失预测、商品集团商品优化等新零售场景的算法模型。

此刻起,和袋鼠云一起让数据产生更大价值
此刻起,和袋鼠云一起让数据产生更大价值