本文作者:子玺
袋鼠云数据中台解决方案专家。拥有近10年大数据从业经验,拥有PMP项目管理资格认证,精通数据类项目的开发实施和管理。曾服务过国家工商总局、北京市工商局、北京市财政局、广州开发区大数据局、平湖人社局、海盐人社局等行政单位,担任多个大型数据项目的数据应用咨询顾问/项目经理。
正文:
一、什么是用户画像?什么是标签?
当我们从互联网时代逐渐步入大数据时代后,企业及消费者行为不可避免地要面临一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是「可视化」的,然而,「似乎」并不等于「一定」。海量数据赋予企业的不一定都是可用信息「如何能够让企业在排山倒海般的数据海洋里更清晰、更快速地感知电脑那一端具体某类用户的喜好,从而为做精准营销服务」一直以来都被热切讨论,其中最行之有效的方式就是基于行为大数据构建清晰的「用户画像」。
用户画像(User Profile)
是对现实世界中「用户」的数学建模,它能够完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了精准营销的基础。之所以说用户画像是一种模型,是因为它是通过分析挖掘用户尽可能多的数据信息得到的,它从数据中来,但对数据做过了抽象,做过概念泛化,比数据要高,后面所有用户画像的内容都是基于这个展开的。比如「游戏宅」,这个肯定是挖掘分析出来的,不是说原来的数据中包含游戏宅这个属性。
标签(Tag)
则是某一种用户特征的符号表示,是我们观察、认识和描述用户的一个角度,例如刚刚的「游戏宅」,其实就是一个用户生活习惯的侧面标签。标签和用户画像的关系是整体和局部的关系,而这种关系则通过「标签体系」体现。
二、袋鼠云标签体系建设方法论
我们刚刚说到,用户画像其实就是标签的集合,那么如何构建这个集合呢?
经过多个项目的经验沉淀,袋鼠云整理了标签体系建设的四字箴言,那就是:「 建、用、优、精 」。我们说,罗马不是一天建成的,同样标签体系建设是个体系化的工作,需要不断的用业务来滋养,初步建立后,通过业务方的使用及反馈,不断优化它,并最终沉淀、精炼出一套适合企业自身发展诉求的标签体系。
下面,我们以典型互联网电商平台用户标签体系的构建过程为例来帮助大家理解。
在电商这个场景下,我们构建用户标签体系主要根据用户在历史时间内的网购行为记录,从网购时间点、内容深度剖析,针对用户的基础属性、社交行为、互动行为、消费行为、偏好习惯、财富属性、信用属性和地理属性等八大维度构建用户标签体系,以期综合描绘平台消费者的行为特征。
建设的过程分为六个基本步骤:
-
首先以业务视角梳理规划整个标签体系的架构,即上面所说的八个维度
-
无规矩不成方圆,在进行实际开发之前,我们要定义包括数据(指标)规范、模型设计规范、ETL规范在内的规范体系。前文也讲过,这个规范体系可以借助数栈产品帮助建立和执行
-
将分散在各个系统/应用的数据同步到大数据开发平台之上,包括结构化的业务数据、埋点采集的行为日志数据等
-
核心围绕“用户”,以唯一标识打通来自不同平台、系统、渠道的数据,基于OneData体系依次构建全域数据中心、萃取数据中心
-
在萃取数据中心基础上,进行各类标签的研发,例如事实类标签(性别、年龄段等)、业务类标签(钻石会员、普通会员等)、统计类标签(近90天下单金额等)、算法类标签(重要保持客户、高忠诚度客户等)
-
标签/画像投入应用,或对接至下游业务系统,产生业务价值。与此同时监控各类标签的使用与效果,统计出热门标签,替换掉不合理的标签,调整业务算法和规则,添加新的标签等,来进一步推动标签体系的梳理规划,逐步沉淀一套精华版标签集合
这其中,除了业务的输入以及数据的支撑外,要想快速建立一套科学的标签体系,还需要丰富的技术经验以及智能的工具或平台来提供助力,而袋鼠云则专注于为企业提供专业的数据技术服务及智能的大数据开发平台,有能力帮助企业最大限度地缩短“读懂用户“这个目标的实现过程。
三、小结
最后再对前面讲的内容进行一个小结,在大数据时代,机器要学会从比特流中解读用户,构建用户画像尤其重要,是上层各种数据应用的基础,也就是袋鼠云数据中台专栏下一期要讲的数据应用的内容。
构建用户画像的核心是进行标签体系建设,合理的标签体系不是一次性工程,它需要不断地被业务滋养。为此,袋鼠云总结了标签体系建设的四字经验:建、用、优、精。
最后,袋鼠云拥有丰富的企业数据项目落地经验,有能力帮助企业构建科学合理的标签体系,为企业数据价值最大化提供助力。
敬请期待袋鼠云数据中台专栏第8期:数据应用规划与实现
《袋鼠云数据中台专栏》
——为何而作?
企业的发展,往往伴随着业务更多元化,而与此同时企业在积极推进业务数据化,因此越来越多的企业伴随着各个垂直业务的发展,形成了一个个垂直的数据中心,如何打通这些数据并且以统一的标准进行建设,以达到技术降本、应用提效、业务赋能的目标,是众多企业面临的问题。
阿里巴巴提出的数据中台模式正是为解决这些问题而生,并通过实践形成了统一全域数据体系,实现了计算存储累计过亿的成本降低、响应业务效率多倍提升、为业务快速创新提供坚实保障。
中台首先是一种战略选择,一种组织形式,其次才是一些有形的产品支撑和实施的方法论。
袋鼠云核心团队曾参与阿里中台体系构建、实现,对阿里巴巴数据中台思想有着最深刻的理解,对数据中台技术有着深厚的积淀。
作为阿里云数加平台金牌合作伙伴、阿里云生态技术先锋(ITP),袋鼠云有责任肩负起数据中台思想传播和技术应用探讨的使命,和更多企业客户一起挖掘数据价值,让数据产生价值,让未来变成现在。
《袋鼠云数据中台专栏》
——每月2-3篇
“数据中台专栏”自5月25日起,已经持续更新6篇。
本专栏系由袋鼠云数据中台解决方案部门的众多资深业务架构师一起协力完成,更多精彩内容,敬请期待!