近几年,基金市场火热,相关话题频上微博热搜,相信基金选购话题也经常出现在大家的聊天话题里。基金相对股票来说低风险,且交易频次易控制,已成为新手理财或稳健理财的头号选择,我们作为购买者,会比较基金的短期、长期收益率、单位净值、基金经理的经验等来选择投资。同时,基金公司也会建设客户画像,为每个购买者推荐基金,在此之间,数据作为桥梁打通购买者的需求与售卖者的营销策略,互惠互利。
今天我们来看下基金行业的客户画像是如何搭建的。
金融科技的快速发展,使得资管行业的载体与社交媒体、电子商务融合越来越紧密,企业需要借助数据战略打破数据边界,来构建更为全面的企业营销全景视图。以袋鼠云数栈产品和某基金客户在智能标签上的合作为例。
对基金客户来讲,随着各项业务迅猛的发展和客户数量的急速增长,公司对客户、产品、渠道、反洗钱等方面的数据分析、统计、运营提出了更高的要求。但客户主要面临以下2点问题:
(1) 客户等数据分散于各个系统,无统一的分析平台;
(2) 各类数据分析和提取大多采用半自动的工作模式,无科学的标签体系及资源共享平台提供及时和有力的支持,导致客户信息维度不完整,客户活动开发周期长,运营不精准,营销效果缺乏及时追踪、运行反馈不及时等。
鉴于以上痛点,及更好的适应并支持现实业务的需要,建立客户自己的标签系统。
1. 建设方式
智能标签标准产品(DataTag)+标签体系梳理与开发
2. 技术方案
标签建设一般会包含“数据读取-标签加工-标签更新-标签评估-标签圈群-客户/群组画像-群组分析-数据服务”,其间涉及到技术选型如下:
以下是标签建设通用方案与该项目具体方案:
某项目技术架构
a.计算集群对接:智能标签产品采用的OLAP引擎是Presto,并有Presto的二次开发能力,如Presto的公开插件中没有Inceptor的连接器,袋鼠云便自研该插件完成Presto对Inceptor的读写,进行标签的加工与查询。DataTag之前也已适配过Cloudera的CDP产品,支持对接Apache Hadoop集群以及发行版Hadoop。
b.标签周期与手动跑批:
(1) 采用presto读写Hive数据进行标签大宽表的加工,最终将所有标签放在一张大宽表中,从而提高标签圈群与群组分析的效率;
(2) 标签除根据选择的调度周期定时跑批外,可进行手动更新,且手动更新时产生一个新的秒级分区,以解决业务人员想即加工标签即用的场景,不影响其他人员圈群的需求。
c.标签圈群:通过Presto查询标签大宽表进行目前群组圈选,并让用户选择群组数据是否要落库和定时更新。
d.数据服务:标签和群组的对外服务,通过数据同步或数据API来完成。
(1)通过数据同步工具,将存在Hive的标签表、群组表同步至其他数据库,在其他应用平台应用。
(2)创建API服务,通过API接口调用标签或群组数据。会将Hive的结果表同步至HBase,API查询HBase数据库,具有查询速度快、存储数据量大、可解决Presto并发量不高问题等优点。
3. 产品方案
对应以上建设目标,产品解决方案如下:
a.多实体与关系建模
基于“多实体”设计,实现可创建基金行业中客户、产品、渠道多个对象的标签体系;并可通过“关系”将多实体进行关联,创建基于多个实体原子标签的衍生与组合标签。
b.[原子标签/规则标签/SQL标签/算法标签/组合标签]多维标签生成
可将数仓ETL加工的原子标签直接读入。用DataTag中设置规则标签与SQL标签的加工规则,“求和、去 重计数、计数、最大值、最小值、均值、排序”等聚合函数、子查询、连接操作符、多层且或关系均可支持,灵活加工出目标标签。同时通过算法平台加工算法标签,并将算法标签的元数据读入DataTag进行标签统一管理,实现标签的便捷加工与运算。
标签加工方式灵活多样,业务人员也可直接介入规则类标签标签加工,可随时修改标签规则。且标签创建完成后,可立即进行标签更新,让业务人员立即使用,提高生产效率。
c.标签全生命周期管理
从标签定义-标签开发-标签发布-标签更新-标签评估-标签下线,管理标签全生命周 期,各过程可管可控,统一标签管理规范、沉淀企业核心标签资产,形成企业统一的标签中心。
d.个体画像、群组画像、群组对比、群组显著性分析等优化标签体系与群组投放
(1)个体画像:根据实体用户标识,查询单个实例的实体画像,如某用户的用户画像,帮助运营人员 更加直观的了解用户,助力精准营销。
(2)群组画像:自定义画像模板,从不同维度分析群组特征,掌握群组画像,为目标群组 的选择与营销策略的投放提供参考。
(3)显著性分析:通过 TGI 指数计算群组的显著性特征,挖掘群组偏好,提升增长、 赋能业务。
(4)群组对比:同一实体下的不同群组进行相似性与差异性分析,查看群组特征,进行群组优化。
e.数据权限细粒度精致,保障数据安全
(1) 标签可见性控制:通过标签发布时控制可见用户组,实现部分标签只对部分人员可见,形成部门或个人的标签池。
(2) 标签读写列权限控制:发布某标签(后续进行标签加工),使用某标签(标签圈群和分析时使用)都需要经过部门管理员、项目管理员审批,严格控制标签的查询、加工操作。
(3) 标签行级权限控制:针对用户设置标签的可读行级权限,比如负责直销售基金的部门,只能查看渠道是“纯直营自销“客户的标签数据,不可见“代销“渠道的客户数据。
(4) 标签脱敏:针对敏感标签(如身份证号、电话号码等)可进行部分人员脱敏,数据查询或分析时,展示脱敏后的数据。
通过标准化的产品方案,解决客户无统一标签分析平台、标签半自动化加工、加工周期长等痛点。
4. 标签体系设计
按照标签建设方法论和数仓模型,从基金客户的基本属性数据、交易数据、持仓数据、基金产品数据、用户行为数据等多方面数据,建设出基于以下标签类目的200+标签,每天定时跑批加工。
基于以下划分标准,采用不同的标签类型,在不用平台完成标签加工。
原子标签:既定事实,从原始数据中提取,比如性别、生日等信息;
衍生标签:没有对应数据,需要定义规则,由原子标签来计算得出标签实例,比如区间类;
组合标签:没有对应数据,需要定义规则,多种类型标签来计算得出标签,比如偏好类;
算法标签:参考已有事实数据建立算法模型,来预测用户的行为或偏好;
实时标签:基于业务系统数据实时更新标签数据,比如基于埋点数据设计的标签;
自定义标签:通过自定义sql的形式完成标签数据萃取;或手动打给用户的标签。
基于建设好的标签,业务人员便可透明化的使用标签,将数据库的黑盒子变成业务语言的白盒子,辅助业务决策,驱动业务增长。标签在基金行业主要应用于以下场景:
当新基发行时,会进行一定的营销活动,向用户推广。如新基金首先会面向直销自营、偏爱新基金、活跃客户、不具有反洗钱特征等的用户推送,先圈定一部分用户,然后再结合客户的交付风格、持仓风格圈定优选客群。推送一批客户后,可再基于首轮命中客群的相似人群进行补充推广,是一个持续迭代的营销过程。
面向个人的基金推荐,如债券型基金一般推送给有过购买债券型基金行为、购买潜力高的客户;根据用户偏好进行千人千面的金融资讯推送,丰富用户理财知识;基于用户的投资时长,推送不同理财阶段的投资课程等。
根据用户风险类标签,找到短期内频繁开立账户、撤销账户、频繁交易、交易IP跨境、交易时间异常的客户,进行重点防范与预警,保障金融安全。
根据客户活跃度、交易周期、账户余额区间、盈利情况等标签,找到静默用户,进行触点激活。
后续数栈智能标签产品将会采用算法进行人群圈选,补充业务规则圈群的局限性,以及基于实时标签人群的实时推送方面进行进一步探索,使业务营销更加精准、高效。