本期,我们更新和优化了智能指标和标签洞察相关功能,为您提供更高效的产品能力。以下为第13期袋鼠云产品功能更新报告,请继续阅读。
重点更新内容
1.【指标】-调用全局参数可预览参数中的上传文件
此前,全局参数中「按计划时间查找参数值」这一类型的参数值是动态变化的。实际应用中,需依据业务日期,从上传的 Excel 文件里获取与之对应的参数值,全局参数不支持预览上传文件的内容,给用户造成极大不便。
因此,此次更新增加预览支持功能。在用户新增/编辑自定义指标时,选择「按计划时间查找参数值」类型全局参数后,可在「参数配置」弹窗中点击对应参数的「文件详情」查看该参数中上传的文件,了解该参数的参数值动态变化规则设定。
2.【指标】-指标定义支持不落表,数据做即席查询
在借助指标平台开展指标管理工作时,在很大程度上依赖于数据落表操作。然而,当数据量较小时,采用如 SR、Doris 等引擎直接进行查询,同样能够实现秒级响应。基于此,本次更新将实现指标定义完成后,无需进行数据落表操作,每次执行查询时,系统可实时查询并返回数据结果 。
• 针对 Doris 引擎,派生、复合、自定义指标支持只定义指标,不执行周期任务落表
• 定义指标中的「设置调度信息」步骤中
a.设置数据查询方式 = 即席查询:无需配置其他内容,结果查询时基于定义的技术口径,系统自动做SQL拼接进行结果查询
b.设置数据查询方式 = 落表查询:配置落表信息,包括指标表名称、调度属性、依赖属性等,结果查询时基于落表数据做结果查询
• 指标告警时,仅针对落表查询的指标可进行告警配置
• API调用时,仅针对落表查询的指标可创建API
3.【指标】-维度值选择时,选项来源优化
在指标平台的使用过程中,当进行维度值选择时,所提供的选项全部来源于指标结果表。但平台存在数据不落表的场景,而且指标结果表的最新分区,不一定涵盖了所有的维度值。为解决这一问题,此次将统一做出调整,把维度值选项的来源,变更为从维度管理中的主维表、次维表中获取。
对于平台上涉及维度值选择的功能,其下拉框选项范围将按如下规则调整:在维度关联的维表中,依照主维表 - 次维表的顺序选取第一个表,查询该表维度字段的枚举值,并对前 100 个枚举值进行去重处理(若是分区表,则仅查询最新分区)。涉及功能如下:
• 指标市场-结果查询-维度下拉框取值
• 指标市场-指标详情-指标血缘-结果查询
• 数据权限-维度列筛选下拉框取值
4.【指标】-支持由用户自行完成指标任务开发
指标平台所生成的任务规则较为固定,灵活性不足。部分用户反馈,希望指标平台能进一步强化管理职能,将任务开发工作交由数据开发团队独立完成(例:基于任务运行速度等因素考虑会期望对多个指标做合并运行、结果写到相同的表中)。
优化后的平台,用户在平台上能够自主定义指标的各项属性及详细的计算口径。完成定义后,用户可将数据开发团队所生成的结果表,与平台中定义的指标进行绑定,后续通过平台做统一查询。涉及功能如下:
• 在进行数据模型定义时,用户可自行指定后续生成的指标是否仅能通过平台进行数据落表操作。若开启此选项,基于该数据模型所生成的所有指标,都必须经由平台进行加工处理并完成数据落表,用户无法手动注册自建结果表;若未开启此选项,用户在后续指标落表方式上拥有灵活的选择权,不受特殊限制。但需注意的是,行更新相关功能将无法使用,这是因为该功能仅在 Trino 引擎下支持。
• 在定义派生、复合指标过程中,指标加工方式可选择自动生成或手动生成。若选择自动生成,需定义表信息、调度信息等,由平台生成计算任务并将计算结果周期性地写入结果表中;若选择手动生成,选择已有的指标结果表与当前定义的指标做绑定即可。
5.【指标】-指标落表升级
历史指标落表定义为一个指标对应一个结果表(只可满足一个维度组合的落表),但无论是城市维度的销售额,例如,城市维度下的销售额统计与区域维度下的销售额统计,从业务角度看,它们本质上都属于销售额这一指标;从开发视角而言,两者的计算口径差异仅在于所选取的维度不同。
针对这类场景,若将计算口径除聚合维度外不存在其他差异的数据,汇总为同一个指标,既有利于开发层面统一管理指标,也有利于业务层面统一使用指标。涉及功能如下:
• 派生、复合指标落表数量由一个调整为多个,可同时选择多个聚合维度落表。
• 指标自动路由计算:
a.原子指标支持定义聚合函数,若定义了聚合函数,对应派生指标计算时,涉及到粗维度数据计算,将由细维度结果表直接进行维度聚合,提高计算速度。
b.自定义指标支持定义聚合函数,若定义了聚合函数,复合指标基于该自定义指标做计算时,涉及到粗维度数据计算,将由细维度结果表直接进行维度聚合,提高计算速度。
其中,首次生成的指标,指标对接请选择「新指标」,并配置指标信息(新增聚合方式需要配置)。
若本次SQL涉及的指标历史配置过,那么在指标对接环节,选择历史创建的指标,后续则在该指标基础上增加新的聚合维度的计算口径即可。
编辑自定义指标时,需指定SQL后进行编辑;删除自定义指标时,可指定SQL删除,也可删除整个指标。
c.复合指标定义聚合函数的作用调整:
• 指标市场结果查询先指定聚合维度后,再做结果查询。
• 支持一个API定义多个维度组合,基于API的服务编排功能创建API,API调用者可指定维度组合调用对应的结果表,对应的API任务是每个维度组合一个宽表聚合任务(Trino额外涉及一个数据同步任务)。
• 数据权限设置时,可在指标层面对维度设置行级权限,指标值层面的行级权限还是原来的基于表设置。
• 仅通过平台落表的指标支持设置告警规则,每个指标结果表会做一次告警监控。
6.【指标】-支持自助查询指标不同聚合维度的数据结果
指标平台之前只提供了指标计算功能,生成的数据结果只能在指标市场中做单表查询,或是通过API调用,不方便业务方综合查询、分析数据,新增自助取数功能解决上述问题。涉及功能如下:
• 用户可灵活选择时间段、指标、维度、筛选条件进行数据查询,系统基于指标定义规则自动拼接SQL查询数据结果
• 支持下载查询结果,便于做后续数据分析
• 支持查看查询SQL,以校验数据结果的准确性
7.【指标】-统计周期支持定义统计粒度
系统难以对历史创建的统计周期所对应的统计时间区间段做出快速判断,尤其是针对按日统计的指标,用户在进行指标数据查询时,常常需要将一段时间内的数据进行汇总,以此来了解数据的总体情况。因此,本次更新新增统计周期支持定义统计粒度功能。涉及功能如下:
• 统计周期增加统计粒度字段,系统内置的「当日」的统计粒度为日,其他暂无统计粒度
• 自定义的统计周期,若定义统计粒度为日,则统计周期结束时间与开始时间相同,定义开始时间即可
• 在自助取数过程中,对于基于日统计粒度的统计周期所创建的派生指标及其后续衍生的复合指标 ,系统提供数据汇总展示功能,用户只需勾选该功能选项,即可对选定查询日期段内的数据进行自动汇总,最终以一条整体数据的形式呈现。
8.【标签】-支持创建客户模型
在营销场景中,为实现更高的投入产出比,企业亟需对客户形成更深入、及时且全面的认知,从而制定精准且具针对性的营销策略。鉴于此,标签平台整合封装了一系列常用客户模型,以提高业务人员对客户的分析、洞察效率,推动业务有力增长。
平台封装两类模型:客户价值模型、生命周期模型。其中,客户价值模型包括RFM模型,生命周期模型包括APMDR模型、AIPL模型、AARRR模型。
• RFM模型:一种通过客户的R消费间隔(Recency)、F消费频率(Frequency)、M消费金额(Monetary)三项指标来衡量客户价值的手段。具体使用如下:
先定义每个参数的取值规则、模型取值、模型更新规则信息。
模型数据更新成功后,可基于RFM模型对客户做价值分析。
a.查看客户整体价值表现
b.查看客户构成
• APMDR模型:根据客户在不同生命周期阶段具有的不同客户价值,开展具有针对性的客户经营服务活动。整体定义内容与RFM模型类似,其中的参数取值规则定义需要基于选定的标签做条件过滤,具体配置如下:
模型数据更新成功后,可基于APMDR模型对客户做生命周期分析。
a.查看客户整体价值表现
b.查看指定日期下的客户生命周期阶段流转变化情况
• AIPL模型:将用户对品牌的认知量化的一个营销模型,实现品牌人群资产定量化、链路化。模型配置及分析整体与APMDR类似,此处不做赘述。
• AARRR模型:AARRR分别代表了五个单词,又分别对应了产品生命周期中的五个阶段,获取、激活、存留、收益、推荐。模型配置及分析整体与APMDR类似,此处不做赘述。
其他功能优化说明
1.【智能指标】
对前后端代码进行优化,提升数据模型功能模块的整体性能,以及提升代码的可维护性。
模型/指标共享时,在展示共享失败项目的同时也会展示对应的失败报错信息。
新增/编辑自定义指标界面,用户可通过「参数配置」弹窗中的hover提示,查看所有全局参数。
自定义指标支持用户在SQL中语句中写注释。
平台层面支持配置Trino/Doris作为计算组件,配置后在整个平台层面生效。
针对复合指标、API的full join场景,full join调整为union all,提升查询速度。
指标市场结果查询时的业务日期增加默认调整:近7日,最多可选90天。
模型详情展示信息补充模型编码等配置信息。
派生指标中的统计周期字段类型转化逻辑优化,将字段转换为date类型做时间区间比较。
支持将自助取数条件保存为模版方便后续常规查询
2.【标签洞察】