博客 一文带你了解,三步进行系统化标签管理 | 袋鼠云标签洞察平台TagInsight

一文带你了解,三步进行系统化标签管理 | 袋鼠云标签洞察平台TagInsight

   数栈君   发表于 2024-11-25 14:50  270  0

在当今数据驱动的时代,企业需要给各类用户、商品、渠道等创建日益丰富、完善的标签,用以对其做全面的刻画与分析洞察。这个过程中,有效地进行标签管理成为了企业和组织不可或缺的能力。标签管理不仅能够帮助我们更好地组织和理解海量信息,还能够提高数据的可发现性和利用率,从而支持更精准的决策制定和业务优化。

通过合理设计、创建、应用及维护标签,我们可以确保数据资产得到最大化的利用,同时也提升了整体的工作效率和用户体验。企业可以通过三步走实现标签管理:实体管理->标签管理->实体数据安全管理,下面我们将分三个方面讲解如何结合袋鼠云标签洞察平台TagInsight进行系统性的标签管理。

实体管理

实体是打标的具体对象的统称,如客户、用户、商品等。标签则是对这些实体进行刻画,用来标记特定实体的状态、类型、属性等信息。

实体管理的过程即是对实体内所有需要加工的标签统一管理的过程,这其中就涉及实体管理、表和实体之间的关系管理、任务管理等内容。

实体管理主要包括实体基本信息的定义及其相关数据量级的管理,其中,实体基本信息主要包括实体名称、实体标识、实体描述等内容;实体数据量级主要包括实例量级、标签量级、群组量级等。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/633e8ada36b724c0edb71f3d32347b80..png

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/295d4ddfb4f777867c49ea01242d00c7..png

以实体为单位进行标签管理,可以更容易地进行聚合分析,揭示隐藏在大量数据背后的模式和趋势,如在市场营销中,可以根据用户标签进行细分市场分析,以此增强业务人员的数据分析能力。此外,实体管理也有助于业务层面进行跨实体圈群、个性化推荐等动作,这个过程可以充分利用用户特征、商品特征来挖掘目标受众需求,以实现更大的投入产出比。

标签管理

实体标签体系建设好以后,只是完成了从0-1的过程。标签管理是一项系统性的工程,涵盖标签分类、标签元数据管理、标签字典构建以及标签生命周期管理等多个方面。还需要对标签的整个生命周期进行管理和迭代,使其更好地满足不用阶段的业务发展需求。

  • 标签分类

通过科学合理的标签分类,可以确保每类标签都有明确的定义和适用范围,同时也方便后续的指标检索与管理。标签分类建设过程中,根据实际业务情况,一般建立2-3层,建议一个子类目不超过20个标签,不少于3个标签。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/148ceb47b45c4287eed10544ab73aee6..png

  • 标签元数据管理

标签元数据则提供了关于标签自身的信息,如创建时间、更新记录、负责人等,有助于维护标签的准确性和时效性。

袋鼠云的标签平台从标签元数据的完善性与全面性考虑,支持企业自定义标签元数据信息。该自定义元数据也是以实体为单位进行统一管理。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/27812a14592ade3a5dcec1a52d0c280a..png

  • 标签字典构建

标签字典则是一个集中管理的资源库,记录了所有可用标签数据的业务含义,为标签的一致性使用奠定基础。

通常,标签字典可细分为三种类型:标签值映射字典、标签值穷举字典、标签联动字典。

标签值映射字典指需要将数据库存储数据做业务层转换,如性别标签在数据库存储为0/1值,业务做标签数据查询时则是以男/女展示,以此来降低业务人员理解成本。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/64e9795a207a8696da8b08032f05b910..png

标签值穷举字典指穷举标签值,如事件类型标签,包含登录、点击、收藏、关注、搜索等标签值,预设标签值将有助于提升业务人员筛选标签数据时的标签值检索效率。

标签联动字典指标签之间存在联动关系,标签值筛选时可直接基于上一层级选择内容快速选择当前层级数据,缩小筛选范围,适用于省-市-区选择一类的场景。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/8e26608e255d88038636fa40a77e923d..png

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/002953fc7e99de30256162e2394860c5..png

  • 标签生命周期管理

生命周期管理则贯穿标签从创建到废弃的全过程,确保标签始终保持最新状态,并及时清理不再需要的标签,从而提高数据管理的整体效率和质量。这个过程涉及标签上下线、标签版本迭代、标签评估等内容。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/ffbb9e0dfc248e85688e5d50b829f9b6..png

标签迭代或下线的过程中,需要基于标签血缘来判断影响范围,避免对业务侧造成不必要的影响。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/4006696a77334afe0e8ffa500e18217e..png

为了实现对标签生命周期更为科学与高效的管理,企业亟需建立一套标准化的标签评分体系,并将其切实应用到标签评价中,以指导标签管理者迅速决策是否需要对标签进行优化或下线等处理。经过与众多企业的深入合作与探索,袋鼠云已成功构建了一套全面且系统的标签评分框架。该框架从使用频率、关注度、数据质量、持续优化能力以及安全性五个维度对标签进行全面评估。对于希望深入了解这一创新体系及其具体实施细节的朋友,欢迎查阅我们此前发布的详细文章➡️标签评分:海量标签如何进行系统治理?

实体数据安全管理

面向业务侧而言,为了便于设置不同等级权限,规避信息泄露的风险,系统性的进行标签管理,还需要进行实体数据安全管理。实体数据安全管理涉及标签级数据管理、实例级数据管理两部分。

  • 标签级数据管理

主要涉及标签授权/申请、标签脱敏、标签加密等内容。用户可以根据标签属性信息主动申请标签,以获得标签数据权限。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/0d30e923ce5bae2030a110d845145b71..png

管理员也可将标签以实体/标签分类/标签为单位授权给目标用户群体直接使用标签。

标签脱敏及加密则是用户只可以看到标签数据中的部分内容或是转译后的内容,在不影响用户查询分析数据的同时,也可以做一定的数据安全管控。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/9b7b7f7f7e283b7a630eba3a44aba72b..png

  • 实例级数据管理

主要涉及行级权限管理。如,医生只能查看自己负责的病人信息,而不能查看其他医生的病人记录。这类场景可通过行级权限功能来实现。标签管理员可基于标签查询用户的特定身份标识对数据做实例级过滤,让其只能看到自己权限范围内的数据。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/3bd6bf06a80bbf100e8c7a6ec3afa2e5..png

另一类场景则是筛选条件相对固定,不需要区分不同用户做动态的条件值变更,如高潜用户相对机密,需要对普通员工保密,则可以设定普通员工只能看中低潜用户信息。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/963ec96021729d1825dd8c8ee94df0a5..png

标签是打通数据后台与渠道系统之间的重要载体,标签数据的系统化管理,是理顺标签体系、发挥标签价值的重要途径。企业可以基于标签洞察平台TagInsight落地标签体系并进行更加完善、系统的标签管理与标签分析洞察,将标签洞察结果与下游应用对接,让标签数据更快、更好的为业务提供价值。

《数据资产管理白皮书》下载地址:https://www.dtstack.com/resources/1073/?src=bbs

《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057/?src=bbs

《数据治理行业实践白皮书》下载地址:https://www.dtstack.com/resources/1001/?src=bbs

《数栈V6.0产品白皮书》下载地址:https://www.dtstack.com/resources/1004/?src=bbs

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群