企业建设 CDP 的核心目的是沉淀高质量的用户数据资产,为后续开展精细化的数据应用提供有力支撑。但在 CDP 建设过程中,企业各渠道用户众多,品牌与用户的触点丰富,用户旅程千差万别,各种各样的用户 ID、设备 ID 标识及对应的行为事件,导致潜在用户和存量用户之间的关联关系断裂。
如何将一个用户在各个不同渠道、生态及业务系统中的身份标识串联起来,成为搭建 CDP 的关键。
具体来看,在 CDP 数据建设过程中,企业实现全域用户关联普遍存在以下三个痛点:
企业整体业务运作往往离不开 ERP、CRM、会员系统等各类独立运作的业务系统,呈现出典型的烟囱化数据生态,企业在构建 CDP 的过程中,往往没有对整体业务系统进行过梳理,缺乏合理的用户数据关联体系设计,导致不同业务系统中上报的用户数据无法打通,为 CDP 的数据应用带来了很大阻碍。
CDP 作为企业沉淀用户数据资产的中心,需要对接各类业务系统、用户触点和第三方数据源,这中间普遍存在的问题是,不同业务系统的数据格式、规范不统一,比如同一个数据字段在不同系统中代表的意义和值不一样;手机号、证件类型等数据格式在不同系统中定义不一致等。
不同的业务系统,其数据的类型、导入方式、ID 绑定等均不统一。在数据导入至 CDP 时,数据质量参差不齐,在数据关联过程中容易被低质量数据污染,无法保证数据准确性,导致整体用户数据可用性下滑,出现以下情况: 数据导入后用户 ID 发生变化;用户全生命周期内数据不打通;数据映射关系不唯一等。
企业要想真正落地 CDP 项目并产生业务价值,其用户数据体系建设的终极目标就是全域用户的标识唯一化,即 One ID, 把来自不同渠道、生态、业务系统的用户标识识别为同一个对象。
在建设 CDP 的过程中,企业首先需要深入理解与 CDP 相关的上下游业务系统的数据状况,以用户为中心,对数据应用场景进行梳理,包括业务数据的收集方式、用户数据的输出条件以及用户接触点的多样性等。
作为 CDP 系统的核心功能,全域用户关联对上游数据的整合和下游业务系统的运作均具有深远影响。因此,在方案设计的早期阶段,企业应详尽地审视并盘点与 CDP 相关的上下游数据现状,确保方案的逻辑严密性和实施的顺畅性。
在制定用户 ID 关联策略时,首要步骤是清晰地界定各业务领域内哪些 ID 参与用户关联,同时确定这些 ID 的优先级排序、数量分配以及是否存在父子节点等关键属性信息。
关于 ID 优先级的确立,其核心目的在于解决数据冲突时的归属问题,即在单条数据携带多个 ID 且难以直接关联至特定用户时,依据预设的优先级规则,将数据分配给优先级更高的 ID 所对应的用户。这一机制确保了数据归属的明确性与一致性。
在众多 ID 类型中,业务唯一 ID 占据着至高无上的地位,它作为系统中唯一且无歧义地标识一个用户的标识符,享有最高的优先级。以电商行业为例,用户的登录 ID 由于紧密关联其购物行为,且易于通过多种渠道获取,常被视作业务唯一 ID 的典范。
数量维度的考量则基于业务实际,即一个用户可能持有的 ID 类型数量,这一信息对于验证关联关系的合规性至关重要。
此外,在某些复杂的业务生态系统中,ID 之间还可能形成层级结构,即存在父子关系。父节点的定义不仅深化了 ID 之间的关联逻辑,还在解绑操作中发挥着重要作用,如微信生态中 Union ID 作为 Open ID 的父节点,一旦 Union ID 被解绑,其下所有关联的 Open ID 也将自动解除绑定,体现了父子关系的连锁效应。
完成上述 ID 的全面梳理与定义后,便可精准施策,通过埋点采集、ETL 处理等手段,实现用户数据的有效关联与整合。简而言之,这一过程即是明确哪些业务系统的哪些关键数据需要被提取并导入 CDP 系统,确保每个业务事件的相关属性及其涉及的 ID 在埋点设计和 ETL 流程中得到充分体现,从而显著降低技术团队的理解与实施难度,提升整体工作效率。
在完成全域用户关联之后,不可避免地会在用户数据中遇到历史数据关联错误的情况。为了纠正这些错误,我们需要根据新的关联结果,将错误数据从原有绑定中解绑,并将其正确地归属到相应的用户,以完善用户全生命周期画像,提高 CDP 的数据质量。
另外,若历史数据中存在唯一用户 ID 与现有数据发生冲突,我们应该按照时间顺序将两个唯一用户 ID 进行合并,以此完成数据关联的历史追溯工作。
举个例子。在用户关联过程。