新闻动态> 直播回顾|一文详解标签类目体系落地方法与建设价值

直播回顾|一文详解标签类目体系落地方法与建设价值

数澜科技2022-05-18 数澜科技数澜科技 数澜科技数据中台

讲师介绍:

数澜科技
讲师介绍:李志强(莫奈),数澜科技资深数据专家,近10年大数据行业工作经验,先后参与过某大型股份制银行信用卡营销平台建设、时尚集团数据化平台建设项目、长虹数据中台项目等大型集团公司数字化项目,擅长企业标签体系设计,有丰富的大数据项目从0到1落地经验,具备DAMA数据治理工程师证书。

【以下内容为莫奈分享内容整理而成】

大家好!我是数澜科技资深数据专家李志强,花名莫奈,接下来由我和大家共同探讨标签类目体系落地方法和建设价值。

今天分享的内容分为以下七个章节:

数澜科技


标签是什么?

1.1 标签是什么?

标签:指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的,方便业务人员使用的。

数澜科技


1.2 标签可分为哪些类型?

分成三类,基础类,加工类和挖掘类

1、基础类:常见数据业务系统,通过数据平台、数据中台直接获取到一些数据,比如说年龄,地址,理财客户,或者是他的性别,这都是可以在小程序,或者通过用户注册的,可以直接得到的一些基础类信息。

2、加工类:逻辑类加工、衍生配置型加工

1)逻辑类可以进行加工的,逻辑加工型标签指在基础类数据上经过一系列的有规则的关联 、计算 、汇总等方式产生的数据。大多通过SQL语法规则获取,例如客户理财总额、客户存款日均、客户M1金额、客户AUM等等。

2)衍生配置型标签,指在基础类和逻辑加工类的数据基础之上,通过一系列规则配置而得到的标签数据,进行组合。比如基础类标签设置性别男,加工后的标签年龄大于18小于24。通过数据组合配置新的标签如在校大学生(数据纬度不够只是简单列举)。这类数据大多跟业务紧密相关,并且有业务人员随时随地深入参与,例如根据客户AUM值进行分段来标识客户潜力资产等级。

3、挖掘类:数据挖掘、文本挖掘

1)数据挖掘型标签主要通过运用和创新数据挖掘分类、聚类、关联 、k-means、深度神经网络技术等,基于客户信息进行细分、挖掘深层次的属性信息,辅助产品推荐、预测客户提升和流失行为等分析类工作,并形成结果标签,例如客户资产偏好,销售名单等等。

2)文本挖掘型标签是非结构型的文本探索,主要针对客户的地址、消费交易文本附言等文本型信息进行探索和归纳,包括适用中文分词 、词频统计、情绪判断、说话方式、语音语调等等来生产相关的定性标签,例如高端酒店人群、艺术品爱好者等等

1.3  标签类目体系是什么?

定义:标签能够更好地理解,更好的去选择、更好的使用的资产组织方式。 

标签类目体系可比拟成树,首先它是有根的,根上面会生长多个枝干,枝干上面再去形成相应的叶子和花,这个树状的结构就是标签类目体系。树是需要有能量的,是有养分的,它的能量和养分来源于业务人员源源不断的去使用它,用进废退,一些标签用的非常的多,业务价值很高,这个时候树上面会生长出更多的标签给予提供更多的养分,如果标签是一种冷门标签,很少使用,这种标签可能会渐渐的被淘汰,树木也会随之凋零。

数澜科技

叶:动态标签(某个个体的标签值经常发生变化:交易金额)叶/花

花:静态标签(某个个体的标签值不太发生变化:性别)

叶-花之间有联系:从上帝视角静态

标签取值影响了动态标签的取值,但从数据视角,动态标签的取值推测出了静态标签的取值。

为什么做标签?

2.1 企业的数据价值?

回到数据本身,企业三大核心问题:数据在哪?数据如何有价值的被使用?数据有什么价值?

其中数据有什么价值是企业最关注的,也是进行数据资产建设的核心目标,在挖掘数据资产价值过程中可以采取三个步骤。

1)让企业的数据能有效运算得到结果

2)让业务使用数据产生价值,缩短两者之间的“距离”。通常情况下,业务人员不太理解数据,会更理解业务场景,对于数据会有断层的理解,并不知道数据在哪,如何加工,这时候数据与业务是脱离的,需要通过认知理解、处理速度、灵活性去缩短距离,这样数据能够源源不断产生价值,并为业务所使用。

3)数据操作系统,实现前后端自动串联。

是基于前两个步骤,能够自动运算,不断服务业务应用情况下的最优结果。想想看有一天业务说:我要“公司全体会员在消费力上的等级分布,以饼图呈现”->系统自动选择计算引擎,运行消费力标签计算、入库、选中,并配置分析服务和图表可视化组件,最终产出饼图。可以理解成不需要数据和技术人员,通过数据操作系统生成业务链路,数据价值就能够充分发挥。

2.2 数据资产的价值?

即数据资本化:可交易,有回报

数据资本化的前提是数据商品化

数据商品化:商品的基本属性是价值和使用价值=>标签

2.3 标签的价值?

将数据资产变得可阅读、易理解、好使用、有价值,最终目标是通过有序的正向循环不断挖掘提升数据资产的价值,使之变成企业的核心增值资产。

2.4 标签使用场景?

1)客户画像:更多应用在银行、零售、电商,以可视化呈现的方式,通过类似于微观画像,客户画像页面展示,将个人身上标签、属性展示出来,这个就是标签画像、客户画像的一种方式。

2)分析场景:群体分析:业务人员主要使用,来决定使用筛选哪些字段作为主要的营销,或者是辅助分析广告投放

3)圈选场景:基于衍生配置型标签,进行人群圈选,进行下游业务投放,比如发邮件、发短信或者公众号推送。比如直播课程,前期通过人群标签的圈选推荐感兴趣的课程

什么时候标签化?

3.1 操作数据的目的

1、业务发展构建用户画像进行下一步精准营销:企业营销缺乏买家精准画像、业务繁杂日益加剧,企业缺乏健壮的数据支撑体系,营销成本入不敷出。企业会考虑做千人千面个性化推荐系统,减少人工。通过点击的次数、收藏的偏好、物品类型加购物车的次数大标签。

2、构建数据资产,满足资产全链路管理:

企业数据资产管理需求极为迫切,需要在企业高层进行资产目录展示,需要借助标签体系对数据资产进行完整规划。将数据资产变得可阅读、易理解、好使用、有价值,最终目标是通过有序的正向循环不断挖掘提升数据资产的价值,使之变成企业的核心增值资产。 

3、支撑未来所有业务场景对数据的快速享用:

现有统一商品展现模式单一、无法快速适应且支撑持续增长的业务需求,通过人、物、场景标签体系规划,了解人与物的关系和交易情况,偏好推荐、物和场景之间的关联关系,反推出物和人的关系进行精准投放。

数澜科技

在哪里做标签类目体系建设?

4.1 标签所属层级

标签属于应用层,向下是数据层,要了解产生标签的数据来源,明确标签的价值和意义。向上是服务应用层,更多的是服务客户中心,营销中心、管理中心,分析中心等等应用,可产生它相应的业务价值。

数澜科技


4.2 先做标签设计or先做标签体系?

建议:先做体系规划,再从体系枝干上长出合适的叶子和标签,能最大限度避免标签设计的重复劳动、无用功,把个体观察升级为群体观察,找到统一的数据描述办法。否则永远在讨论现象,而非本质。从数据本质出发,推过演绎就能推出各种数据资产、及资产使用方式。

谁来做标签类目体系建设?

5.1 前提和保障

领导层:战略和组织保障

管理层:和领导层有效沟通指示战术保障,以数据为管理判断的重要依据

执行层:数据分析、数据应用、数据化运营等数据场景

5.2 标签设计师

定位是懂一定技术的业务分析师,需要6种能力

需求管理:统一管理企业内新需求、需求分析、现状分析,是否新增

业务沉淀:在业务扩张中不断沉淀标签体系、形成企业资产,更加有利于进行新的需求开发

大胆想象:持续的好奇心,踏实肯干

仔细求证:数通观全局,多方求证,验证数据可行性

文档详尽:文档做到准确、详尽、反映第一手业务需求,开发同学不会不用,也不敢不用

资产运营:标签市场、AI市场、服务市场、计量计费和应用管理

数澜科技


如何搭建标签类目体系建设?

6.0  标签体系设计完整路径

标签体系设计完整路径:从业务中来,到业务中去!

一定要有数据支撑,业务需求会直接或间接产生数据,来源于业务流程。如想要圈选人群,人群是来自信用卡注册并且状态未激活状态场景下形成标签。

那么数据如何实现场景的业务需求?按照规定维度组织数据,按照人、物或者业务划分,圈选数据,形成可加工的关系、物、人的标签,形成了包含技术标签、加工标签两类的后台标签类目体系、以及服务真实业务需求的前台业务标签。

在这个过程中,后台标签类目体系不能直接复用,标签类目体系会通过衍生标签加工多个标签,变成前台可使用的新的标签,所以通过分析,业务需求来源于数据,数据又源源不断的产生,最终服务于业务,从业务中来到业务中去。

6.1  充分调研

客户是谁?——细到什么类型公司什么部门什么岗位

业务痛点是什么?——包含哪些业务,痛点有多痛,什么原因导致

有什么数据?——不要假设,要实际,再小的人数据也有发挥价值

6.2  需求梳理

横向梳理商业价值之间的关系,调研业务痛点——调研梳理客户数据——根据业务诉求、可用数据设计标签——梳理标签类目体系

6.3 定义资产

客户原始提供的数据字段叫【数据】

提供给业务使用的指标特征叫【标签】,如果客户原始提供的数据字段也是业务上需要的,也定义为【标签】。因此数据和标签不是物理上的区分,而是逻辑上的区分。

比如从业务方角度看:标签定义为交易信息、基本信息、沟通信息、浏览信息

从数澜角度看:兴趣爱好、社交网络、基本信息、行为习惯叫做标签。

6.4  识别三类对象(根目录)

世界上所有事物都可以归类于三种对象:人、物、关系

人的定义:能发出主动行为的主体,包括自然人或法人,及群体

物的定义:行为中被动作用的客体,如物品物体——桌子、车床

关系定义:某时某刻人物发生的某种行为关系,例如浏览、推荐、购买、分析都是关系

将公司、业务中所包含的所有对象用数据表达识别,将之归类到三种对象池中


数澜科技


6.5  打通同一对象数据(根目录)

每一个对象可能有多种关系,比如人是生产者也是消费者,存在同一个对象在多处留存了以不同ID组织的信息记录,因此我们需要进行多种ID间的同一对象识别打通。例如同一个人的淘宝上留存了以淘宝ID为组织的电商购物类数据;在微信上留存了以微信ID为组织的通讯交友类数据,如果通过ID-Mapping技术就可以打通电商类和交易类数据,对人的刻画也会更全面客观.

技术上可以实现【淘宝ID-手机号】和【微信ID-手机号】这两个关系建立连接,通过手机号发现给不同位置买过东西,不同位置的收件人和主体者会有关系关联,把这群人作为家庭出现,可以将关系不断扩大,精准定位。核心问题是有多少类的数据,能拿到多少类的数据,对于得到的这些数据里面唯一识别的ID,把所有属性打到同一个对象上,就能够实现打通同一对象数据。


数澜科技


ID mapping的具体技术实现,会以一个中心ID作为唯一ID,并存在不同关系对进行概率计算,通过算法的计算ID分成四个类别。第一类别是强身份ID的属性,身份证号,护照编号,驾驶证编号,人脸ID,指纹ID,红包ID等等能唯一识别精确到你这个人的ID;第二类别多为设备,一个人可能有多个手机号,多个Mac地址,邮箱地址,通过这个也能精确找到,但这是一对多的关系;第三个类别,注册的账号,比如说支付宝账号、淘宝账号、微信账号、医保账号、游戏账号等等,这里面也是一对多的关系;第四类别的ID可能是临时记录的,包括cookie ID IP地址,在上网产生一些浏览记录的时候,经过每一个基站的IP地址也会重新来切换的。包括操作行为,都会产生相应的一些记录,第四类的数据大都在运营商那里,难以接触到。在有些能拿到数据的地方,通过这些ID属性能够定位到人,将同一对象的数据进行打通。

6.6  数据化的事物表达

确认好对象且汇总该对象所有相关数据后,可以系统性的向下梳理这个对象上的属性,属性下会有各种属性值,属性具有一定的通用性,而属性值则体现了个体差异。

比如「不爱读书的我今天在微信上花了半小时读了一篇很有意思的科技文章」,一段文字可以拆解出具体的人、属性、属性值、物、属性、属性值、关系、属性、属性值。

数据化的事物表达的重要意义是:

1. 是构建数据类目体系、标签类目体系的基础;

2. 转变数据思维,学会用数据语言表达转化业务痛点、问题、需求;

3. 数据化的拆解,要拆解到可阅读易理解,否则无法维护、管理、复用,变成资产;

4. 不仅仅解决当前问题,也要供将来的业务触发使用的灵感、创新新场景;

归到人、物、场景的标签都是可复用的,不只是为某一个场景服务,在标签组合后还可组合应用到新的场景中,在进行数据化的表达后能够提供新的价值创造。

6.7  构建数据类目体系

1、数据类目体系介绍:

当我们完成对一切事物的数据抽象后,会发现数据种类非常多,我们需要采用数据类目体系方法,来体系化的对已有数据进行梳理(对象、属性、属性值)。

比如说人的属性,按照“人”的组织方式进行组织,统一汇总记录;把所有的“物”组织的数据,按照统一总体的汇总记录放到物这个类目下;把流程下面的各个流程的记录,汇总到流程下面的组织下面。第一步将数据类目体系进行大的划分。

“数据类目体系“中的“数据”特指企业客户当前、原始存在的数据,是一个窄义范围内的定义,它指向业务流程中的采集数据,但和标签类目体系是两个概念。数据类目体系解答的是数据怎么来方面的问题,流程也可以认为是关系的一种,是企业生产管理中常见的数据组织方式,是用来划分原始数据有哪些,进行编目的过程。

2、构建数据类目体系的方式:

数据类目体系反映了构建者对企业原生数据的理解,需要是稳定的,不应经常发生变化。

比如下图这个交易流程、库存流程可能是对于A员工,但是明天有可能流程有可能他不再是对于A员工,可能是消费者,流程也可能是经过下一个组织者,形式经常改变。那这种数据的划分的类目体系,它是不太稳定的,经常变化。

 数据类目体系基本上按照数据的业务归属、处理、存储等流程类信息来组织、同时考虑从流程中抽象出人/物的行为类数据。

数澜科技

例如图中类别分成交易(流程)、商品(物),进一步拆分,交易分成零售的交易,批发的交易以及标签值(交易人、交易物、交易记录),商品进一步拆分为基本属性、服装属性等。

数据类目体系反映了构建者对企业原生数据的理解,现实的数据库、数据表、数据字段情况是什么样的,是怎么组织的,就怎么记录,不需要过分发散。 

6.8  构建标签类类目体系

1、标签类目体系建设须知:

首先根据数据的情况和业务的需求进行标签设计,前期要划分标签的属性,对于标签进行分类管理,更偏向于架构设计和标签分类。

 当某类对象下的标签越来越多的时候,就迫切需要通过类目体系的方法来组织、管理、规划标签,让用户可以根据【可理解的分类方式】快速查找数据、标签。最典型的例子就是仓储索引,会根据地区划分精确到数据的准确位置。

 2、和数据类目体系一样,标签类目体系也是基于“对象”建模,对象分为“人”、“物”这两大类实体对象和“关系”这一大类关系对象。对象上的标签可分为【固有标签】、【动态标签】,这两大类标签是辩证统一可以闭环的(例如人的性格:固有?动态?)。

数澜科技


3、构建标签类目体系的规则:

1)标签类目体系首先需要先确定根目录,根目录就是对象,因此有三大类根目录:人、物、关系,根目录就像树根确定树种一样直接确定这是一个什么对象的标签类目体系

 2)类目体系本身指的是对某一类item的分类、架构组织方法:将item分入合适的叶子类目中,具体item都是叶子节点。类目体系的本质是为了系统化的规划、管理、使用。

 3)类目体系为树状结构:

l 根目录即为对象,分为:人、物、关系

l 类目结构一般不超过三级

l 没有上一级类目的叫一级类目

l 有下一级类目的类目是下一级类目的父类目

l 有上一级类目的类目是上一级类目的子类目

l 没有下一级类目的类目叫叶子类目

l 叶子类目下挂有叶子节点,即标签

4、标签类目体系的设计思考:标签设计思路中,首先要考虑的是从哪些角度、层面来设计标签,因此需要提前引入标签类目体系的概念。可以说标签类目体系是从架构上开始思考设计标签的大分类大分级,从上而下、从粗到细的设计标签。

 5、数据类目体系和标签类目体系的关系和区别?

数据类目体系:建议按照数据采集、存储、管理等信息系统原有的业务体系去进行划分,这样可以帮助数据开发者最快捷的去合适的类目下找到所需数据,因为数据开发者或数据库管理员最容易理解查找数据的方式是按照数据产生存储等技术方式组织的。

标签类目体系:建议按照数据理解、使用、价值等数据应用的角度去进行划分,因为标签类目体系是供业务方、产品经理等数据使用者去理解、查找、探索业务上所需指标,体现数据价值,要以业务人员、产品经理等非技术人员能理解的业务角度去组织数据。

因此没有完全严格、统一的类目体系结构来满足所有客户业务场景的需求,不变的原则是需要按照客户真实业务需求来构建类目结构。

6.9  构建「人」标签类目体系

1、一级类目设计思路:基本属性,行为关系,兴趣习惯,性格和思想,不断的去往深层次去挖掘,如消费者标签类目体系——基础属性——基本特征——人口统计

2、细分思路:

当我们按照从静态基础到动态行为到习惯偏好再到性格思维的思考方式把一级类目确定好后,可以采用以下几种细分思路,将二级、三级类目扩展出来,会考验标签设计者对业务的理解能力和归纳能力。

6.10 构建「物」标签类目体系

物的标签类目体系一级类目设计思路:价值评估、被动行为、主从属性、功能效用、基本属性等。

6.11 构建「关系」标签类目体系

关系的标签类目体系一级类目设计思路:关系结果、关系内容、关系准备、时空环境、关系人+关系物等

人-物-关系标签类目体系:包括流程转化而来的稳定关系+数据应用场景的动态关系(需要根据场景设定梳理)关系里的人/物是这个关系的主动人和被动物,属于关系的属性描述,是类目;后台标签类目体系中直接展开的人/物则包含了全局的人/物属性标签,是根目录。

项目应用案例

某股份制银行:客户洞察项目

通过智能营销体系构建,完成手工名单营销-自动化客群营销-实时个性化营销三个阶段的迭代优化。首先第一个阶段是手工名单营销,制定近百个数据标签,需要一周以上手工使用标签筛选,2010-2015年,营销活动数量增长13倍。

第二个阶段,自动化客群营销。通过智能化的手段实现自动化的客群营销并形成营销模型,使用专家规则或者营销模型进行全渠道的协同,可通过系统自动化去实现销活动,通过系统实现自动发起执行相应的记录,实现准实时分析。数据标签增长至1000+,涵盖多种客户行为数据,营销活动数量增长近两倍,全行营销成功率平均达到24%。

第三个阶段,实时个性化营销分析。在二阶段的基础上增加了大量客户标签,近2000+,主动营销和被动营销同时存在,逐步引入了人工智能技术,实现智能的个性化营销。并引入事件式营销全渠道协同,事件类营销成功率为传统营销成功率的5-10倍

数澜科技=

上一篇:数澜科技甘云锋:解码数据中台,打造数据价值与能力共享中心

下一篇:直播回顾|深度解析DCMM数据管理成熟度模型

返回列表

从这里开始 让数据用起来
联系我们