用户画像TGI指标

标签: 数据 术→技巧 指标 用户画像 | 发表时间:2021-10-26 08:22 | 作者:钱魏Way
出处:https://www.biaodianfu.com

什么是TGI

对于TGI指数,百科是这样解释的——TGI指数,全称Target Group Index,可以反映目标群体在特定研究范围内强势或者弱势。

TGI指数计算公式 = 目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例 * 标准数100

举个例子,假设一家外语学校里面有家烧烤店,每天晚上男生和女生顾客都是50%,你觉得男生还是女生更倾向于光顾这个烧烤店呢?既然男女既然都一半,那显然是说男女同等倾向于光顾这家店。如果你是这么想的,那就错了。因为还有一个隐含的概率你没有问,就是这个学校里男生和女生的比例是多少呢。我们通过调查了解到男生和女生的比例分别是20%和80%。有了这个比例,我们就可以算TGI了。

  • 烧烤店男生TGI=50%/20%*100=250
  • 烧烤店女生TGI=50%/80%*100=60

你看,虽然光顾的顾客中男女比例一样。但是我们算TGI的话,会发现男生的TGI远远大于女生的TGI,从这个意义上讲,男生光顾这家门店的倾向性远大于女生。

TGI的使用

我们为什么要看TGI?TGI可以帮我们找准目标顾客。像上面烧烤店的案例,通过计算TGI,我们很明显得知道男性顾客才是最喜欢我们门店的顾客,而女性用户并不喜欢我们这家店,这是最基本的现状。那基于这个现状,你接下来要做的到底是巩固喜欢这个门店的男性顾客群,还是开拓并不太喜欢这个门店的女性顾客群?这就是价值观问题了。找准了目标顾客之后,我们就可以针对目标顾客做更多的宣传推广。如果目标顾客是不清晰的话,那我们做宣传可能会漫无目的,结果就是吃力不讨好。

TGI指数表明不同特征用户关注的差异情况:

  • TGI指数 = 100 表示平均水平,
  • TGI指数 > 100,代表该类特征对目标群体的影响要大于平均水平,或者该类群体对某类问题的关注程度高于平均水平
  • TGI指数 < 100,代表该类特征对目标群体的影响要小于平均水平,或者该类群体对某类问题的关注程度低于平均水平

如何理解目标人群和基准人群?

目标人群是我们选择用来进行下钻数据分析的人群,画像数据都是基于此人群进行分析。百分比和TGI均指的是目标人群的某标签值的百分比和TGI。基准人群是应用于TGI指数计算的对比人群,默认的大盘人群的全量人群。

典型特征中的特征人群是如何定义的?

采用有层级结构的树形图。越上层的维度越显著区分人群。示例:

TGI实战

需求:公司要推出一款客单比较高的产品,打算在一些城市打样,需要确定哪些城市适合打样。

数据集:客户购买商品的订单数据,具体包括买家ID、省份、城市、下单日期、购买数量、实付金额,一共28832条数据。

import pandas as pd

df = pd.read_excel('tgi-dataset.xlsx')
df.head()

数据初步处理:计算每个用户的客单价

df_price = df[['城市', '买家ID', '实付金额', '购买数量']].groupby(['城市', '买家ID']).agg('sum').reset_index()
df_price['客单价'] = df_price['实付金额']/df_price['购买数量']
df_price.head()

方案一:按照城市的平均客单价排序,取平均客单价最高的城市进行打样

df_price_city = df_price[['城市','客单价','买家ID']].groupby(['城市']).agg({'客单价':'mean', '买家ID':'count'}).reset_index().rename(columns={'买家ID':'买家数量'})
df_price_city.sort_values('客单价',ascending=False).head()

客单价高的买家数量较少,需要再将买家数量较少的城市过滤:

df_price_city.loc[df_price_city['买家数量'] > df_price_city['买家数量'].mean(),:].head()

方案二:统计每个城市大于一定阈值的会员量,取会员量最高的城市

先查看下客单价分布:

df_price['客单价'].hist(bins=16)

假设阈值为50,则:

threshold = 50
df_price_high = df_price[df_price['客单价']>=threshold][['城市','买家ID']].groupby(['城市']).agg('count').reset_index().reset_index().rename(columns={'买家ID':'买家数量'})
df_price_high.sort_values('买家数量',ascending=False).head()

方案三:引入tgi,根据tgi的高低选择打样城市

判断是否为高客单价买家:

df_price['高客单'] = df_price['客单价'].apply(lambda x: 1 if x >=threshold else 0 )
df_price['低客单'] = df_price['客单价'].apply(lambda x: 1 if x < threshold else 0 )
df_price.head()

对数据进行汇总处理:

df_summary = df_price[['城市','高客单','低客单']].groupby(['城市']).agg('sum').reset_index()
df_summary['总人数'] = df_summary['高客单'] + df_summary['低客单']
df_summary['高客单占比'] = df_summary['高客单'] / df_summary['总人数'] 
df_summary.head()

计算总体高客单人数占比:

total_percentage = df_summary['高客单'].sum() / df_summary['总人数'].sum()
total_percentage

计算每个城市高客单TGI指数:

df_summary['高客单TGI指数'] = df_summary['高客单占比'] / total_percentage * 100
df_summary = df_summary.sort_values('高客单TGI指数',ascending = False)
df_summary.head()

筛选出人数大于平均值的人数,再计算更合理的TGI指数:

df_summary.loc[df_summary['总人数'] > df_summary['总人数'].mean(),:].head()

相关 [用户 画像 tgi] 推荐:

用户画像TGI指标

- - 标点符
对于TGI指数,百科是这样解释的——TGI指数,全称Target Group Index,可以反映目标群体在特定研究范围内强势或者弱势. TGI指数计算公式 = 目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例 * 标准数100. 举个例子,假设一家外语学校里面有家烧烤店,每天晚上男生和女生顾客都是50%,你觉得男生还是女生更倾向于光顾这个烧烤店呢.

细说 用户画像

- - 神刀安全网
对于互联网从业者,经常会提到一个词——用户画像. 作为一名刚主要做用户画像DMP的数据PM,工作中总是会被需求方问到——. 我要查看XXX的用户画像 或是 能否能够XXXX类用户的画像. 抑或是有别的产品会问到:你们是怎么做用户画像的. 然而在沟通的过程中,我发现,不同的人对用户画像的理解差异还是非常大的.

创建定性用户画像

- - 腾讯CDC
  在产品研发过程中,确定明确的目标用户至关重要. 不同类型的用户往往有不同甚至相冲突的需求,我们不可能做出一个满足所有用户的产品.   为了让团队成员在研发过程中能够抛开个人喜好,将焦点关注在目标用户的动机和行为上,Alan Cooper提出了Persona这一概念. “赢在用户”这本书将其翻译为“人物角色”,在腾讯我们习惯了使用“用户画像”这个术语.

族群歧视与用户画像

- - IT瘾-tuicool
题图是这两天的新闻人物美籍越南人 Dr. 美国朋友觉得奇怪,为什么要说他是越南人. 另一位 Asian,估计是位澳大利亚籍香港人,发了一条推特说——Dr. Dao 当时反抗的暴力其实是合法的强制执法. 第三位 Asian,相信是位中国籍大陆知友,读了这条推特很愤慨,挥键写就高赞爆款推送《比打人更可怕的是国人的落井下石》.

大数据下的用户画像

- - 人月神话的BLOG
简单点来说用户画像,即是 根据用户的静态基本属性和动态行为数据来构建一个可标签化的用户模型. 静态属性:个人基本信息(地域,年龄,性别,婚姻),家庭信息,工作信息等. 动态行为:购买行为,点击行为,浏览,评论,营销活动参与行为,退换货行为,支付行为等. 为何要进行用户画像,核心还是后续的针对性营销,当我们组织一次针对性营销的时候,首先要确定的就是营销的用户群体,那么就要从用户标签中精确定位这个群体.

用户画像从入门到挖坑

- - leejun2005的个人页面
用户画像承载了两个业务目标:一是如何准确的了解现有用户;二是如何在茫茫人海中通过广告营销获取类似画像特征的新用户. 比如在了解用户的基础上明确产品定位,“投其所好”;获取一个新用户/新订单;售前的精准营销、售中的个性化推荐匹配,以及售后的增值服务等. 1.2 用户流量的三大终极问题:认知用户. 现存客户 (Existing Customer) - 我的现存客户是怎么样,喜欢什么,什么消费习惯,哪些客户最值钱等等.

数据驱动与用户画像

- -
最近不少客户提出,希望与神策数据共同建设“用户画像”以驱动产品智能,但什么才是用户画像呢. 我们通过这篇文章,介绍我们理解的两种用户画像(User Persona 和 User Profile),以及如何构建用户画像(User Profile)的标签体系并驱动产品智能. 第一种用户画像(User Persona)是产品设计、运营人员从用户群体中抽象出来的典型用户:.

你真的懂用户画像吗?

- -
在移动互联网时代,精细化运营成为企业重要的竞争力,此时,“用户画像”的概念也应运而生. 用户画像是指,在大数据时代,我们通过对海量数字信息进行清洗、聚类、分析,从而将数据抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务. 在下文中,我们将以个推用户画像产品为例,为你详解“用户画像”的技术特点和使用价值.

浅谈用户画像的系统化

- -
|0x00 如何理解用户画像. 最近跟朋友聊天,谈起了35岁危机,我的观点是:35岁没什么大不了的,我多学点金融知识,以后转行做金融去;朋友的观点是,转行可不是说说就行,不是说你了解一个行业,就可以去工作的,你要深入理解背后的商业逻辑. 随后,举了一个例子:“什么是用户画像,用户画像如何应用. 这个问题,对于做数据研发的我来说,简直不要太简单.

基于用户画像大数据的电商防刷架构

- - 快课网
最近1~2年电商行业飞速发展,各种创业公司犹如雨后春笋大量涌现,商家通过各种活动形式的补贴来获取用户、培养用户的消费习惯. 但任何一件事情都具有两面性,高额的补贴、优惠同时了也催生了“羊毛党”. “羊毛党”的行为距离欺诈只有一步之遥,他们的存在严重破环了活动的目的,侵占了活动的资源,使得正常的用户享受不到活动的直接好处.