关注点:如何对客户进行定量评价?
建立客户评分系统有很多种方法,其中最常用的一种是通过建立数学模型进行预测。基本的思路是,根据客户历史信息建立数学模型,然后利用这个模型对客户未来的消费行为进行预测。因为所用的是实际发生的客户信息,所以得到的数学模型能最大限度地反映客户的真实情况。但是,在实际操作中所预测的结果却经常不尽如人意。造成预测失败的主要原因有:【1】市场状况千变万化,而已有的客户变量并不能囊括这些影响市场情况的因素。【2】随着客户数量的增加、客户背景的多元化,数据库中包含的变量也越来越多,这同时也为得到精确的客户评分模型提出了挑战。虽然仍然不能保证百分之百的准确性,但是企业可以通过采取以下科学方法建立评分系统,尽可能地提高预测准确性:
·了解市场活动
明确市场活动的目标以及流程,如市场活动的主推产品、产品价格、购物渠道、活动日期等。企业内部负责建立客户评分系统的一般都是IT人员或者统计人员,他们有良好的数学模型基础,但是经常缺乏对所开展的市场活动的了解。只有首先深入地了解市场活动的目标、流程,才能做到有的放矢,更好地运用相关知识建立符合实际应用的客户评分系统。
·建立模型准备
在建立模型之前,首要解决的就是如何定义因变量【Y】、自变量【X】。这一步骤看似简单,但是却经常因为建模人员与市场人员缺乏沟通而导致错误,而一旦变量没有定义清楚,后续的结果也就没有意义了。因此,在项目一开始,相关的IT人员或是统计人员就要与市场人员协同合作,相互了解对方的看法,准确定义变量。通过与市场人员共同合作,确定客户评分模型所要建立的因果关系,确定自变量和因变量以及变量定义。
此外,对于原始信息库中有单位的数据,需要通过范围转换进行数据整理,去掉信息库中的数据单位,使不同变量间可以进行运算。对于一些文字数据,还需要转化为数字形式。例如,将性别的表示形式由“男、女”的文字形式转化为“0、1”的数据形式。
最后,从数据库中抽取部分样品,用来建立模型。这些数据样品一般按照80:20的原则,分为训练型数据和确认型数据。
·建立评分模型
主要包括模型训练及模型确认两个阶段。在客户资料中抽样选择一定数量的样品后,选取一部分作为模型训练样品,另一部分作为模型确认样品,最终确立评分模型。模型训练具体的研究方法为Logistic回归分析,此方法可以通过相关软件直接计算而得,方便易行,已经为大部分企业所采用。通过带入已知的训练型数据,建立自变量和因变量的数学模型。模型确认则是将确认型数据代入得到的数学模型,检验预测的准确程度。
·营销实践预测
通过以上步骤建立的评分模型就可以应用于实践,进行客户消费行为预测了。但是在进行大规模的市场实施之前,为了保险起见,可以先进行小规模的市场测试,以免造成企业不必要的损失。如果市场测试成功,再进入市场实施阶段。
以上建立客户评分系统的流程,可以表示为图10.1。
实施目标:建立客户评分系统
√ 了解市场活动目标、流程等
√ 准确定义模型变量
√ 建立客户评分模型
√ 进行营销实践预测
下面用实际例子具体说明建立客户评分系统的流程。
假设某银行有1000名信用卡用户,银行决定近期内开展一次针对新上市白金信用卡的促销活动。为了减少营销资源的浪费,银行希望在现有的信用卡用户中找到最有可能参加此次活动的客户,有针对性地对这部分客户进行活动宣传。银行现有的信用卡用户信息库中包含客户基本信息,性别、年龄、收入;此外,上个月此银行曾做过一个类似的针对白金卡的促销活动,活动中随机选取了150位客户进行产品促销宣传,其中有部分客户对活动给予了反馈,银行将每位客户的反馈情况储???在了客户信息库中【表10.1】。在以上情况下,银行应该如何建立客户评分模型,从而寻找到目标客户呢?
了解市场活动
首先,负责建立模型的人员应该与市场人员进行交流,进一步了解此次市场活动,确认市场营销人员所需要的信息。经过沟通,确定建模人员的主要目标,通过建立评分系统,找到具有以下特征的目标客户:
·未曾反馈过上次促销活动的客户【因为上次活动与此次活动所间隔的时间很短,并且促销的是相同的产品】。
·有较大可能购买白金卡的客户。
同时满足上述两个条件的客户群则为事件营销的目标客户。在公司资源有限的情况下,只有准确地定位目标客户,才能有效地利用营销资源,同时增加成功率。与针对全部的信用卡用户相比,仅针对目标客户群可以最大限度地利用营销资源,提高整个事件营销的效率。
建模数据准备
定义变量
首先根据建立评分模型的目标确立自变量【X】和因变量【Y】所代表的意义及取值范围,具体如下:
Y:客户是否会对此次促销活动进行反馈【Y=1,反馈;Y=0,未反馈】
X1:性别【X1=1,男性;X1=0,女性】;
X2:收入【0<X2<1;X2=1,最高收入;X2=0,最低收入】;
X3:年龄【0<X3<1;X3=1,最大年龄;X3=0,最小年龄】
数据整理
首先通过范围转换将数据标准化为[0,1]区间内的数据,去掉原始数据中的单位,使不同变量间可以进行运算。比如,某客户的年龄为26岁,数据库中所记录的客户年龄范围为18~47岁,经过范围转换后,此客户标准化的年龄变量值为27.6【[年龄-最低年龄]/[最高年龄-最低年龄]=27.6】。此外,还要将“是否反馈上次促销活动”和“性别”两组数据从文字形式转变为数字形式。表10.2示范了整理后的客户数据库。
数据取样
从1000名信用卡用户中随即抽取150名客户的信息,作为建立评分模型的样品。为了有效地建立模型,还需要将选取的客户数据分为两部分:一部分作为训练型数据,另一部分作为确认型数据。训练型数据可以帮助营销人员根据客户数据建立模型,确认性数据则是判定所建立的模型是否符合实际。训练型数据和确认型数据的比例一般大约为80:20,类似于通常所说的“帕累托法则”;但是两种数据的比例也要根据具体情况具体确定,比如,当总体数据比较少时,为了保证有足够的数据建立模型,两者的比例一般为2:1。另外,两者的比例也可以在实践过程中不断地调整,直到找到最合适的比例。本研究中,由于所选取的客户样品比较少【150例】,因此按照2:1的比例进行划分,即100例作为训练型数据,50例作为确认型数据。
建立客户评分模型
建立模型框架
相同的产品对不同背景的客户吸引力是不同的,因此在不同背景的客户中会产生不同的反馈结果。如果用V表示所推荐的白金卡对客户的吸引力,V值的大小决定于X1、X2、X3的取值。通过建立X1、X2、X3与V的关系,由此可以得到客户对产品的反馈概率Y。
本案例中有三个自变量,因此可形成三种模型框架:一阶模型,即只考虑自变量的累加效应【公式10.1】;二阶模型,即除了自变量的累加效应之外,还考虑变量间的两两相乘效应【公式10.2】;三阶模型,即再计入三个变量间的相乘效应【公式10.3】。
需要注意的是,为了防止模型过于复杂,一般自变量的选取只包括客户变量及两个变量间的乘积效应,即基本变量间的线性效应和二阶效应,而不包括三阶甚至更高阶的多重效应。当然,如果计算结果表明多重效应的增加可以显著提高模型的准确性,则应选择加上多重效应项。反之,如果只包含一阶自变量,则由于模型过于简单,预测的准确性一般比较低。因此,选择公式10.2为模型框架。
产品吸引力【V】是不可以被观测的,但是客户是否购买【Y】是可以被观测的。因此,根据概率定义由产品吸引力推算出客户是否购买【公式10.4】。
模型训练过程
通常采用Logistic回归分析的方法建立“产品吸引力”与“客户变量”【年龄、收入、性别】之间的数据模型。
将训练型数据带入公式10.2,利用相关的计算机软件推算出各个参数值。具体工作原理为:首先,根据“逐步减项法”,每次减掉多项式的其中一项,根据因变量的变化确定应保留的重要项;同时,通过线性拟合确定保留项的参数值。在此例中,最后可以得到如下结果:
对照变量定义,此结果说明“性别*年龄”和“性别*收入”是客户是否反馈的两个决定性因素。
如果重新将客户性别、年龄、收入数据代入公式10.5,可以得到新的V值【V′】,代表由模型计算得到的产品对客户的吸引力。利用公式10.4,我们可以将其转化为客户反馈概率。
最后,将客户按照P由高到低的次序排列,可以得到一个新的数据表。将由模型计算所得的P值与客户对之前相似的促销活动是否进行反馈的记录相比较,可以发现P值越高,预测的准确性越高;反之,随着P值的降低,预测的准确性降低。
模型训练结果
由于P值是连续性数据,而原始数据中是否反馈是非连续性数据【0=未反馈,1=反馈】,因此可以对P值确定一个界限a,规定当P>a时,Pa=1,即客户会对促销活动进行反馈;反之则Pa=0,即客户不会反馈。即:
每个a值都会对应着一个误差率,a值越大,误差率越小,但是所测得的对活动进行反馈的客户数量会越少;a值越大,虽然可以得到较多的潜在反馈客户,但是误差率较大。在实际操作中,银行可根据可以接受的误差率来确定a值的大小。
假设此例中a值确定为0.8,模型预测结果与实际数据的比较则可表示为表10.3。
可以由以下指标评估对应a=0.8的模型的准确性:
反馈率:
若根据模型预测结果进行实际操作,则银行会选取P=1的客户作为目标客户进行宣传。由表10.3可知,P=1的客户中的反馈率为82%【=18/22】,即根据此模型结果设计营销活动的反馈率为82%。
击中率:
击中率主要是衡量模型预测的准确性,在表10.3中表示为预测结果【P值】和实际数据【C值】相同的情况,即P=C=1或P=C=0。因此,此模型的击中率为78%[=【18+60】/100]。
回报率:
之前得到用模型设计的营销活动的反馈率为82%,可以进一步计算活动的回报率,即投入产出比【ROI】。假定花在每位客户身上的宣传费用为F,每位反馈客户为企业带来的利润为B,则投入产出比为【公式10.9】可以计算确定可接受的误差率。例如,指定a值的误差率为【1-α】,
ROI=0.82×B/F【公式10.9】
对每个营销活动,应该保证ROI≥1。
Lift值:
此外,还可以通过利用模型预测选定的目标客户对活动反馈率与整体客户群的平均水平计算模型的Lift值。
Lift=P【C′=1|P′=1】/P【C′=1】【公式10.10】
如果Lift>1,则表明选定的目标客户对活动反馈率高于整体客户群的平均水平,即模型的预测准确率较高;反之,如果Lift<1,则表明选定的目标客户对活动反馈率低于整体客户群的平均水平,即模型没能起到应有的预测作用。
在本例中,模型预测的目标客户的反馈率为82%【=18/22】,而整体客户群的平均水平为36%【=36/100】,因此模型的Lift值为:
Lift=P【C′=1|P′=1】/P【C′=1】=82%/36%=2.28【公式10.11】
模型确认阶段
接下来是模型确认阶段。将确认型数据【50例】的客户资料部分【性别、年龄、收入】代入模型训练阶段得到的模型【公式10.5】,计算代表白金卡对客户的吸引力以及反馈率P,得到新的数据库。
根据a=0.8,当P>0.8时,P′=1,客户对活动进行反馈;当P≤0.8时,P′=0,客户不对活动进行反馈。模型预测结果与实际数据的比较可见表10.4。
此时,相应的模型准确性指标为:
反馈率=5/8=67.5%
击中率=【32+5】/50=74%
回报率=0.675×B/F
Lift值=67.5%/30%=2.25
以上结果都表明模型的预测准确性达到了标准。
营销实践预测
建立模型的最终目的是用来定位目标客户群,即具有以下特征的目标客户:【1】未曾反馈过上次促销活动的客户;【2】有较大反馈促销活动的客户。通过刚才的模型可以计算出每位客户的P值,然后将还未购买产品C的客户按照P值由高到低进行排序,最后根据P>0.8的规则,在未购买产品C者中选择P>0.8的客户。通过建立模型的方法,目标客户群被缩小了,但是成功率非常高,因此营销效率可以大大提高。这表明市场测试成功,可以进入市场实施阶段。
综上所述,整个客户评分模型建立的流程可以用图10.2表示:
本章小结
本章主要讨论了如何建立客户评分系统,以便为接下来的客户生命周期管理所用。建立客户评分系统主要包括以下几个???骤:了解市场活动、建模数据准备、建立评分模型、营销实践预测。其中,了解市场活动最容易为大多数模型建立人员所忽视,在实际操作过程中,应当加强营销人员与IT人员、统计人员的合作,这样才能保证建立的评分系统能反映实际情况,并为营销实践所用。