关注点:如何由基础数据获得更多信息?
根据前面的讨论,数据不能直接应用于实践的另外一个原因是缺少一些二级信息变量。数据融合的一个重要作用就是,依据原始数据进行更深入的挖掘,从而衍生出新的变量,包括客户关系网络的推测,例如家庭成员关系、同事关系、客户群体的划分,客户用卡喜好的把握等。以客户用卡喜好的挖掘为例来说明数据融合的过程,例如,如果客户经常购买机票、异地酒店住宿、异地商户消费,则说明该客户经常出差;如果客户消费领域集中在饭店或其他娱乐场所,则认为该客户属于社交人士等。
实施目标:分析基础数据,发现深层信息
√ 寻找客户之间关系,建立客户网络
√ 考察客户消费行为,了解客户喜好
√ 分析客户还款情况,识别风险特征
√ 从与客户之间互动,衡量客户关系
客户网络建立
在数据工程中,我们经常通过不同客户之间的数据匹配形成客户关系网络。主要包括如下几种客户关系网络:
家庭关系网络
对于已有的客户进行家庭关系网络的建立,通常可以通过同一家庭成员可能共有的信息进行判断,例如,相同的信用卡消费账户、相同的家庭住址、家庭电话等。在家庭住址和家庭电话标准化的基础上,寻找具有相同家庭住址或家庭电话的客户组合的准确度也大大提高了。
当然,这也不排除两个客户合租同一套公寓的可能性。在初步判断的基础上,可以通过客户所填写的直系亲属的联系信息来判断,这些联系人是否已经包含在我们初步判断的客户网络中,如果是则可以完全判定两者确属亲属关系。另外,如果联系人系统中的联络方式【家庭地址、家庭电话】与客户不同,但是在现有客户中又能找到该联系人的信息,则将两者的关系补充进来。对于那些尚无依据明确判断是否确属亲属关系的客户网络,暂时认定为同一家庭成员。
总之,寻找家庭成员的过程可以分为两步:第一,列出共有信息,确认客户间的关系网络;第二,根据客户的基本资料,年龄、性别、地址等信息,确定客户之间是什么样的关系。
同事关系网络
同事关系网络则是通过客户所填写的公司信息进行判断的,包括公司电话、公司名称以及公司地址。在对公司名称标准化的过程中,利用公司名称和公司电话进行循环查找,已经对相同公司客户给予同一公司编码,这将作为确立同事关系网络的基础。在此基础上,判断客户所填写的公司地址完全相同,则也认为是来自同一公司的客户,作为同事关系网络的补充。另外一个信息来源与家庭成员关系判断比较相似,可以通过非直系亲属的信息,如果说明关系为“同事”,并且该联系人也属本行客户,则将其关系补充到现有的同事关系网络中。
其他关系网络
除了上述最重要并且通过原始数据库比较容易判断的关系网络以外,还有其他客户关系网络的存在,例如朋友关系网络和邻里关系网络。在现有的数据库中,能够确立朋友关系网络的字段比较少,主要还是通过非直系亲属的信息进行判断。同时,也可??有一些同住在一起的朋友关系网络,在用家庭电话和地址匹配的过程中被划分到家庭关系网络中了。邻里关系网络的判断则主要是通过在客户的家庭住址信息中提取小区/住宅楼/大厦的信息,并利用这些信息进行客户之间的匹配,认为居住在同一城市、同一小区/住宅楼/大厦的客户为邻居,以此建立邻里关系网络。
建立客户间关系网络的好处在于:一方面可以作为客户群体划分的依据,可以考察该群体的行为特征。例如,通过同一小区客户的总体消费情况来确定该小区的客户平均财力情况,为客户找客户等销售方式提供契机。另一方面,客户关系网络的建立也可以对市场活动给予指导。例如,在某次市场活动中仅选取了某个公司一部分客户赠送礼品,而未通知到来自同一个公司的另外一部分客户,势必将会引起客户的不满和投诉,严重影响银行与客户之间的关系。
客户喜好了解
具体来说,客户的消费习惯可以用四个“W”【What,Which,Where,When】和一个“H”【How Much】的交易记录来表示。即客户喜欢什么样的产品?他们喜欢在哪里买产品?他们喜欢在哪家商户购买产品?他们喜欢购买什么样的产品?以及他们能够承担什么样的价格?因此,数据融合的第二部分就是研究怎样才能挖掘出客户这些动态数据信息。
也许很多人会说,了解客户行为特征、需要和喜好未必一定要从动态数据中获得,通过调查问卷来设置相关的题目不是也可以达到同样的效果吗?那么,我们就以下面几个希望调查的问题进行一下讨论。
·您认为自己在花钱方面是一个非常“慷慨大方”的人吗?
·您认为自己是一个对价格比较敏感的人吗?
·您觉得您的生活水平算得上“奢华”吗?
对于第一个问题,绝大多数人都认为自己是比较慷慨大方的,因为他们至少不觉得自己很小气,至于慷慨大方的真正概念和程度,他们则很难说得清楚。那么,我们想问,当您在一家饭店就餐的过程中,您得知这家饭店需要收取10%的服务费,您会觉得这种收费是合理的,因而欣然接受呢?还是会觉得这是一笔不应该支付的费用而不再光临这家饭店呢?当您出国旅游时,付小费已经成为被绝大多数人,甚至整个社会所接受的一种行为,您是否也有付小费的习惯呢?
对于第二个问题,您可能毫不犹豫地回答:“当然不是,我从来不购买换季打折的衣服,总是愿意支付更多的钱来购买当季的新品。”那么,我们又要问了,您是否在其他产品的购买方面也同样不计较价格?您是否曾在超市里使用过优惠券?您是否也会购买优惠装的食品和日用品呢?
对于最后一个问题,也许并不是每个人都会回答“是”,因为大多数人的经济收入不允许。但是,是否在经济条件允许的情况下,绝大多数人都会过着“奢华”的生活呢?难道每个月一份数额不小的信用卡对账单就说明您是一个生活奢华的人吗?那么,我们想问,对账单上这么大的数额都是您出入高档场所消费产生的,还是仅仅因为您日常开销过多、应酬过多,或者是因为您不善理财而导致的呢?
对于这些最常见、最基本的问题,客户自己都不能给出客观、准确的答案,银行又如何能够借助由一个个不同标准的回答所构成的调查问卷来找到其中的答案呢?
除上述问题之外,通过调查问卷来考察客户行为特征和生活方式等信息还存在着很多缺点。首先,调查问卷中需要设置关于客户购买了什么商品、哪一类商品、在什么地方购买商品、消费多少钱等问题,这样几个What、Which、Where、When、How Much问题非常直截了当。但是,客户是否真的能将每一次的购买经历都记得这么清楚呢?大多数人都仅能对目前的购买行为给出清晰的描述,使得银行无法追踪到以往的信息。同时,调查问卷也是一个非常耗时、费力的过程,待信息获取并分析完毕之后,可能已经错过了最佳的市场时机。另外,调查问卷只能在有限数目的客户中开展。所以,必须考虑到样本的大小是否具有统计意义,如果样本较小则结果不一定会准确。
客户之所以无法回答这些问题,是因为客户不会因自己是某类人而做某件事情,也不会在做完事情之后去总结自己是哪类人。他们做大多数事情的初衷也许都很简单,因为喜欢这件东西,因为正好缺少这样东西,因为觉得可以这样做等。这些行为的发出,有时都是很随意的,随心情的,甚至是无意识的。客户自然不会清楚地记得每一次购买过程中的What、Which、Where、When、How Much。其实,这些看似无意识的行为往往与有意识的因素相关,例如性格、奢华倾向、经济条件、时尚抑或保守的生活方式等。客户只要依据自己的需求和喜好做就行,他们不必思考这些行动背后的动因。但是,银行却需要比其他竞争对手更了解客户,比客户更了解客户,了解他们的购买方式、购买喜好、消费能力、行为特征等,不论给银行带来收益多少的客户,对他们多了解一些,银行就会多一些机会,最终产生更多、更有效的商业行为。
银行从哪里可以真正获得准确的、连续的客户行为信息呢?随着信用卡在客户经济中扮演越来越重要的角色,获取客户特征也就变得更加现实了。每一张信用卡消费单据中都包含着由四个“W”和一个“H”的交易记录。一个典型的交易记录如下图6.1,它显示了一笔交易中的各种类型的信息。
即使我们知道在哪里能够找到客户相关的购买信息,但是这些信息究竟能够为我们做些什么呢?交易数据,或者说消费单据,可以直接告诉我们每笔交易的What、Which、Where、When、How Much。但是,客户行为特征却需要通过对一段时间内的所有交易的What、Which、Where、When、How Much信息进行分析才能获得。通过交易数据可以回答一系列关于客户消费行为的问题,例如:
·客户的生活方式是否奢华?
·客户是否有支付小费的习惯?
·客户是否对价格变动很敏感?
·客户是否经常出外旅游?
·客户是否有赌博的喜好?
·客户是否有过或正在进行分期付款?
·客户是否对时尚很敏感?
·客户一般会寻找哪些娱乐活动?
·客户通常什么时候出行?
·客户比较喜欢什么类型的食物?
·客户是否参加什么社团或俱乐部?
·客户是否很注重身体健康?
·客户是否正处在怀孕期间?
·客户有何种喜好?
·客户是否喜欢电子类产品?
基于银行所拥有的客户交易数据库,并通过数据的整理和分析回答上述种种问题,可以帮助银行的市场人员从客户的行为中发现客户想要什么,需要什么。那些可以终身与银行建立关系的客户,就是因为非常满意银行为他们带来的服务。客户的口味总是各不相同,有些客户认为免费的往返票或者酒店服务对其更适用,而另一些客户则可能觉得九折的保险存单更具吸引力。因此,从客户交易数据中提取客户行为特征信息,使银行制定更具远见、更合理的市场决策和行动成为可能。
作为一个额外的商业机会,银行可以提供通用的客户细节行为信息给那些同样希望可以更好地理解客户的商户。品牌的价值以及客户给予银行的信任,是拓展这一业务模式的最大优势。银行可以将自己塑造成一个客户和商户之间可以信赖的中介,并且从双方获得利润。银行可以成为他们客户的唯一市场代理,也可以通过为商户经营其他的市场分配渠道而形成一种联盟。同时,它可以通过提供客户的数据库,帮助商户制定更加准确的目标,以形成更加细分的市场。
到目前为止,我们一直在讨论银行可以在哪里获得关于客户更加详细的信息,这些信息将如何使银行获利。然而,我们还没有真正讨论具体的实施过程是怎样的。每家银行都可以产生千兆的客户信用卡交易数据,但是如何才能将这些信息组装并用于理解客户的综合形象?这个比较简单。整个过程从数据精练开始,在标准化和纠正的数据基础上,对客户的行为信息提取和分析,了解各种客户行为信号,总结出客户的购买喜好和消费行为特征,最后通过行为评分对客户的行为特征进行总体的评估。
尽管每一笔交易数据都可以从信用卡业务的交易系统中获得,但是由于一笔交易数据到达交易系统之前要经过多个组织、多个系统,因此其中涉及不同组织的数据规范不统一,数据格式自由化,不同系统之间数据传递所产生的问题等。数据精练的目的就是,将这些有问题的交易数据进行纠正,将自由格式的数据进行标准化,并且将数据划分成不同的类别。最重要的是,从精练过的数据中更准确地获得与客户交易相关的What,Which,Where,When和How Much的答案。
产品
在交易系统中,对于客户消费的产品类型的理解,主要来源于商户分类代码【MCC】。
商户分类代码
为了将商户分成不同的商业类别,我们需要商户分类代码系统的帮助。一般这一系统都是由银行卡组织提供的,在美国是由Visa和Master公司开发并提供??,而在国内则主要是由银联开发并提供的。在商户分类代码系统中,有超过3000种商户分类,包括某些制定的商户类别。
虽然目前银联已经提供了针对中国内地区域的商户分类代码系统,但是该系统仍然存在一定的问题,主要是商户分类代码的准确度不高,某些类别存在较大误差,难以帮助我们很好地了解商户的经营范畴。另外,由于分析角度和用途的不同,目前的商户分类规则不能完全满足我们的分析需求。
鉴于此,在对商户分类数据进行精练的过程中,我们需要在商户业务范围的基础上,结合持卡人行为与持卡事件,重新制定一套商户分类规则。在新的商户分类规则中,商户分为10个一级大类,46个二级类别,69个三级小类。限于篇幅,在此仅简略说明一级大类的总体范围,如下:
0 金融及特殊商户:主要包括银行系统及金融机构等。
1 衣:主要包括服装行业的商户。
2 食:主要包括饮食行业的商户。
3 住:主要包括酒店类商户。
4 行:主要包括交通运输行业的商户。
5 娱乐:主要包括娱乐性质的商户。
6 用:主要包括部分零售行业的商户。
7 服务:主要包括部分服务行业的商户。
8 房地产:主要包括房地产行业的商户。
9 非营利:主要包括慈善、教育及政府等非营利机构。
基于上述新的商户分类标准,通过如下几个步骤对现有的商户进行重新分类。
·尽管现有的MCC分类准确度不高,但仍然有一定的使用价值。在整体分类之初,首先从商户的MCC码出发,映射到新的类别,并以此为商户的初始类别。
·根据新的商户分类标准,并通过对现有商户名称信息的归纳,总结出能够明确区分各类商户的全局关键字库和局部关键字库以及相应的搜索规则,对全部商户名称进行全局关键字搜索,如果匹配成功,则将初始类别调整为关键字对应的类别;如果匹配不成功,则沿用初始类别。然后,依据局部关键字及相应的搜索规则,对一定范围内的部分商户名进行局部关键字搜索,若匹配成功,则调整为关键字对应的类别;若匹配不成功,则依旧沿用原有类别。