登陆注册
3424800000013

第13章 数据融合(1)

关注点:如何由基础数据获得更多信息?

根据前面的讨论,数据不能直接应用于实践的另外一个原因是缺少一些二级信息变量。数据融合的一个重要作用就是,依据原始数据进行更深入的挖掘,从而衍生出新的变量,包括客户关系网络的推测,例如家庭成员关系、同事关系、客户群体的划分,客户用卡喜好的把握等。以客户用卡喜好的挖掘为例来说明数据融合的过程,例如,如果客户经常购买机票、异地酒店住宿、异地商户消费,则说明该客户经常出差;如果客户消费领域集中在饭店或其他娱乐场所,则认为该客户属于社交人士等。

实施目标:分析基础数据,发现深层信息

√ 寻找客户之间关系,建立客户网络

√ 考察客户消费行为,了解客户喜好

√ 分析客户还款情况,识别风险特征

√ 从与客户之间互动,衡量客户关系

客户网络建立

在数据工程中,我们经常通过不同客户之间的数据匹配形成客户关系网络。主要包括如下几种客户关系网络:

家庭关系网络

对于已有的客户进行家庭关系网络的建立,通常可以通过同一家庭成员可能共有的信息进行判断,例如,相同的信用卡消费账户、相同的家庭住址、家庭电话等。在家庭住址和家庭电话标准化的基础上,寻找具有相同家庭住址或家庭电话的客户组合的准确度也大大提高了。

当然,这也不排除两个客户合租同一套公寓的可能性。在初步判断的基础上,可以通过客户所填写的直系亲属的联系信息来判断,这些联系人是否已经包含在我们初步判断的客户网络中,如果是则可以完全判定两者确属亲属关系。另外,如果联系人系统中的联络方式【家庭地址、家庭电话】与客户不同,但是在现有客户中又能找到该联系人的信息,则将两者的关系补充进来。对于那些尚无依据明确判断是否确属亲属关系的客户网络,暂时认定为同一家庭成员。

总之,寻找家庭成员的过程可以分为两步:第一,列出共有信息,确认客户间的关系网络;第二,根据客户的基本资料,年龄、性别、地址等信息,确定客户之间是什么样的关系。

同事关系网络

同事关系网络则是通过客户所填写的公司信息进行判断的,包括公司电话、公司名称以及公司地址。在对公司名称标准化的过程中,利用公司名称和公司电话进行循环查找,已经对相同公司客户给予同一公司编码,这将作为确立同事关系网络的基础。在此基础上,判断客户所填写的公司地址完全相同,则也认为是来自同一公司的客户,作为同事关系网络的补充。另外一个信息来源与家庭成员关系判断比较相似,可以通过非直系亲属的信息,如果说明关系为“同事”,并且该联系人也属本行客户,则将其关系补充到现有的同事关系网络中。

其他关系网络

除了上述最重要并且通过原始数据库比较容易判断的关系网络以外,还有其他客户关系网络的存在,例如朋友关系网络和邻里关系网络。在现有的数据库中,能够确立朋友关系网络的字段比较少,主要还是通过非直系亲属的信息进行判断。同时,也可??有一些同住在一起的朋友关系网络,在用家庭电话和地址匹配的过程中被划分到家庭关系网络中了。邻里关系网络的判断则主要是通过在客户的家庭住址信息中提取小区/住宅楼/大厦的信息,并利用这些信息进行客户之间的匹配,认为居住在同一城市、同一小区/住宅楼/大厦的客户为邻居,以此建立邻里关系网络。

建立客户间关系网络的好处在于:一方面可以作为客户群体划分的依据,可以考察该群体的行为特征。例如,通过同一小区客户的总体消费情况来确定该小区的客户平均财力情况,为客户找客户等销售方式提供契机。另一方面,客户关系网络的建立也可以对市场活动给予指导。例如,在某次市场活动中仅选取了某个公司一部分客户赠送礼品,而未通知到来自同一个公司的另外一部分客户,势必将会引起客户的不满和投诉,严重影响银行与客户之间的关系。

客户喜好了解

具体来说,客户的消费习惯可以用四个“W”【What,Which,Where,When】和一个“H”【How Much】的交易记录来表示。即客户喜欢什么样的产品?他们喜欢在哪里买产品?他们喜欢在哪家商户购买产品?他们喜欢购买什么样的产品?以及他们能够承担什么样的价格?因此,数据融合的第二部分就是研究怎样才能挖掘出客户这些动态数据信息。

也许很多人会说,了解客户行为特征、需要和喜好未必一定要从动态数据中获得,通过调查问卷来设置相关的题目不是也可以达到同样的效果吗?那么,我们就以下面几个希望调查的问题进行一下讨论。

·您认为自己在花钱方面是一个非常“慷慨大方”的人吗?

·您认为自己是一个对价格比较敏感的人吗?

·您觉得您的生活水平算得上“奢华”吗?

对于第一个问题,绝大多数人都认为自己是比较慷慨大方的,因为他们至少不觉得自己很小气,至于慷慨大方的真正概念和程度,他们则很难说得清楚。那么,我们想问,当您在一家饭店就餐的过程中,您得知这家饭店需要收取10%的服务费,您会觉得这种收费是合理的,因而欣然接受呢?还是会觉得这是一笔不应该支付的费用而不再光临这家饭店呢?当您出国旅游时,付小费已经成为被绝大多数人,甚至整个社会所接受的一种行为,您是否也有付小费的习惯呢?

对于第二个问题,您可能毫不犹豫地回答:“当然不是,我从来不购买换季打折的衣服,总是愿意支付更多的钱来购买当季的新品。”那么,我们又要问了,您是否在其他产品的购买方面也同样不计较价格?您是否曾在超市里使用过优惠券?您是否也会购买优惠装的食品和日用品呢?

对于最后一个问题,也许并不是每个人都会回答“是”,因为大多数人的经济收入不允许。但是,是否在经济条件允许的情况下,绝大多数人都会过着“奢华”的生活呢?难道每个月一份数额不小的信用卡对账单就说明您是一个生活奢华的人吗?那么,我们想问,对账单上这么大的数额都是您出入高档场所消费产生的,还是仅仅因为您日常开销过多、应酬过多,或者是因为您不善理财而导致的呢?

对于这些最常见、最基本的问题,客户自己都不能给出客观、准确的答案,银行又如何能够借助由一个个不同标准的回答所构成的调查问卷来找到其中的答案呢?

除上述问题之外,通过调查问卷来考察客户行为特征和生活方式等信息还存在着很多缺点。首先,调查问卷中需要设置关于客户购买了什么商品、哪一类商品、在什么地方购买商品、消费多少钱等问题,这样几个What、Which、Where、When、How Much问题非常直截了当。但是,客户是否真的能将每一次的购买经历都记得这么清楚呢?大多数人都仅能对目前的购买行为给出清晰的描述,使得银行无法追踪到以往的信息。同时,调查问卷也是一个非常耗时、费力的过程,待信息获取并分析完毕之后,可能已经错过了最佳的市场时机。另外,调查问卷只能在有限数目的客户中开展。所以,必须考虑到样本的大小是否具有统计意义,如果样本较小则结果不一定会准确。

客户之所以无法回答这些问题,是因为客户不会因自己是某类人而做某件事情,也不会在做完事情之后去总结自己是哪类人。他们做大多数事情的初衷也许都很简单,因为喜欢这件东西,因为正好缺少这样东西,因为觉得可以这样做等。这些行为的发出,有时都是很随意的,随心情的,甚至是无意识的。客户自然不会清楚地记得每一次购买过程中的What、Which、Where、When、How Much。其实,这些看似无意识的行为往往与有意识的因素相关,例如性格、奢华倾向、经济条件、时尚抑或保守的生活方式等。客户只要依据自己的需求和喜好做就行,他们不必思考这些行动背后的动因。但是,银行却需要比其他竞争对手更了解客户,比客户更了解客户,了解他们的购买方式、购买喜好、消费能力、行为特征等,不论给银行带来收益多少的客户,对他们多了解一些,银行就会多一些机会,最终产生更多、更有效的商业行为。

银行从哪里可以真正获得准确的、连续的客户行为信息呢?随着信用卡在客户经济中扮演越来越重要的角色,获取客户特征也就变得更加现实了。每一张信用卡消费单据中都包含着由四个“W”和一个“H”的交易记录。一个典型的交易记录如下图6.1,它显示了一笔交易中的各种类型的信息。

即使我们知道在哪里能够找到客户相关的购买信息,但是这些信息究竟能够为我们做些什么呢?交易数据,或者说消费单据,可以直接告诉我们每笔交易的What、Which、Where、When、How Much。但是,客户行为特征却需要通过对一段时间内的所有交易的What、Which、Where、When、How Much信息进行分析才能获得。通过交易数据可以回答一系列关于客户消费行为的问题,例如:

·客户的生活方式是否奢华?

·客户是否有支付小费的习惯?

·客户是否对价格变动很敏感?

·客户是否经常出外旅游?

·客户是否有赌博的喜好?

·客户是否有过或正在进行分期付款?

·客户是否对时尚很敏感?

·客户一般会寻找哪些娱乐活动?

·客户通常什么时候出行?

·客户比较喜欢什么类型的食物?

·客户是否参加什么社团或俱乐部?

·客户是否很注重身体健康?

·客户是否正处在怀孕期间?

·客户有何种喜好?

·客户是否喜欢电子类产品?

基于银行所拥有的客户交易数据库,并通过数据的整理和分析回答上述种种问题,可以帮助银行的市场人员从客户的行为中发现客户想要什么,需要什么。那些可以终身与银行建立关系的客户,就是因为非常满意银行为他们带来的服务。客户的口味总是各不相同,有些客户认为免费的往返票或者酒店服务对其更适用,而另一些客户则可能觉得九折的保险存单更具吸引力。因此,从客户交易数据中提取客户行为特征信息,使银行制定更具远见、更合理的市场决策和行动成为可能。

作为一个额外的商业机会,银行可以提供通用的客户细节行为信息给那些同样希望可以更好地理解客户的商户。品牌的价值以及客户给予银行的信任,是拓展这一业务模式的最大优势。银行可以将自己塑造成一个客户和商户之间可以信赖的中介,并且从双方获得利润。银行可以成为他们客户的唯一市场代理,也可以通过为商户经营其他的市场分配渠道而形成一种联盟。同时,它可以通过提供客户的数据库,帮助商户制定更加准确的目标,以形成更加细分的市场。

到目前为止,我们一直在讨论银行可以在哪里获得关于客户更加详细的信息,这些信息将如何使银行获利。然而,我们还没有真正讨论具体的实施过程是怎样的。每家银行都可以产生千兆的客户信用卡交易数据,但是如何才能将这些信息组装并用于理解客户的综合形象?这个比较简单。整个过程从数据精练开始,在标准化和纠正的数据基础上,对客户的行为信息提取和分析,了解各种客户行为信号,总结出客户的购买喜好和消费行为特征,最后通过行为评分对客户的行为特征进行总体的评估。

尽管每一笔交易数据都可以从信用卡业务的交易系统中获得,但是由于一笔交易数据到达交易系统之前要经过多个组织、多个系统,因此其中涉及不同组织的数据规范不统一,数据格式自由化,不同系统之间数据传递所产生的问题等。数据精练的目的就是,将这些有问题的交易数据进行纠正,将自由格式的数据进行标准化,并且将数据划分成不同的类别。最重要的是,从精练过的数据中更准确地获得与客户交易相关的What,Which,Where,When和How Much的答案。

产品

在交易系统中,对于客户消费的产品类型的理解,主要来源于商户分类代码【MCC】。

商户分类代码

为了将商户分成不同的商业类别,我们需要商户分类代码系统的帮助。一般这一系统都是由银行卡组织提供的,在美国是由Visa和Master公司开发并提供??,而在国内则主要是由银联开发并提供的。在商户分类代码系统中,有超过3000种商户分类,包括某些制定的商户类别。

虽然目前银联已经提供了针对中国内地区域的商户分类代码系统,但是该系统仍然存在一定的问题,主要是商户分类代码的准确度不高,某些类别存在较大误差,难以帮助我们很好地了解商户的经营范畴。另外,由于分析角度和用途的不同,目前的商户分类规则不能完全满足我们的分析需求。

鉴于此,在对商户分类数据进行精练的过程中,我们需要在商户业务范围的基础上,结合持卡人行为与持卡事件,重新制定一套商户分类规则。在新的商户分类规则中,商户分为10个一级大类,46个二级类别,69个三级小类。限于篇幅,在此仅简略说明一级大类的总体范围,如下:

0 金融及特殊商户:主要包括银行系统及金融机构等。

1 衣:主要包括服装行业的商户。

2 食:主要包括饮食行业的商户。

3 住:主要包括酒店类商户。

4 行:主要包括交通运输行业的商户。

5 娱乐:主要包括娱乐性质的商户。

6 用:主要包括部分零售行业的商户。

7 服务:主要包括部分服务行业的商户。

8 房地产:主要包括房地产行业的商户。

9 非营利:主要包括慈善、教育及政府等非营利机构。

基于上述新的商户分类标准,通过如下几个步骤对现有的商户进行重新分类。

·尽管现有的MCC分类准确度不高,但仍然有一定的使用价值。在整体分类之初,首先从商户的MCC码出发,映射到新的类别,并以此为商户的初始类别。

·根据新的商户分类标准,并通过对现有商户名称信息的归纳,总结出能够明确区分各类商户的全局关键字库和局部关键字库以及相应的搜索规则,对全部商户名称进行全局关键字搜索,如果匹配成功,则将初始类别调整为关键字对应的类别;如果匹配不成功,则沿用初始类别。然后,依据局部关键字及相应的搜索规则,对一定范围内的部分商户名进行局部关键字搜索,若匹配成功,则调整为关键字对应的类别;若匹配不成功,则依旧沿用原有类别。

同类推荐
  • 带队伍就是带人心

    带队伍就是带人心

    本书从问题界定、案例解析、心理学分析、管理措施等四方面,全面地分析员工心理,还有漫画、情境、案例等辅助形式,更加生动形象地展示解析员工工作中的各种情况。以此让管理者通过心理分析,调动员工工作积极性,增强员工工作效率,打造优秀的工作团队!
  • 推销活用36计

    推销活用36计

    靠碰运气永远成不了推销高手,只有正确的策略才能造就成功的推销,《三十六计》智慧如此丰富而实用,用于军事能战无不胜,用于推销也必能大大提高推销效率。《推销活用36计》智慧,让你成为无往不胜的推销高手!《三十六计》是中华民族古老的兵法智慧,而《推销活用36计》则让这种古老的智慧结晶在推销领域重新焕发出了光彩。本书将大量巧妙而又具实战性的推销故事融入《三十六计》之中并呈献给大家,同时,对每条计策和故事都进行了点评,希望能给读者带来更多启悟,使你在身临其境的感觉中领略“三十六计”的精髓,从而掌握高超的推销技巧,做个无往而不胜的推销高手。
  • 借贷危机

    借贷危机

    借贷,资本圈特有的一种融资行为。2011年以来,在浙江省温州市引发了一场因为民间借贷而导致的中小企业资金链断裂的“借贷危机”。这是一个偶发性的事件吗?为什么中小企业不去借银行的钱转而去借利息高昂的民间高利贷?为什么中小企业的资金链会突然断裂?中小企业的出路到底在哪?因温州引发的“借贷危机”会在中国蔓延吗?中国除温州外还有什么地方存在民间借贷触发危机的高危地带?对于这场“借贷危机”,我们该怎么办?您将在本书中找到你所要的答案。
  • 快易营销

    快易营销

    书中内容分为“道”、“术”、“谋”、“势”、“谋易思想”五个部分,由观念到战术;由技能到技巧;由战术到策略,详细阐述了一个业务员从门外汉到一个职业营销人需要掌握的知识体系。是畜牧业营销学习一本不可多得的教材。《快易营销》写作风格白话、风趣,引用了大量的原创性案例,学习脉络由浅入深,作者的初衷是把它写成一部“初中生也可以看得懂、学得会、用得好的白话营销学习工具书。
  • 成功班主任案头必备:班主任主题班会精选

    成功班主任案头必备:班主任主题班会精选

    班主任理论是伴随着教育改革不断发展的。针对庞大的班主任队伍和他们极为重要的工作,班主任理论应该是争奇斗艳,应该有它的深度,应该成为推动班主任工作的有力武器。多年来教育改革取得了很大的进步,然而在艰难进行中,也时时有着迷惘、困惑和浮躁。
热门推荐
  • 东山经

    东山经

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 满分作文一本通

    满分作文一本通

    中考最近三年满分作文。在高考科目中,作文题目占了60分,在整张试卷中的权重非常大。在平时的写作练习中,我们需要从高考满分作文中汲取精华。因为凡高考满分作文,除满足行文的一般基本要求之外,都有其与众不同之处。尤其是在见解、见识、见地等方面都必定技高一筹。
  • 极品神偷:校草我要宣战

    极品神偷:校草我要宣战

    她只不过是日本来的留学生,可偏偏争强好胜,一不小心惹了大麻烦,偷宝物被逮不说,竟然还被识破身份丢了父亲的名誉!黑道之战中,她大闹帮会。“父亲,这个黑帮王位不能给他!因为我冷倾弋,要向他,夜、冥、默、宣战!”
  • 逆天修行传

    逆天修行传

    平凡的八零后,因意外的穿越到一个修真的世界,资质平庸的他不被任何人看好,但是凭借坚韧不拔的信念一步步的提升实力,碾压了修真界公认的天才,他相信虽然自己资质平庸,但是他拥有比别人更加坚韧的性格。所有的修真者都为了长生不老或者拥有至高无上的权利去修炼,但是刘想对长生不老不感兴趣,他只想找到回家的路,那里有他的亲人在等着他,还有在他内心深处一直愧对的妹妹,那是他一生的伤痛。他要回去,所以一直坚持着心中的那份执着,因为他相信有种努力叫着靠自己
  • 武修系统

    武修系统

    你所生活的环境,真的就是你所了解的那样吗?这世间,有许许多多不为人知的存在,异能者,古武者,忍者者,血族等等。有为了国家稳定,维护国家利益的阳公会存在。同时,也有隐藏在阴暗角落里的阴公会存在。有许许多多不为人知的恐怖生物,只是从来都没有人告诉你。有太多你不曾知晓的战役被隐藏。当国家需要你们,人民需要你们的时候,阳公会的成员们就要挺身而出。他们是英雄,不求名利的无名英雄,他们属于每一个阳公会。
  • 原来我爱了你这么多年

    原来我爱了你这么多年

    十九岁那年,我捧着自己的心:“莫城……莫城……你会永远爱我吗?”莫城回笑:“当然。”那年,我与神秘男人的照片贴满校园角落,北影表演系公认的校花江夏轰动全校。我被退学、唾弃、谩骂、鄙夷。莫城讥笑:“没想到你也是这种人,现在多与你待一秒,我都觉得恶心。”我幡然醒悟,三年之后,这时,萧凌冷冽一笑,在我耳边嗓音低沉:“跟着我,我让你做一回女主角,我……不介意你是破鞋。”咸鱼翻身,红遍大江南北。
  • 血色杀胡令

    血色杀胡令

    杀一为罪,屠万为雄,屠百万为雄中雄。中原大地,诸胡乱华,屠城掠地,血染神洲,杀胡令出,一时英雄,八荒六合,谁得天下?看现代人华锋,穿越到五胡乱华,成为武悼天王冉闵的儿子冉智。在这个人命如草芥的大时代下,现代人华峰是否能扭转乾坤,救自己和自己的父亲逃出历史上的必死之局,如何披甲持剑杀出一条自己的血路...
  • Z一dream

    Z一dream

    一场虚幻与现实的交织,资深游戏玩家的传奇。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
  • 边缘守护

    边缘守护

    故事的主角是一个普通的初中生,一个意外改变了他那本该平凡的一生。
  • 莫奈

    莫奈

    我认真做人,努力工作,为的就是当站在我爱的人身边,不管他富甲一方,还是一无所有,我都可以张开双手坦然拥抱他。他富有我不用觉得自己高攀,他贫穷我们也不至于落魄,这是莫奈的爱情观。但是对她来说若为自由故,二者皆可抛。所有,我想给你我的自由。南澈一直都是一切非她不可。原来你离我这么近却又这么远谁口口声声说我不爱,谁就在爱!