登陆注册
3424800000014

第14章 数据融合(2)

·由于原始的MCC为两级分类,而新的商户分类标准为三级分类,因此通过上述两个过程能够确保所有的商户都有明确的一、二级分类的归属。但根据新的商户类别划分标准所形成的关键字库,未必能够将所有的商户都进行明确的第三级分类,对于那些无法进行第三级划分的商户,暂时归并到“其他”类。

在商户分类过程中,最大的挑战就是关键字库的建立、关键字的搜索规则。由于关键字数目众多,各级关键字的搜索规则大多与关键字的具体意义相关,因此很难在有限的篇幅中进行清楚的阐述。我们仅以一类商户的分类规则和关键字的形式,以及相应的搜索规则为例进行说明,如表6.1所示。

关键字搜索规则:

·局部关键字仅适用于搜索范围中所列的MCC所对应的商户名称,且不考虑关键字的位置。

·对于复合关键字,即必须同时包含其他关键字,不考虑关键字的位置。

商户名称中同时包含两个及其以上的关键字【非复合关键字,包括同时包含多个全局关键字或多个局部关键字】时,如果同时包含父级与子级的关键字,分类码以子级关键字为准【全局关键字以父级关键字为准】,否则以所处位置较靠后的关键字为准。

时间

银行可以通过终端捕捉到精确的交易时间【如图6.1】。交易时间信息可以帮助银行更好地了解客户每天的行程。交易时间可以分成不同的时间段,包括早晨、上午和晚上。通过识别客户绝大多数交易通常发生在什么时候,以预测客户的日常生活方式。表6.2就是一个通过交易时间来推测可能的生活方式的例子。

价格

明确客户每月愿意用信用卡消费多少金额是非常重要的。这条信息可以帮助银行市场人员识别那些消费很多的客户,以便为这些客户设计更多的活动。同时,可以根据客户的收入和财产状况,考虑每个客户的消费潜力,从而了解哪些客户能够购买和使用更多的产品和服务。在客户分群中将更加细致地讨论如何评估客户的购买能力。

商户

理解客户光顾哪些商户主要包含两层内容:一层内容是客户光临了哪家商户,需要通过商户名称来理解;另一层内容是客户光临的是哪一档次的商户。

商户名称

对于商户名称,在交易系统中有专门的字段进行记录,该字段信息一般是由银行卡组织提供的。例如,在国内大部分是由银联提供的,由于某些商户的特殊性,或者同一商户不同POS机铺设时间不同等原因,造成目前的商户名称中存在的数据质量问题如下:

·商户名称缺失,或者不填写真实商户名称。例如,商户名称填写为“金卡商户”,铺设POS机的银行名称,数字串或者其他字符串、拼音等。

·存在商户名称前后不一致的情况,即同一商户在不同的时期出现多个不同的名称。另外,多个不同商户也有可能共用同一个名称。因此,商户与其名称的多对多关系使我们无法识别不同的交易记录是否来自同一个商户。

针对上述商户名称中存在的问题,采取如下相应的数据精练过程,将商户名称进行标准化:

·从相应的交易文件或商户数据文件中提取商户编号和商户名称,并排除个别错误的编号。例如,一个编号对应多个不同商户的情况,则视为错误编号。

·对同一个编号对应的多个商户名称的情况,根据其包含信息的内容、格式和多少确定选用的优先级别,判断标准如表6.3所示。

第一阶段优先级判断:根据各个商户名称中所包含字符的类别进行优先级判断,从“中文”到“空值”,优先级别依次降低。

第二、第三阶段优先级判断:当出现两个【含】以上的商户名称中包含中文字符时,以长度为依据进行第二阶段优先级别的判断,长度越长则优先级别越高。如果有两个【含】以上的商户名称长度相同,则以对应的交易时间为标准进行第二阶段优先级别判断,交易时间距今越近则优先级别越高。如果交易时间相同,则随机取用。当第一阶段优先级别判断结果为2/3/4/5,则以交易时间为准,交易时间越近优先级别越高;交易时间相同,也以随机结果为准。

通过以上商户名称优先级别的判断标准,可以将同一个商户编号所对应的商户名称进行排序,从而确定最终的商户名称,举例如表6.4所示。

通过优先级别判断,最后确定商户编号为“C123”所对应的商户名称为“河南ABC旅业股份有限公司Zhengzhou CN”。

由于商户名称信息有多种数据来源,并且其中所包含的字符信息种类很多,因此为商户名称标准化带来了一定的困难。同时,在处理过程中仍有不足之处,主要包括:

·如何将交易文件与商户文件中的商户信息进行匹配?由于其与不同银行内部系统的设计有关,因此不作详细介绍。但不同数据文件之间的匹配和整合确实是一个不容忽视的问题,具有一定的难度。

·商户名称中中文字符的识别及长度计算:推荐一个一般的高级语言都具有的汉字识别语句,即RANK【】函数,来进行汉字的识别,取第一个中文字符与最后一个中文字符之间的长度为商户名称中的汉字字符长度。

·目前标准化流程中存在的问题:现有的商户名称的选取标准,以名称所包含的信息多少为依据,确保选用较为完整的名称,但仍会造成不同程度的信息损失。如表6.5所示,按照排序结果,选取后一个为商户名称,该名称包含了更完整的名称信息和行业信息,但损失了前一名称所包含的商户分店信息。另外,有时候无法判断同一商户编号前后名称不同是否是由于商户真实名称的变更而引起的,可能因此影响准确度,但造成的误差在可接受的范围内。

商户档次划分

商户名称数据只是帮助我们对客户的购买地点进行定位,但是要真正了解客户的生活方式,需要知道客户一般光顾哪种档次的商户。商户档次大致可以分成奢华和非奢华两种。把商户分到不同的档次中,可以帮助识别客户是否过着奢华的生活。显然,总是光临高档次商店的客户都是一些生活奢华的客户。

两种数据源可以用来定义商店的档次,分别是外部数据源和内部数据源。前者从地域性的指南和杂志中获得奢华类商户的名称,后者将通过对所有产生信用卡消费金额前10%的商户或者由收入较高的客户所产生的较高消费的那些商户进行研究和考察来丰富奢华类商户的名单。同时,发生交易的商户所处的地理位置也可以决定某些商户的档次。在知识库建立之后,交易中的商户名称将通过关键字匹配的方式匹配到相应的知识库中。

·通过外部数据源

饭店、宾馆、女士用品等商户的级别都是来源于各种各样的外部数据源,包括政府机构和旅游组织等。例如,它们每年都会公布五星级宾馆的名单。一个五星级???宾馆是可以提供高质量住宿和个人服务的,而四星级宾馆则缺乏五星级宾馆所具有的某些特征。外部数据源可以适用于很多商户档次的划分。

·通过内部数据源

利用内部数据源对商户档次进行划分,可以通过分析有钱客户的消费来判断它们的共性。这个可以通过研究数据库中所有高收入客户的购买方式来实现。有钱客户可以通过收入进行划分,收入信息通常是在申请信用卡时提供,客户所提供的收入数据需要进行调整和纠正。通用的特征是用人口统计及行为信息来定义的,例如,参加高尔夫活动或者去某些富人经常光顾的饭店都可以被定义为高档次的场所。可以通过深入的挖掘来对内部数据源进行开发,用来考察一个商户档次的数据是从数据库中消费金额前10%的交易记录中获得的,或者是从那些高收入客户所产生的相对数额较大的交易中获得的。结合前面的商户分类及这里讨论的商户档次划分,可以帮助银行的市场人员形成关于客户行为特征和生活方式的相关变量或信息。例如,在高档次商户中的大额、频繁的交易就说明客户过着奢华的生活,频繁去澳门交易则说明客户有赌博的嗜好。

地点

交易地点

商户的奢华程度可以通过两个要素进行识别:地址和产品。利用地址来确定奢华类的商户是依据客户喜欢购物的区域来完成的。识别交易地点的方法有很多种,所明确的交易地点的范围也各有不同,有的数据可以帮助确定交易所发生的国家,例如货币种类,因为不同国家使用不同的货币。另外,还可以通过其他商户信息,例如商户编码、商户名称以及在该商户发生交易的客户地址数据等,进行商户地址的提取,所提取的地址信息要比直接通过交易货币种类所提取的信息更细致一些。

尽管很多种商户信息中都可能包含地址信息,但是单独的每种途径所能获取的地区信息都是有限的,并且准确度也不能完全满足分析的需要。同时,考虑到准确度和效率问题,最终结合商户编码规则以及在该商户发生交易的客户地址数据,来进行商户所在城市的确立,以商户编码为主,后者作为补充,具体的实施方法如下:

·商户编码的来源不同,包括银联提供的商户编码、本行自己拥有的商户编码,等等。因此,在根据商户编码进行地区信息提取之前,首先需要了解每种商户编码的规则,从而建立编码与地域的对应关系,并依次通过银联编码、本行编码、其他编码确定商户所在城市。

·提取各种编码中的地区信息之后,仍然有部分商户未能确定所在城市,则通过对在该商户进行交易的客户所在城市,以取现频次最高的客户所在城市为该商户对应的城市。

根据以上方法,通过银联商户编码规则约能确定80%商户的地区,通过本行商户编码约能确定5%商户的地区,通过其他编码规则约能确定10%商户的地区,余下5%的商户所在地区则是通过客户所在城市来确定。

由于商户地址信息是一个新生成的变量,并且其信息来源有几种,因此最大的挑战是如何合理进行信息的匹配和组合,提高地址信息的准确度,在处理过程中面临的主要挑战和遇到的问题有:

·编码规则只能确定商户所在省,不能确定所在市时,如何用客户所在城市信息进行补充?我们选择的处理标准是,如果客户所在省与编码规则确定的省份一致时,才对城市进行补充。如果两者不一致,则不进行市级信息的补充,只取编码规则中的省份信息。

·通过客户所在城市来补充商户地区信息的方法,存在准确度较低的问题。例如,酒店、旅游类商户,由于多为外地人消费,极有可能作出错误判断,但考虑到使用这种方法补充的商户数量不多,误差应在可接受的范围内。

分类的好处是可以帮助市场人员锁定特定的区域。所有的信用卡交易可分为虚拟型和实体型,虚拟型交易是指发生在网上的交易,而实体型交易则是指发生在商户里的交易。在我们的讨论中,只考虑发生在商户里的交易,类别将划分为不同的大洲、国家、城市和行政区。交易地址被系统地排列,并分类到数据库中不同的地址编码中。这样,商户所在的地域可以被帮助识别商户的档次,或者说奢华程度。典型的高端商户集中在城市中心或重要地理位置。例如,中央商业区--香港的商业中心聚集了国际知名品牌,香奈尔、普拉达、赛五林、古奇、雅诗兰黛等。大量的高档商业购物中心以及顶级的宾馆、咖啡屋,也会被设置在知名的商业公司或国际银行所在的位置以为其服务,有时候这些公司或银行就在购物中心的楼上,位于这种位置的商户可以很放心地被归类到高档商户中。至于位于郊区的小型超市或百货公司,则几乎不可能属于奢华商户。这些高端商户的分类,最终用于识别那些生活方式比较奢华的客户。

客户行为习惯/生活方式

账单不仅能够显示交易细节,也能够告诉市场人员客户的喜好。客户行为可以通过他们的交易来获得,包括交易金额、交易笔数、交易所在商户等的评估。在客户分群之前,可以从他们的交易行为中推测客户行为特征,例如行为习惯以及生活方式。

行为习惯

·付小费的习惯

尽管付小费在中国内地还不是一个非常普遍的现象,但是如果在未来服务业发展到一定程度的时候,这将成为惯例,到那时候是否付小费、付多少小费都会体现出客户的某些特征。以香港为例,小费是香港餐饮业的客户对服务生的服务所给予的酬谢。尽管饭店会在每份账单上加10%的服务费,但是顾客仍会以消费金额的一定比例来支付一些小费。在某些情况下,也会因为服务不周而不支付小费。计算小费多少的最好方法就是,用授权金额与客户账单上的金额进行比较,在交易单上可以看到其中的差异。如果两个金额之间的差异为零,则说明该客户没有支付小费。如果两者之间的差异较大,也就说明所支付的小费较多。

考察客户支付小费情况的重要意义在哪里呢?当客户进入饭店,如果他有给小费的观念,则会给为他服务的人员一定比例的小费。例如,客户可能给20%的小费。然而,如果他接受了特别优质的服务,则会增加小费的数目。增加的数目多少取决于客户的慷慨程度,越慷慨的客户给的小费就越多。尽管客户留小费有时候也可能是为了显示其财富、地位或者权力,但是由于付小费本身是一种自愿的行为,因此小费的数目仍然可以说明客户的慷慨程度。在某种程度上,小费也可以反映客户的财产情况。

·价格敏感度

价格敏感度是度量客户对促销、打折活动的敏感程度。一个对价格敏感的客户,非常容易因为产品价格的变动而改变消费的层次。对于这方面的评估,主要有四个因素。

来自商户的促销活动

通常银行总是会与一些大型的商户合作,为信用卡持卡人联合组织一些促销活动,提供某些产品的折扣。通过对客户在促销活动前与促销活动中的消费频次和消费金额的比较,可以计算客户对于促销活动的反应程度,从而说明其对价格的敏感程度。

在银行的合作商户中的交易情况

一般来说,不同的银行都会有成百上千个不同的合作商户来为其信用卡持卡人提供一定的折扣。例如,持有ABC银行信用卡的客户,可以在购买思捷商品时享受九折优惠。如果客户使用卡片的主要动机是为了从银行的合作商户那里得到折扣,那么客户在银行的合作商户的消费频次和金额将远远高于在其他商户中的消费。客户在越多数量的合作商户中消费,就越说明客户是价格敏感的客户。

信用卡积分的使用情况

同类推荐
  • 总经理公关一本通

    总经理公关一本通

    身为总经理,你可以不是公关专家,也可以不冲在第一线,但是你不能不懂公关,不懂公关,你绝对当不好总经理,尤其是在网络新媒体时代。那如何让自己成为公关达人,用好公关人员和公关公司,实现企业的“无危机”境界呢?你只需要读懂本书,了解总经理必备的公关常识、必解决的六种公共关系、必适应的新媒体公关环境和必知的HACCP解决之道,掌握企业公关危机的应对与处理技巧。你所要做的,就是让自己不再是公关的门外汉。
  • 赢在谈判

    赢在谈判

    本书谈判是一场战争,有些谈判是为了和平,有些谈判是为了正义,有些谈判是为了公平,有些谈判是为了真相,有些谈判是为了解决问题,有些谈判是为了面子……而对于商场来说,谈判就是一场为了利益而斗智斗勇的战争。《赢在谈判:成功商务谈判的46个攻略》由马斐所著,系统性、针对性、实用性并重,是一本成功商务谈判的指导用书。
  • 苹果传奇

    苹果传奇

    本书分五章,分别从苹果诞生、早起发展、苹果的扩张等方面对苹果公司进行了全面介绍,使读者对苹果公司有了更深入的了解。
  • 创意英雄谱(第一季)

    创意英雄谱(第一季)

    第1季收录12个创意样板。这些创意英雄,皆因创意构建出自己的商业版图。因为创意,李东田创造了国人扮美品牌东田造型;童之磊将中文在线打造成数字出版领跑者;嘻哈包袱铺“掌柜”高晓攀引领相声新潮流;“剪刀手”魏楠开拓出电影预告片新天地;实景演出因梅帅元大放异彩;千年古琴因斫琴家王鹏再现神韵。因为创意,郭弈承让大师巨作飞进百姓家;神“雕”侠侣瞿广慈、向京把雕塑做成商业;设计师郭培让儿时梦想成真;王云飞创作出《快乐东西》等国产动画力作;贾伟以“上上之道”锁定设计中国风;《三国杀》被杜彬、黄恺玩成时尚。
  • 基石

    基石

    本书从个案着手,特别邀请10位资深记者从典型企业的特色入手,深刻挖掘各典型企业的成功模式,透析企业的成长轨迹,并邀请10位经济领域专家、学者以及著名财经评论人士加以点评,使这10家典型企业从不同的侧面展示了“基石”般的企业面貌,诠释了新国企的内涵与特质。
热门推荐
  • 孤林

    孤林

    有时候觉得每个人都像一棵孤独的树,独自摇曳风雨炎寒中。
  • 霸艳帝尊

    霸艳帝尊

    荒芜世界,漫天黄沙,血雾弥漫,天地之间一片肃杀。数道闪电,天雷涌动,血色天空中慢慢凝聚出一个形体,身穿血红色战甲,手执一柄通体泛白长戟,虚空而立,威风凛凛。幽幽一梦,少年英姿勃发,脚踏七星剑,手持弯月刀,问天地间谁主沉浮?寻觅处,彼岸花开,倾一世温柔;少年郎,傲视天骄,一步可登天。
  • 火影之鸣人时代

    火影之鸣人时代

    在现实世界中,一位初中生在一次雷劈中,偶见了一位大神。。。
  • 霸天之王

    霸天之王

    天庭破碎,妖荒夜起,乱宇洪荒,谁执牛耳?荒古血脉,九世轮回,弹指万古,再翻天地!虽经轮回亿万载,笑看天下谁英雄……看我一介草根,如何视天下英雄如草芥,步步强求崛起……为亲、为情、为众生,逆天改命撼苍穹!演绎出了一首波澜壮阔的…
  • 武装神探

    武装神探

    对于绝大多数人来说,“侦探”不过是一个渺小的字眼,在世界的某个地方,有这样的一群人,他们有着合法的“杀人执照”;他们,拥有绝对的武装力量;他们,被称为武装侦探。
  • 不可不知的电影常识

    不可不知的电影常识

    看了一辈子的电影,电影是怎么拍的?电影背后的故事有哪些?《不可不知的电影常识》即将面世揭晓。本书浅显易懂,读者群体主要针对包括北漂大军在内的电影爱好者和初学者,可以作为电影艺术教育的内部培训教材或者专业人士的普及读物,读者群体主要包括高中电影评论及艺术特长培训班、全国各大城市艺术院校大学生读者群以及从事电影相关专业的各类人群等,即可作为专业类学习读物,也可作为艺术欣赏佳作,可以了解到更多你不知道的电影知识及电影故事。
  • 逆势霸王

    逆势霸王

    修为越高,寿命越长,每当寿命所剩不多时,晏紫御都会产生感应,那时他便知道,如果短时间内不能突破便只有死路一条。他经历过三次,有一次只差半线,他已经一只脚迈向了死亡,可是一种熟悉的力量又将他拉了回来。那是紫心的呼唤,他绝不会感觉错误……
  • 黑暗系,女王归来

    黑暗系,女王归来

    索格学院里,黑暗系的学生注定卑微;这个世上,黑暗系的,也注定遭人唾弃。可米恩却是黑暗系的,可莫名的,为什么她身后这个所谓的“吸血鬼王子”却要不依不饶的缠着她?
  • 穿越——意外的爱恋

    穿越——意外的爱恋

    要离开了,我才蓦然醒悟。这场穿越,不过是场阴谋;这场邂逅,不过是个意外;我和他,从相识、相知到相恋,再到被他无情的羞辱、折磨……是的,是时候回家了;从此,我与他,便是两个时空的距离;那是生与死,也无法触及的遥远……
  • 悍妃倾城绝代

    悍妃倾城绝代

    前世女警,今世为妃,真实身份却是千年妖皇,上古邪剑附体,血莲盛开于肩……嫡姐做作,她装疯卖傻,打得她满地找牙;侧妃暗藏祸心,她四两拨千斤,见招拆招……她甘于平静,却偏偏多生事端,阴谋阳谋不断,小人太猖狂,她拍案而起,查冤案,戏皇子,斗佞臣,惩小人……一代悍妃倾城绝代,却偏偏与妖魔为伍,引来追兵无数。——玄天崖上,血流成河,他笑得猖狂,血眸狰狞,“看到了吗?你不再是妖,而我依旧是魔,嗜血成性的魔。”她莞尔,将手中的红线绑成死结,“那又怎样,千年前我独自赴死,留你一人孤寂千年,这一次,上穷碧落下黄泉,瑶儿定不负你。”