feedback

意见

反馈

back-to-up

回到

顶部

电信诈骗!恶意套现!盗刷!大数据全力打击这三宗罪

数据侠

· 电信银策

编辑/程一祥   2017-01-19

所有不以业务推动为目的的大数据都是耍流氓。在刚刚结束的第二届上海开放数据创新应用大赛(SODA)中,由上海电信和银联智策两家大数据公司组成的“电信银策联队”,凭借他们在电信诈骗、互联网传销、银行卡套现、银行卡盗刷等领域的大数据解决方案,最终摘取桂冠。数据侠实验室09期中,DT君请来银联智策战略合规总监潘颖杰与上海电信大数据运营中心产品推广经理汪科科,告诉你利用人人都想要的电信和消费大数据,究竟能为我们的日常生活带来哪些突破性的解决方案。

电信和消费大数据,究竟有多大?

汪科科:作为基础的通讯运营商,上海电信的数据都来自我们的用户。我们目前服务了1000万手机用户,500万固网宽带用户,接近300万IPTV电视家庭用户,800万固定电话用户,700万电信账单用户等,我们还有上海地区60%的移动上网行为记录数据。

不仅数据体量太,电信的数据类型也很丰富,包括固网上网行为、移动上网行为、WIFI上网行为、移动用户位、通讯行为等等。这些海量的数据基本囊括了上海通讯数据的方方面面,已经可以做非常多的事情了。

我们目前的应用方向包括通信、电子商务、金融、地产和零售多个方面。其中大数据外部变现上具有代表性的业务包括:基于人口位置信息的智慧城市规划;根据消费人群特征、消费偏好等数据开展的智慧营销;还包括智慧商圈、智慧征信等部分。而且这些都已经有了具体的应用案例。

潘颖杰:银联智策是一家有数据资源、有技术、有情怀、有颜值的“四有”大数据公司(笑)。作为中国银联旗下专业从事大数据分析与服务的子公司,我们拥有的消费大数据涉及全国60亿张银联卡,每年超过300亿笔的刷卡消费交易,数据体量是很庞大的。

那么这些数据可以做什么?这些数据有很大的用处:例如银行贷款的时候,会很关心贷款人的还款意愿和能力,而通过刷卡数据建模而成的“银联智策消费综合评分”系列产品,就可以准确描绘出这些消费人群的画像,帮助银行找到“坏人”、留住“好人”。

除此之外我们还可以通过消费数据提炼出行业指数,洞察行业走向;通过对商圈人群的消费路径分析,可以对商户的选址、商圈的资源有效配置进行辅助决策等。

这两种大数据结合,怎么来对付电信诈骗?

汪科科:电信诈骗,全称应该叫通信金融诈骗,这里面两个关键词,一个是通信、另外一个是金融。一方面,诈骗团伙需要借助电话、互联网等通讯工具与被害人联系;另一方面,完成联络后,他们还要通过刷卡、取现、转账等金融行为实现资金的非法占有。不论诈骗方法多么千变万化,它都无法跳出这两个关键词。

我们把握住这个特点进行产品设计。电信是通讯运营商,可以分析诈骗人的通讯行为;银联智策有银行卡交易数据,能够追踪钱的流向。两家的大数据产品合作构建了电信金融诈骗识别的模型。

在这个模型中,我们以通话行为作为切入口,构建了一个诈骗行为特征模型和两个数据库。当产生通话行为时,系统会首先对电话号码进行甄别,过滤出数据库内的黑名单诈骗、骚扰号码,进行屏蔽。但是有些海外诈骗电话能够通过技术手段对伪装号码,运营商是追溯不到源头的。这时,我们的电信诈骗行为特征模型就会派上用场。

市场上已经有很多对通信诈骗的基本面研究,对诈骗的一般套路方法已经比较了解。我们通过分析犯罪心理、犯罪流程,将通信行为特征、金融转账行为特征等作为构建反欺诈特征模型的变量,设计了这样一个模型。如果某个号码同时符合了我们特征模型中的好几个特征,那么这就很有可能是一个诈骗电话。例如,一个伪装成某政府部分的电话打给用户,用户在较短时间内回拨,随后出现了汇款行为,这明显就是一个诈骗套路。

要完成反通讯电信诈骗模型的闭环,电信和消费大数据的交叉在其中至关重要。

恶意套现手段越来越高明,用大数据有办法抓住他们吗?

潘颖杰:银行卡恶意套现经历了一个进化演变的过程。

过去是大额单笔集中套现。例如在还款日后第一天就把信用卡刷爆。但这种行为比较容易被银行发现。现在的套现行为更多开始模拟正常的交易特征——小额多笔多日期刷卡套现。套现者不再一笔刷很多钱,而是模拟正常消费,每次刷三五百,分好几天刷。

另外,过去用银联卡刷卡消费时,由于手续费率的不同,很多机构在实施套现时,都会选择低扣率的商户,以降低套现成本,套现特征较为明显。但九六费改后,商户类别的扣率统一了,这个特征就会逐渐消失,每一类商户都有可能是套现商户。

更厉害的是,现在市场上出现了一些可以复制周边商户信息的POS机,实施套现时能够不停地改变自己商户的信息和类别,这些高技术套现手段让识别恶意套现的行为变得更加困难。

但魔高一尺,道高一丈。为了应对新的情况,我们通过交叉大数据设计了新的套现识别方案。我们不再只关注商户特征,而是把商户看作一个一个有关联的点连接而成的社交网络,而这些套现商户们往往都是有强关联性的。我们用网络模型的方式把所有商户关联起来,随后经过反复的测试,对模型设定一个有效的阈值,寻找由套现商户构成的小圈子,也就是强关联性的小团体。这些商户往往就可能是套现商户。

加入电信数据后,我们还可以对人和卡进行位置匹配。有相当一部分套现者是不会把卡随身带着的,他肯定是放到某些POS机附近进行套现活动。也就是说通常用来套现的卡是人卡分离的。我们可以将电信位置数据和消费位置数据作为模型中的变量,进行匹配。如果卡和人经常“分居两地”,那这很可能就有问题了。

另外,电信数据还能够帮助识别出POS机的准确位置,帮助更清晰地描绘出套现人群的画像,帮助后续的模型优化。

电信消费大数据结合,还能用来识别银行卡盗刷?

潘颖杰:银行卡盗刷识别模型是消费大数据和电信大数据交叉结合的另一个产品。

随着第三方无卡支付的普及,手机绑定银行卡的情况现在越来越多。目前复制或侧录银行卡技术手段有很多,一旦银行卡被复制或侧录,就会很快发生盗刷的情况。银行卡盗刷每年都会带来上百亿元的经济损失。

我们通过关联消费位置信息和持卡人手机信号定位设计了反银行卡盗刷模型。

在模型中,我们首先从大量的数据库中调用了银行卡的历史交易数据,提炼客户的消费特征。然后对新的交易进行特征判断,对于异常概率超过标准的新交易再进行持卡人常用手机信号定位。如果ATM或POS机的位置和持卡人手机信号的位置超出了一定阈值,模型就会认为,这很可能是笔异常交易。

例如模型检测到某个用户刚在云南进行了一次手机支付,五分钟后又在上海进行了一次刷卡支付,而普通人五分钟是无法从云南移动到上海的。这就有可能是一笔银行卡盗刷的情况。

做一款大数据产品,最重要的是什么?

潘颖杰:做产品就要从市场需求出发。市场有一个需求,我们才会去设计产品来实现它。

但很多时候,面对一些需求,你更需要考虑的是:数据是不是可以实现?数据是不是应该实现?第一个是技术问题,第二个是行业责任了。例如有客户想从我们这里要某品牌的门店销售数据,但没有该品牌的授权,这个能给么?这是一个明确的需求,而且技术上很容易实现,但是我们不能给,出价再高,大数据公司也不应该给,要守住这个底线。

大数据产品化思路其实很简单:首先发现市场需求,然后评估技术上能不能做,数据该不该做,如果应该做而且技术也可以做,那单一数据能不能实现,不能的话要找谁合作。

汪科科:其实大数据在通讯运营商这边起步较早。最初我们主要是解决一些企业的内部问题。当现在需要大数据实现外部变现的时候,它会经历一个螺旋式的上升过程,因为外部客户对大数据本身不够了解,我们设计产品需要贴合原有商业本身的逻辑。

这就好比我有一个矿山,我们是矿山里的人,但现在要直接去跟消费者讲,我会给你生产一个金属制造的酒杯。中间跨过了很多过程。对于我们这些数据源公司来说,怎样让消费者去体会到大数据产品的价值是很关键的一点。我们现在必须从挖矿的动作开始,一直到卖出去这个杯子,把整个动作都做一遍。这对于数据源公司来说是一个很痛苦的过程,但是必须要做。

当我们做了很多案例后,发现大数据已经变成了一种底层能力,就像“互联网+”一样,开始覆盖在各个行业。那大数据产品也就自然会在各领域产生,形成新的产业链。数据就会是其中最核心的部分了。

在数据法律体系不健全的情况下,如何保证普通人的数据安全?

汪科科:信息安全和用户隐私保护是运营商管控非常严格的部分。首先是信息的脱敏,我们内部人员能够处理的数据都是经过加密和脱敏过的。还有一些底线也不能碰:首先是个人信息不能泄露。我们可以做群体报告,但绝不能透露个人信息资料,只有国安、公安等国家有关部分有权限查看;第二,裸数据是绝不能出去的,比如泄露一些电话号码给外部,这都是不行的。信息安全在大数据公司的安保级别往往都是非常高的。

潘颖杰:和电信类似,中国银联对于数据的安全使用有着非常严格的规定,并根据各类数据的敏感度和隐私度,将数据分为了几个层级,凡是涉及单个持卡人或者商户的信息,只有在获得本人明确授权的前提下,才能予以应用。另外,消费流水信息绝对不能泄露,任何违反相关规定的部门或分、子公司,都会受到严厉的惩罚。 

当然,现实的情况是,大数据行业目前并没有明确的上位法,也就是说没有明确法律来规定数据的使用规则的,更多还是靠类似电信或者中国银联自身的制度来规范数据的使用。举个例子,现在很多APP安装前都会要你先同意一个协定,可能没几个人认真看过那个协定,但是当你点击同意后,APP公司就“名正言顺”的占有了你的数据,并可随意使用这些数据。这个时候,你的数据安全可就不受你自己的控制了。如果开发这个APP的公司足够规范,那你的个人数据可能还有些保障,但谁能保证每一家公司在面对巨大的经济诱惑时,都能如此“守身如玉”呢?

不幸的是,客观现实使得你不可能不使用这些APP,因为它们极大地方便了我们的生活。所以这里就要说到一个“度”的问题。比方说有些人在手机上绑定了自己所有的银行卡,那他所有的消费信息都被APP记录在里面了。那如果我们稍微做一些改变,比如只绑定一张卡,保证方便的同时,又只让渡了部分行为数据,可能对于你个人的隐私保护会稍微好一些。虽然损失了一些便利,但是也更安全一点。

当然,我们希望政府能够尽快出台相关上位法,从顶层制度上规范大数据行业的发展。在没有这样的规定出台前,消费者更应该相信谁呢?相比较而言,例如电信、银联智策等这类背靠“国有”数据源的公司还是比较可靠的。在这个市场上,数据源公司体量很大,政府对于其监管也会非常严格,他们通常更有责任和义务去带头规范这个市场,也没有太多的动力去做违规的事情。

事实上,政府在大数据行业开展了大量的调研工作,相信将在不久的将来,会在大数据行业陆续出台各项法律制度,今后数据治理的工作将愈来愈规范,我们的隐私会得到有效的保护,我们对此应该有足够的信心。

数据侠门派

汪科科:上海电信大数据运营中心产品推广经理。目前主要专注金融安全大数据产品构建,以及视频大数据精准营销领域。

潘颖杰:银联智策战略合规总监。中国第一批征信工作者和互联网金融从业者,主导建立了各类征信业的行业标准及信息系统标准。

如何加入数据侠

“数据侠”栏目网罗全球最IN的大数据侠客,利用人工智能、机器学习以及各种前瞻算法,打造理性而酷炫的数据可视化盛宴。过去,我们用文字,视频,图片传达信息。现在,我们用大数据阐述事实及其背后逻辑趋势。

DT时代超级英雄正在组队!你也想要成为成为数据侠吗?请将你脑洞大开的数据作品,发到数据侠联盟盟主程一祥邮箱吧:chengyixiang@dtcj.com。

(了解更多有趣又有料的商业数据分析,欢迎关注DT财经微信公众号“DTcaijing”,下载“DT·一财”APP)

分享这篇文章到