同样是反欺诈,为何无监督学习你如此优秀

还记得小时候看的动画片《猫和老师》吗?其实欺诈和反欺诈就像是如此,反欺诈方法要随着欺诈方法的变化而变化。但也往往就真的像是动画片里上演的:机灵的Jerry把Tom耍的团团转。

欺诈总是发生在反欺诈之前

由于欺诈模式总是变化多端,而且往往一点手法上的变化和技术的更新,就能产生一种新的欺诈方法。而反欺诈方法却做不到实时升级,一个新的反欺诈检测规则:会有标签积累、计算、分析和测试的过程,这一过程往往需要半个月,有时甚至是几个月的时间。而欺诈行为往往只有几天,甚至几个小时就完成了。

△ 反欺诈检测生效时间

传统反欺诈的方式,会有一段很长的暴露窗口期。也即从发现攻击->生成规则/标签->测试上线这这些环节。蓝色箭头是新模型效果最好的阶段。但是现在欺诈愈发产业化,有专门的情报中心会检测反欺诈系统漏洞,一个刚生成的模式往往很快就失效了。

若想提升反欺诈效果,通常有两种途径:

  1. 是改变上述模型的结构;

  2. 是缩短损失时间。

无监督机器学习重新定义反欺诈模式。

△ 反欺诈检测生效时间

以上各种反欺诈模式中,黑白名单和规则系统仍然是目前使用最为广泛的方式。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。从定义得知,无监督最重要的特性就是将类别未知数据进行处理和分类,也即没有标签。不通过于过去反欺诈只能被动应对欺诈的局面。基于无监督学习的反欺诈方式,不像是猫鼠游戏而更像“病毒与疫苗”的关系。欺诈好比病毒,会因外界环境的改变而发生变异。无监督反欺诈系统的应用,使得人体能出现一种抗体,这得益于抗体的抗毒性。病毒的变异通常不会使得“抗原”发生变化,抗体依然能够成功抵御病毒。

△无监督机器学习和有监督机器学习性能对比

上图展示了无监督学习的效果变化趋势,通过简单的维护,就可以使反欺诈效果保持在一个较高的水平(蓝色曲线)。而在这个过程中,由于无需标签的积累和规则的设定,无监督便充分展现了强大的反欺诈性能。

△无监督机器学习和有监督机器学习启动对比

同时,由于采用无标签的行为聚类,无监督可以实现快速启动(蓝色曲线),也即缩短图1的损失时间段。无监督机器学习只要几个人的行为呈现出了一定的模式(pattern)即可被识别出来,而无需人工标记、规则设定和模型训练。直接缩短检测时间,做到了及时止损。如果说黑白名单、规则系统和有监督学习玩的是猫鼠游戏,那么,基于无监督学习的反欺诈就是能够抵御病毒变异的抗体——既有防御(先验)功能,又有极强的灵活性和团伙普适性。

2018-07-10T14:21:32+00:00 七月 10th, 2018|技术动态|