Spark +AI | DataVisor 出席尖端大数据大会,独家分享深度学习反欺诈应用方案

2018年6月4-6日,由 Databricks 主办的 Spark + AI 2018年度峰会在旧金山召开,DataVisor 受邀参加大会,并分享关于“深度学习在反欺诈行业中的应用”。该峰会是顶尖大数据社区 Apache Spark 一年中最大的峰会活动,自然是干货不少。除了不少业界大牛会带来精彩绝伦的分享以外,还更加关注如何运用崭新的大数据技术使得机器学习更好落地于应用。而 DataVisor 不但是首个将人工智能应用于反欺诈行业中的企业,也是早期支持 Spark 大数据平台的企业之一。     

演讲主题

企业如何使用最新的深度学习技术来防御大型的在线团伙欺诈? DataVisor 的 Yen 和 Arthur 分享了一个实时可扩展的在线欺诈检测解决方案,该解决方案便是由深度学习技术支持。深度学习越来越受欢迎,却主要应用于计算机视觉和自然语言处理领域。 Yen 和 Arthur 讨论了DataVisor 如何将深度学习应用于安全和欺诈检测之中,以及它为何胜过传统的黑名单和相比其他机器学习又有那些优势?以下是会议摘要:

会议摘要:

在这里,我们介绍一种实时,可扩展的在线欺诈检测解决方案,由深度学习技术支持。如今,大多数深度学习应用都在计算机视觉和自然语言处理等的几个领域中。而我们当前的解决方案是少数几个将深度学习模型应用于安全问题的解决方案。我们的研究结果表明,深度学习解决方案显著地突破了传统的黑名单检测和其他机器学习方法在 TB 级数据处理规模的限制。

方案演示

在线欺诈主要是由欺诈分子发起的团伙欺诈。团伙欺诈都是通过大规模操纵恶意帐户进行,无论是重新创建还是通过劫持用户获得,都会现有线上服务发起攻击以获得收益。现有的欺诈解决方案要么依靠信誉列表阻止已知的可疑活动,要么需要人工分析师进行大量的特征设计以进行模型培训。这些方法无法应对不断变化的欺诈模式也无法处理大规模的数据量。在 DataVisor,我们分析了全球在线服务的数十亿帐户的活动,以检测欺诈和滥用行为。这些数据为我们提供了对于在线欺诈情况的独特见解,使我们能够全面应对团伙欺诈攻击。

方案演示

我们的深度学习解决方案基于在线上服务中收集的数字信息,包括IP地址、用户代理字符串、邮箱、用户昵称等。我们构建了一个通用的欺诈检测框架,以识别日志数据中的欺诈活动(这些常用数字信息的全部或子网)。通过利用这些常用的数字信息,模型并不需要知道数据源自哪些特定的程序和服务。我们所研究深度学习 pipeline 的设计与实现是基于  Spark 和 Tensorflow 框架,以满足于多种云平台和实时分析的产品要求。我们还展示了我们的检测系统如何超越传统解决方案,包括黑名单和一般机器学习方法。

关于 Arthur Meng

担任 DataVisor 算法平台团队的技术主管。 负责包括构建机器学习基础结构,开发深度学习算法以及改进用于欺诈检测的无监督机器学习算法等方面。 在 DataVisor 之前, Arthur Meng 在斯坦福大学获得博士学位,他的作品发表在 Nature,Nature Communications 等著名科学期刊中。

Ting-Fang Yen  

担任 DataVisor 的研究主管。 她的工作方向在于在线威胁检测,包括恶意软件、恶意内部人员和入侵以及在线欺诈。 她的研究已形成产品方向,并在顶级行业和学术安全会议上发表。 她曾担任 RSA 实验室首席研究科学家和 E8 Security 威胁科学家。 Yen 获得卡内基梅隆大学博士学位。

2018-08-06T14:36:14+00:00 六月 22nd, 2018|技术动态|