大规模实时图计算在 PayPal 风险管理系统的应用

所属专题:金融科技

所属领域: 金融

嘉宾 : (1) 张彭善 | PayPal大数据研发架构师、资深数据科学家 (2) Athreya Gopalakrishna | PayPal NoSQL Engineering Architect/Lead

会议室 : 百宴厅2

讲师介绍

专题出品人:张彭善

PayPal 大数据研发架构师、资深数据科学家

张彭善,2008 年硕士毕业于上海交通大学,2012 年初加入 PayPal Risk Data Science 团队。2013 年初开始研发基于 Hadoop/YARN 的机器学习框架,以满足 PayPal 日益增长的风控大数据的需要。主要负责使用 Hadoop/YARN 实现分布式的神经网络、逻辑回归以及梯度提升树等算法。目前在 PayPal Risk 负责分布式机器学习的框架的研发以及机器学习工程化的端到端的系统平台建设。个人的兴趣主要集中在分布式的计算系统和大规模的机器学习/深度学习方向。

专题演讲嘉宾:Athreya Gopalakrishna

PayPal NoSQL Engineering Architect/Lead

Athreya Gopalakrishna is the NoSQL Engineering Architect/Lead at PayPal specializing in NoSQL databases & High performance storage systems. His responsibilities include – Database architecture, Operations architecture, Solutions engineering, Storage systems, Lifecyle management automations, Athreya lead the NoSQL/Caching technology projects in the past 9 years and was responsible for designing/developing/adopting and operationalizing the technologies at PayPal. Athreya possesses over 19 years of experience in wide range of industry domains like Payments, Billing, Customer Support, Fraud/Risk, Compliance, Database/Storage platforms while having gained expertise in building applications and solutions on Messaging, Micro Services, Caching, Distributed systems, Database and Container technology stacks.

Athreya Gopalakrishna 目前就职于 PayPal,任 NoSQL 工程架构师及主管,主要负责 NoSQL 等高性能存储系统在公司业务系统的实施和架构。他有着非常丰富的 NoSQL/Caching 系统的运维、管理和架构经验,在 PayPal 工作的 9 年期间,他亲自参与了 NoSQL 整体解决方案的演进实施。Athreya 在整个 19 年的职业生涯中一直致力于使用微服务、消息系统、分布式系统、数据库技术等技术去支持支付、风控、合规、客户服务等不同业务场景。

议题介绍

地点:百宴厅2
所属专题:金融科技
所属领域:
金融

演讲:大规模实时图计算在 PayPal 风险管理系统的应用

Aerospike based NoSQL database has been leveraged for data analytical and Fraud detection use cases at PayPal Risk for ~3+ years. With existing Petabytes scale data storage support and more than 99.99+% availability from Aerospike Database Platform, a New Online Graph linking use case was introduced for real-time linking and fuzzy linking data analytical features on AI models. 

To support powerful graph (fuzzy) linking cases for better fraud mitigation, a solution of highly-scalable graph database based on Aerospike/Gremlin graph query language with 50 billion+ vertices/edges will be introduced in this session for both online graph linking cases with high performance and offline graph analytical solution with high throughput requirements. 

PayPal 风险管理部门通过应用基于 data 和 AI 的解决方案检测 PayPal 平台的欺诈交易。从三年前开始 Aerospike 做为主要的 NoSQL 技术被用以快速存取风险管理场景所需要的各种 KV 数据,到目前为止已经有 20+ Aerospike 集群、PB 以上的数据,而且可用性达到了 4 个 9 以上。基于 Aerospike 的良好的性能和稳定性,我们构建了实时的图的连接以及模糊连接查询和计算,用以支持风险管理系统对图连接数据类型的需要。

目前整个实时图计算平台基于 Gremlin 接口抽象,后端存储主要是 Aerospike 但不限于单一的存储解决方案,这有利于在其它不同业务要求下的系统扩展。在其上我们构建了 500 亿以上的点和边的风险管理连接图且可以支持动态(模糊)连接数据的扩展。通过使用异步化、批量化、缓存等优化方法满足实时风险管理在高维多跳的图连接查询和运算的低延迟高吞吐的需求。

听众受益

    1. How Aerospike NoSQL DB has been leveraged at PayPal Risk Fraud Detection Cases;

       PayPal 在欺诈检测场景如何利用 Aerospike 支持 PB 级别实时数据管理;

    2. How to build 50 billion + online linking graph with high query performance latency using Gremlin;

       如果基于 Gremlin 和 NoSQL(Aerospike)支持 500 亿以上的点和边的实时图查询和运算;

    3. How graph linking based data analytical solution, AI models are used for solution in PayPal Risk team.

       PayPal 如何利用实时的图连接运算加强基于数据和 AI 的风险管理能力。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86 17310043226