近些年来,金融业务随着大数据、云计算以及人工智能等技术的发展而日新月异,在移动支... 展开 >
张彭善,2008 年硕士毕业于上海交通大学,2012 年初加入 PayPal Risk Data Science 团队。2013 年初开始研发基于 Hadoop/YARN 的机器学习框架,以满足 PayPal 日益增长的风控大数据的需要。主要负责使用 Hadoop/YARN 实现分布式的神经网络、逻辑回归以及梯度提升树等算法。目前在 PayPal Risk 负责分布式机器学习的框架的研发以及机器学习工程化的端到端的系统平台建设。个人的兴趣主要集中在分布式的计算系统和大规模的机器学习/深度学习方向。
近些年来,金融业务随着大数据、云计算以及人工智能等技术的发展而日新月异,在移动支付、信用生活、信贷、保险等诸多金融产品领域使普通大众收益。随着监管的深入以及第一波互联网金融的风口褪去,行业也日益向更加理性和健康的方向发展。本专题通过众多金融科技的案例,从云计算、数据平台、智能技术切入到具体的金融业务和产品,带领大家一起领略科技在革新这个行业所迸发出来的能量,为大家提供更多金融科技发展的可能性及创新灵感。
蚂蚁金服在 AI(人工智能)方面的技术演进经历了“从无到有”,再“从有到无”的过程,这个“无”是指“无处不在”。目前,AI 已赋能支付宝、财富、保险、消费信贷、安全等几乎所有的业务,同时 AI 团队逐步将重心从业务支撑提升到金融智能中台能力建设,打造了包括搜索、视觉、NLP、知识图谱、智能标注、机器学习算法库等一系列具备金融特色的 AI 中台能力。
“数据和特征决定了模型效果的上限”,AI 的智能化效果很大程度上取决于高质量的数据。蚂蚁金服作为金融科技公司,如何高效、高质、安全的处理海量数据,面临诸多挑战。本专题将围绕金融级智能中台数据底座的构建过程,探讨人工智能在蚂蚁金服内部的具体实践。
1. 如何打造一套智能、安全的智能中台数据底座;
2. 开发工程师如何融入 AI 的浪潮,提升自身能力的同时克服业务挑战。
Aerospike based NoSQL database has been leveraged for data analytical and Fraud detection use cases at PayPal Risk for ~3+ years. With existing Petabytes scale data storage support and more than 99.99+% availability from Aerospike Database Platform, a New Online Graph linking use case was introduced for real-time linking and fuzzy linking data analytical features on AI models.
To support powerful graph (fuzzy) linking cases for better fraud mitigation, a solution of highly-scalable graph database based on Aerospike/Gremlin graph query language with 50 billion+ vertices/edges will be introduced in this session for both online graph linking cases with high performance and offline graph analytical solution with high throughput requirements.
PayPal 风险管理部门通过应用基于 data 和 AI 的解决方案检测 PayPal 平台的欺诈交易。从三年前开始 Aerospike 做为主要的 NoSQL 技术被用以快速存取风险管理场景所需要的各种 KV 数据,到目前为止已经有 20+ Aerospike 集群、PB 以上的数据,而且可用性达到了 4 个 9 以上。基于 Aerospike 的良好的性能和稳定性,我们构建了实时的图的连接以及模糊连接查询和计算,用以支持风险管理系统对图连接数据类型的需要。
目前整个实时图计算平台基于 Gremlin 接口抽象,后端存储主要是 Aerospike 但不限于单一的存储解决方案,这有利于在其它不同业务要求下的系统扩展。在其上我们构建了 500 亿以上的点和边的风险管理连接图且可以支持动态(模糊)连接数据的扩展。通过使用异步化、批量化、缓存等优化方法满足实时风险管理在高维多跳的图连接查询和运算的低延迟高吞吐的需求。
1. How Aerospike NoSQL DB has been leveraged at PayPal Risk Fraud Detection Cases;
PayPal 在欺诈检测场景如何利用 Aerospike 支持 PB 级别实时数据管理;
2. How to build 50 billion + online linking graph with high query performance latency using Gremlin;
如果基于 Gremlin 和 NoSQL(Aerospike)支持 500 亿以上的点和边的实时图查询和运算;
3. How graph linking based data analytical solution, AI models are used for solution in PayPal Risk team.
PayPal 如何利用实时的图连接运算加强基于数据和 AI 的风险管理能力。
互联网金融产品的个性化营销,是互金领域继风控、反欺诈、信用建模之后,又一个非常重要的研究课题。与搜索广告、电商推荐一样,金融产品个性化营销也是以“触达”到“转化”为业务目标,但不同的是,金融行业大数据面临着更长的用户决策周期,更稀疏的用户行为,及互金市场瞬息万变情况下更缺失的历史反馈样本。在这种情况下,我们以互金行业的领域知识为基础,充分挖掘海量用户的多头借贷、差异化额度/利率、周期性复贷等大数据的业务价值,将经典的 Matching + Ranking 的推荐算法框架应用到互金营销领域,同时,将搜索排序中的 query-doc base 的 learning to rank 模型转化为 campaign-user base 的营销排序模型,将深度学习结合 attention 机制挖掘用户差异化的金融产品需求偏好,用半监督结合数据增广的方式解决金融域的样本稀疏问题,并通过 uplift model 挖掘用户对营销触达方式的敏感度,一整套的 AI 解决方案正通过同盾大数据平台服务于互金行业的各类型客户中。
1、 campaign-user base 的营销排序模型如何挖掘营销长尾人群;
2、 uplift model 挖掘用户对营销触达方式的敏感度,助力营销 ROI 大幅提升;
3、 深度学习结合 attention 机制如何挖掘用户差异化的金融产品需求,及感知用户的需求转移和变化;
4、 半监督结合数据增广的方式如何解决金融域的样本稀疏问题。
主要介绍度小满金融(原百度金融)对去中心技术现在的认知和未来的思考,同时 2016年以来我们应用实践的一些经验和教训。包括 4 大块:
1. 下个十年:技术演进开始进入去中心化时代
从服务器单机,PC,集群,云计算,移动互联网,IoT,去中心化技术,介绍技术演进背景、特点、趋势和前景;
重点介绍去中心化技术(特别是 2016 年以来)其他简单介绍;
特别是对分布式技术与去中心化技术的对比和如何演进做个对比介绍。
2. 互金面对去中心化技术趋势的应对
互金的业务特点、需求,特别是国内互金的业务;
去中心化对金融而言的利好(打破现有业务壁垒的机会,技术带来的模式改变,技术来带的成、效改变);
利弊:潜在业务技术(风险,成本)、监管、历史阻力和壁垒;
国内外互金行业所有工作的整体介绍。
3. 基于度小满互金业务(信贷,理财,金融科技)特性,我们怎么用去中心技术去尝试解决互金问题,提升互金业务上的实践
首先整体实践应用概况介绍,接下来方案介绍按照互金业务”用户-产品-资产-平台“从外到内的思路,各层遇到的哪些困难,我们尝试用区块链继续解决;
挑战与方案1:互金用户的获客与经营。去中心化激励应用进行解决去中心化技术平台化与产品化;
挑战与方案2:跨产品线、跨业务、跨公司业务的权益数字化与协同进化问题;
挑战与方案3:去中心技术实现底层金融资产的穿透打通,困难和收益;
挑战与方案4:如何实现去中心化平台化,提升技术应用能力和业务支撑能力。
4. 即将到来的技术发展方向我们的判断
后续的整体规划;
我们进行中一些前沿工作介绍(跟业务,DeFi,数字货币)。