《4-4 图算法在风控以及平台能力建设.pdf》由会员分享,可在线阅读,更多相关《4-4 图算法在风控以及平台能力建设.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、图算法在风控以及平台能力建设汪浩然 互联网行业资深风控和图计算专家01图算法和风控简介图算法和风控简介02图算法在风控的演化图算法在风控的演化03相应平台的心得相应平台的心得04展望未来展望未来目录目录CONTENT图算法和风控简介图算法和风控简介01什么是图算法-图论算法最短路径发现最短路径发现团的识别发现团的识别发现圈的识别发现圈的识别发现什么是图算法-图机器学习标签传播算法标签传播算法图神经网络算法图神经网络算法什么是图算法-图挖掘算法高密度子图发现高密度子图发现邻居域异常邻居域异常度分布模式度分布模式什么是风控互联网风控干什么图算法和风控的相遇“作案”有团伙特性“作案”有相似性“作案”
2、需要大量账号和设备资源配合“作案”具有成本因素物以类聚,人以群分图算法在风控的演化图算法在风控的演化02从规则到算法,从规则到算法,rule writer algorithmic model 从经典一阶的从经典一阶的Velocity变量到图神经网络变量到图神经网络one order velocity neutral net aggregator 从数学严格定义的网络结构到图神经网络从数学严格定义的网络结构到图神经网络strict definition probabilistic inference几个核心趋势经典一阶的经典一阶的Velocity变量变量常见相关变量:最近7天交易笔数最近7天交易
3、金额最近30天交易笔数最近30天交易金额最近7天高危时段交易笔数最近7天高危商品交易笔数1小时内同ip交易用户数最近7天同设备登录用户数设计聚合函数。例如设计聚合函数。例如Min,Max,Mean 来聚来聚合相关设备或合相关设备或IP的各种特征,成为风控因子。的各种特征,成为风控因子。神经网络的聚合神经网络的聚合Aggregator算子的突破算子的突破代表性代表性突破,突破,Deepmind关于聚合函数的研究关于聚合函数的研究相应平台的演化相应平台的演化03业界常用的完成离线图算法和图机器学习算法框架业界常用的完成离线图算法和图机器学习算法框架Push&Pull Sparse&Dense 特殊
4、边概率权重下的拒绝采样特殊边概率权重下的拒绝采样腾讯腾讯Angel图计算图计算-简介简介腾讯腾讯Angel图计算图计算-代码样例代码样例腾讯腾讯Angel图计算图计算-GraphSage实现实现开源图数据库生态完善开源图数据库生态完善DGL+SageMaker+Nebula,快速搭建一个可以线上实时模型查询推理系统快速搭建一个可以线上实时模型查询推理系统社区互动离线数据交易离线数据社区互动流数据交易流数据模型文件生成查询获得子图风控引擎风控因子DGL message passing 角度的编程和实现角度的编程和实现优化,减少通讯和存储开销,利用优化,减少通讯和存储开销,利用GPU特性特性DGL
5、-GPU优化,更多的操作交给优化,更多的操作交给GPU来完成来完成DGL-Adapter 突破突破内存限制,内存限制,少量的通信成本牺牲换取更大的图数据规模训练能力。少量的通信成本牺牲换取更大的图数据规模训练能力。clientserverworkerworkerworkerworkerDGL接口GetBatch 接口Batch采样结果Load Partition子图采样子图采样展望未来展望未来04图算法和图神经网络算法的融合图算法和图神经网络算法的融合图图神经网络算法学习能力的攻克神经网络算法学习能力的攻克图图神经网络算法鲁棒性神经网络算法鲁棒性图图神经网络算法可解释性神经网络算法可解释性平台平台易用性和易用性和整合性整合性应用算法和系统算法上下融会贯通和统筹应用算法和系统算法上下融会贯通和统筹非常感谢您的观看