上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

中源数聚:2018大数据推动金融风控升级(23页).pdf

编号:65970 PDF  PPTX  23页 747.82KB 下载积分:VIP专享
下载报告请您先登录!

中源数聚:2018大数据推动金融风控升级(23页).pdf

1、1大数据推动金融风控升级中源数聚出品2CONTENTS目录理解金融科技价值开发金融风控模型0102创新金融风控体系033PART1理解金融科技价值4近几年,银行业的不良贷款规模和不良贷款率大幅攀升资料来源:管理大数据4.34.34.95.98.412.715.129.61.1 1.0 1.0 1.0 1.3 1.7 1.7 2.0 - 0.5 1.0 1.5 2.005000162020E不良贷款余额(千亿人民币)不良贷款率(%)2010-2016年,商业银行不良贷款规模和不良贷款率近年来,中国宏观经济正面临严峻挑战,银行业不良

2、资产规模迅速攀升。截至2016年第四季度,商业银行不良贷款余额达15122亿元,预计到2020年,这一数字将上升至3万亿元。年增速18%5非银金融机构的潜在不良资产也浮出水面资料来源:管理大数据2.43.04.66.97.88.29.418.30.05.010.015.020.02000162020E2010-2016年,非银金融机构不良贷款规模(千亿人民币)年增速18%非银金融近年来也迎来了蓬勃发展,但由于其业务“高风险、高收益”的特性突出,加之风控方面相对薄弱,因而面临的不良资产风险更甚于商业银行。预计2020年非银不良贷款规模将达到约1.8万亿

3、元。6现在金融科技来了,它将改变传统金融模式资料来源:管理大数据 互联网金融仅是匆匆过客,金融科技才是终极风口。互联网科技 互联网科技仅仅只是一把尖刀,只会对金融行业进行漫无目的分解,最终不仅让人大汗淋漓,而且无法真正解决金融行业本身的痛点和难题。 以风控为例,互联网金融时代之所以会有诸多乱象主要是因为行业和用户发生了变化而风控方式没有发生改变所导致的。金融科技 真正与金融行业深度融合的金融科技则具备破解金融行业痛点和难题的潜质,并有望将金融行业的发展带入到一个全新的发展阶段。 通过将大数据、智能科技的手段应用到金融行业的风控环节当中就能够达到这样的效果,海量的数据样本为我们提供了丰富的用户和

4、项目标本,通过这些数据,我们不仅能够实现用户与项目的完美对接,而且能够让预判到项目的风险等级,提前对项目运行做出预判,提升金融行业的安全性。而智能科技的应用则能够减少人力成本,提升金融行业的运行效率,通过建立智能风控的模型,我们用智能机器人或智能模型来代替大部分的人工,从而进一步提升金融行业的效率。7金融科技正在推动金融服务领域创新与重塑资料来源:管理大数据改变玩法1 将移动装置、社交媒介、分布式分类帐系统等技术和新方法应用于金融服务领域 如:加密货币、智能合约、机器学习/人工智能工具,运用社交网络来预测市场动向挑战中介2 运用新技术和新工具,旨在通过金融脱媒,提高客户独立性 如:买方对买方网

5、络、P2P外汇和贷款平台、帮助投资者自主进行交易决策的认知智能工具改良赋能3 帮助金融机构克服传统的结构性障碍和工作流程挑战 如:更好触达,更好运营,更好体验客户关系管理工具供应商、债券匹配代理商、KYC/AML(了解你的客户/反洗钱)工具、分析、监控和网络安全工具改变玩法型企业将成为颠覆式创新的重要组成力量颠覆式创新的业务模式将逐渐成为金融机构核心业务模式的重要推动因素8金融科技应用主要覆盖八大领域支付数据&分析保险借贷/众筹区块链投资&交易规划安全支付处理,转帐,移动支付,外汇,信用卡,预付费卡,奖励计划大数据解决方案,数据可视化,预测分析,数据提供商经纪,承保,理赔,风险管理工具众筹平台

6、,社交借贷,抵押&企业贷款区块链协议开发,数字货币,智能合同,区块链支付&结算,资产&身份管理投资管理,机器人咨询,交易定价&算法,交易IT,交易平台,经纪,清算业务流程自动化,客户关系管理,合规&了解客户,库存&供应链管理数字身份,身份验证,欺诈管理,网络安全,数据加密9金融科技涵盖大数据、人工智能等更高层次技术资料来源:管理大数据人工智能大数据互联技术移动互联物联网分布式技术云计算区块链安全生物识别加密10金融大数据在信贷领域有广泛的应用,重点是风控资料来源:管理大数据 大数据覆盖信贷领域各个流程,重点是获客、身份验证和授信环节 获客环节建立用户画像跟踪用户完整生命周期 身份验证环节,通过

7、活体识别等技术解决申请人是否本人的问题,关联分析则是利用图关联技术,找出欺诈团伙 授信环节汇聚多方数据源,通过建模进行风险定价,金融科技服务商输出信用评分给机构使用获客身份验证授信贷中监控贷后管理用户画像智能营销智能客服生命周期管理反欺诈活体识别关联分析风险定价信用评分交易反欺诈智能催收11大数据与其它技术的融合将显著提升风控效果资料来源:管理大数据大数据风控数据算法算力AI技术提升算法能力云计算增强计算能力物联网和区块链解决数据问题 大数据、AI技术的融合和优化,提升大数据风控 活体识别、OCR、声纹识别、虹膜识别等多种技术融合,提供更加全面的身份识别,降低欺诈风险的发生 通过算法调优和计算

8、能力提升,半监督学习等技术正在应用到反欺诈等风控场景,降低对专家经验和数据的依赖 区块链技术使数据共享成为可能,彻底解决数据孤岛问题 区块链技术解决了数据共享的信任问题,规定了数据使用的边界,保证了数据的一致性。通过区块链建立多方数据共享平台,解决数据孤岛问题,将降低金融机构获取数据的门槛与成本 物联网提供线下数据,丰富数据纬度 通过传感器等设备采集线下数据,如车联网数据,将丰富车险驾驶行为数据维度,从而实现风险定价 建立金融云平台,毫秒级响应 通过金融云平台,金融机构可以处理PB级数据,同时应对百万流量,极大提高风控系统的响应速度12PART2开发金融风控模型13贷款违约预测模型-总体架构资

9、料来源:管理大数据贷款违约预测模型3.1特征衍生3.2特征抽象3.3特征缩放3.4特征选择4.1处理样本不平衡4.2构建分类器进行训练5.1交叉验证+搜索调优参数5.2性能评估1. 场景解析2. 数据预处理3. 特征工程4. 模型训练5. 模型评估与优化1.1项目背景1.2场景分析2.1数据获取2.2缺失值处理2.3数据过滤 以贷款违约预测为例,开发金融大数据风控模型。14贷款违约预测模型-1.场景解析资料来源:管理大数据1.1项目背景 作为一家个人对个人的借贷公司-ABC公司成立于2006年。与传统借贷机构最大的不同是,ABC利用网络技术打造的这个交易平台,直接连接了个人投资者和个人借贷者,

10、通过此种方式,缩短了资金流通的环节,尤其是绕过了传统的大银行等金融机构,使得投资者和借贷者都能得到更多实惠、更快捷。对于投资者来说可以获得更好的回报,而对于借贷者来说,则可以获得相对较低的贷款利率。 本项目通过利用P2P平台Lending Club的贷款数据,进行机器学习,构建贷款违约预测模型,对新增贷款申请人进行预测是否会违约,从而决定是否放款。1.2场景分析 贷款申请人向ABC平台申请贷款时,业务平台通过线上或线下让客户填写贷款申请表,收集客户的基本信息,这里包括申请人的年龄、性别、婚姻状况、学历、贷款金额、申请人财产情况等信息,通常来说还会借助第三方平台如征信机构的信息。通过这些信息属性

11、来做线性回归 ,生成预测模型,业务平台可以通过预测判断贷款申请是否会违约,从而决定是否向申请人发放贷款。 通过用户的历史行为(如历史数据的多维特征和贷款状态是否违约)来训练模型,通过这个模型对新增的贷款人“是否具有偿还能力,是否具有偿债意愿”进行分析,预测贷款申请人是否会发生违约贷款。这是一个监督学习的场景,采用逻辑斯谛算法开发两分类模型。15贷款违约预测模型-2.数据预处理资料来源:管理大数据2.1数据获取2.2缺失值处理2.3数据过滤 首先,通过内置包读取数据-data = pd.read_csv(LoanStats_2017Q2.csv , encoding=latin-1,skipro

12、ws = 1) 其次,我们查看变量缺失值的情况-objectColumns = loans.select_dtypes(include=object).columnsloansobjectColumns.isnull().sum().sort_values(ascending=False)用pandas.fillna()处理文本变量缺失值,为分类变量缺失值创建一个分类“Unknown”对数值型变量的缺失值,我们采用均值插补的方法来填充缺失值 第三步,对数据进行过滤,将重复性属性或对构建预测模型没有意义的属性进行删除-objectColumns = loans.select_dtypes(inc

13、lude=object).columnsvar = loansobjectColumns.columnsfor v in var:print(nFrequency count for variable 0.format(v)print(loansv.value_counts()loansobjectColumns.shape16贷款违约预测模型-3.特征工程资料来源:管理大数据3.1特征衍生 特征衍生是指利用现有的特征进行某种组合生成新的特征。在风险控制方面,传统银行获得企业的基本财务报表(资产负债表、利润表以及现金流量表),借助于现代成熟的财务管理体系,在不同业务场景的需求下,利用企业财务报

14、表各种项目之间的组合,就可以衍生不同新特征反映企业不同的财务状况3.2特征抽象 特征抽象是指将数据转换成算法可以理解的数据-def coding(col, codeDict):colCoded = pd.Series(col, copy=True)for key, value in codeDict.items(): 3.3特征缩放 特征缩放是指将变量数据经过处理之后限定到一定的范围之内。特征缩放本质是一个去量纲的过程,同时可以加快算法收敛的速度。目前,将不同变量缩放到相同的区间有两个常用的方法:归一化和标准化3.4特征选择 特征选择是从给定的集合中选择出相关特征子集的过程。通常来说,对特征集

15、合做选择主要有2个原因:首先,优先选择与目标相关性较高的特征,不相关特征可能会降低分类的准确率。其次,去除不相关特征可以降低学习的难度17贷款违约预测模型-4.模型训练资料来源:管理大数据4.1处理样本不平衡 非平衡样本常用的解决方式有2种:1、过采样,增加正样本使得正、负样本数目接近,然后再进行学习。2、欠采样,去除一些负样本使得正、负样本数目接近,然后再进行学习。本次处理样本不平衡采用的方法是过采样,具体操作使用SMOTE-sm = SMOTE(random_state=42) X, y = sm.fit_sample(X, y)print(通过SMOTE方法平衡正负样本后)n_sampl

16、e = y.shape0n_pos_sample = yy = 0.shape0n_neg_sample = yy = 1.shape0print(样本个数:; 正样本占:.2%; 负样本占:.2%.format(n_sample, n_pos_sample / n_sample, n_neg_sample / n_sample)4.2构建分类器进行训练 先初始化分类器,然后查看预则结果的准确率,接着借助混淆矩阵进一步比较。混淆矩阵会对分类器产生不同类型的正误数量的统计,为了更加直观,我们对混淆矩阵进行可视化。热图颜色越浅代表数量越多。根据混淆矩阵,我们可以分别计算precision、reca

17、ll、f1-score的值,这里我们采用sklearn.metrics子模块classification_report快速查看混淆矩阵precision、recall、f1-score的计算值。-from sklearn.metrics import roc_auc_scoreroc_auc1 = roc_auc_score(y, predicted1)print(Area under the ROC curve : %f % roc_auc1)18贷款违约预测模型-5.模型评估与优化资料来源:管理大数据5.1交叉验证+搜索调优参数 采用交叉验证法划分数据集,将数据划分为3部分:训练集、验证集

18、和测试集。让模型在训练集进行学习,在验证集上进行参数调优,最后使用测试集数据评估模型的性能 模型调优我们采用网格搜索调优参数,通过构建参数候选集合,然后网格搜索会穷举各种参数组合,根据设定评定的评分机制找到最好的那一组设置5.2性能评估 根据模型在不同参数组合下跑出的分数热力图,来寻找参数调优的方向,进一步选择更优的参数。而实际操作中,模型调参是一个反复迭代的过程。接下来,使用经过训练和调优的模型在测试集上测试 经过对模型进行训练和参数调优后,模型的精确率表现更稳定,同时模型的准确率和AUC分数都有很大的提升19PART3创新金融风控体系20创新金融风控体系分三步走资料来源:管理大数据完善标准

19、优化制度创新流程21完善金融大数据标准资料来源:管理大数据 基础类标准对金融业大数据标准体系的适用范围、目标进行界定。基础类标准包括术语、标准化工作指南、从业人员基本要求和大数据能力成熟度评价指标等4个子类。 术语子类标准用于规范和统一各类专业名词。标准化工作指南子类标准明确金融业大数据标准化工作的任务、标准体系、以及标准编制、实施和改进的主要内容和基本要求。从业人员基本要求和大数据能力成熟度评价指标用于对开展数据管理工作的人员、金融机构提出基础性和框架性要求。基础类标准 业务类标准从金融监管、金融服务视角,按照不同的大数据分析应用场景,对传统金融机构、互联网金融企业、以及其他外部单位需要报送

20、或共享的数据范围和格式进行规范,使数据采集、数据传输、数据处理等各环节的使用者对数据的含义、标识、用途等有统一的理解。 根据不同的大数据分析应用场景,业务类标准包括综合统计业务子类、反洗钱业务子类、征信业务子类、资管业务子类和其他子类等。业务类标准 治理类标准用于指导金融机构开展将数据治理工作,以确保数据资产能长期有序地、可持续地得到管理。治理类标准应该是一套经过行业实践检验的最佳方法论,它包括两个维度的内容:组织架构和治理领域。 组织架构子类用于规范金融机构大数据战略、组织架构、制度和流程等。数据治理领域包括数据标准、数据模型、元数据、数据生命周期、数据安全、数据架构、数据质量等。治理类标准

21、 技术类标准用于指导金融行业开展大数据基础平台建设。技术标准主要包括通用架构、关键技术、接口规范和安全规范。 通用架构子类标准用于指导大数据平台架构设计。关键技术子类包括数据采集、存储、清洗、分析挖掘、可视化、安全与隐私保护等环节的技术实现。接口规范定义大数据基础平台的接口技术要求。安全规范为大数据基础平台及上层大数据应用子系统的安全建设、系统测评和安全运维提供支撑。技术类标准22优化风控管理分类制度资料来源:管理大数据级别性质主要特征风险管理举措1优秀持续现金分红,股权具有流动性,投资成本已经部分回收,行业和企业基本面无明显不利变化趋势,持有价值大于或等于预期回报出售或投机性持有,寻求最佳变

22、现机会2良好股权尚未获得流动性,行业和企业的基本面无不良变化趋势积极配合企业实现业务发展目标,促进企业上市,或探寻其他获得流动性的机会3关注无论股权是否已获得流动性,行业或企业基本面发生了不利变化,并在当期会明显影响经营结果积极与大股东及管理层研究对策,投入必要的资源和采取必要的措施来控制不利局面的进一步发展4预警上述不利趋势已成为不利结果,公司业绩受到影响,但仍有可能扭转除上述3的措施以外,每月与大投东和管理层交流,监控公司运行情况5损失上述问题的程度持续发展,部分损失已不可逆转除上述4的措施外,计提减值准备产业基金的五级分类风险管理制度(示范)23创新金融风控管理流程资料来源:管理大数据以消费金融风控管理流程为例:用户APP/HS业务前端业务系统执行平台规则执行配置平台特征工厂数据加工及处理规则配置风控专家标准特征第三方数据用户申请信息APP授权信息埋点采集信息第三方数据整合执行结果风控策略

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(中源数聚:2018大数据推动金融风控升级(23页).pdf)为本站 (奶茶不加糖) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部