《白学余-实时金融数据湖-美化ty-已定稿pptx_compressed.pdf》由会员分享,可在线阅读,更多相关《白学余-实时金融数据湖-美化ty-已定稿pptx_compressed.pdf(29页珍藏版)》请在三个皮匠报告上搜索。
1、实时金融数据湖 中原银行数据银行部 / 白学余 中原银行业务发展概况 蝉联五年金融时报“年度十佳城市商业银行” 2020年银行家全球1000大银行排186名,位列国内上榜银行第31名 2020年财富中国500强,在入围的商业银行中排名第23名 数字化转型实践入选央行金融电子化杂志评选的“2019年金融信息化 10件大事”,全国首家中小银行入选案例。 分行 18家 营业网点 472个 员工总数 1.4万 资产总额 7238亿 河南省唯一省级法人银行 香港联交所主板挂牌上市 科技银行,数据银行 体系架构 #2 背景概况 #1 场景实践 #3 背景概况 #1 数据湖的诞生的业务背景:决策方式变迁 #
2、01 业务分析决策由传统的财务分析逐步转向面向“KYC”; 单纯业务人员做决策转变为越来越多的机器智能来决策。 数据湖的诞生的业务背景:问题分析 离线数据分析(财务) 离线数据分析 数字化营销 客户画像 实时风险决策 多模数据加工 机器学习与人工智能 银行的数据分析面临较大变迁, 从传统面向财务、面向离线分析 逐步转向面向客户、面向实时分 析。 数据驱动 数据湖诞生的技术背景:数仓的变迁 #02 在银行体系下,面向规范化、精准加工的传统数仓体系,能够较好的 解决财务分析等场景,在很长时间内仍会是主流方案。 应用加工层 大众数据应用 数据湖诞生的技术背景:传统数仓架构 公共整合层 公共明细层公共
3、汇总层 基础贴源层 接入层(SDS) 私财数据应用公司数据应用场景数据应用 业务集市层 零售业务集市公司业务集市风险业务集市财务管会集市 内部数据(ODS)外部数据(ODS) 技术特点 精准、规范 多层数据加工 口径统一 T+1数据处理 具备较高的性能 经过长时间积累沉淀 适合财务分析 变更困难 单位存储成本较高 不适合海量日志、行为等变 更频繁,实时性高的数据; 半结构化数据和非结构化数 据兼容差 数据湖诞生的技术背景:数仓的变迁 #03 面向KYC、机器智能的分析,需要支持多类型数据、多时效数据、更加敏捷的 使用、因此需要新的与数据仓库互补的架构体系。 开放性 支持多类型场景,如AI、非结构 化、历史数据,所谓海纳百川。 时效性 具备有效的支持实时分析与 实时决策的体系架构。 融合性 与银行数据仓库具备架构融合, 统一数据视图。 实时金融数据湖的特点 数据汇聚的融合 各种海量、多样数据