上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

1-5 Apache Doris 在同程数科数仓建设中的实践.pdf

编号:102443 PDF 25页 1.85MB 下载积分:VIP专享
下载报告请您先登录!

1-5 Apache Doris 在同程数科数仓建设中的实践.pdf

1、王星 同程数科 大数据高级工程师|Apache DorisApache Doris在同程数科数仓建设中的实践在同程数科数仓建设中的实践0101目录目录CONTENT|业务场景业务场景架构演变架构演变收益现状收益现状未来展望未来展望030302020404 业务场景01|业务场景-企业介绍|同程数科同程数科 同程集团旗下的旅游产业金融科技服务平台。前身为同程金服,成立于2015年11月。愿景是,以“数字科技引领旅游产业”。以科技的力量,赋能旅游产业。业务包含:产业金融服务、消费金融服务、金融科技、数字科技等板块。累计服务用户超过千万,涵盖76座城市。业务场景-业务介绍|业务场景-业务需求|基于基

2、于DorisDoris实现实现 看板类:业务实时驾驶舱;T+1业务看板 预警类:实时业务流程预警(比如:风控熔断、资金异常、流量监控)分析类:数据查询分析;临时取数;实时用户标签查询 财务类:财务清算对账;支付对账 架构演变02|架构演变-架构1.0|架构演变-架构1.0|不足不足 引入组件过多,(组件、作业)维护复杂,问题排查困难,数据修复困难 数据开发链路过长,对数仓人员技术要求高,开发效率低 聚合查询能力不足,大表join效率不高 离线与实时集群未做分离,导致资源相互竞争 有预警能力,但是作业自动恢复能力不足优点优点 使用CDH构建,在现有CDH集群下,能够快速相互集成并投入使用 实时采

3、集能够可视化配置式开发架构演变-架构2.0|架构2.0-选型Doris|选型原因选型原因 丰富的数据接入能力(支持众多数据源)采用MySQL协议通信 Doris SQL基本覆盖MySQL语法 支持MPP并行计算能力 官方文档健全,上手较快架构2.0-Doris部署架构|DorisDoris架构特点架构特点 独立于Hadoop架构之外 整体分两层:FE(前端节点)、BE(后端节点)运维简便,高可用,可扩展性强机房迁移机房迁移 doris集群,3天全部迁移完成 时间主要用在了,机器下架、搬移、上架Doris实时系统架构|产业金融消费金融风控数据日志数据Canal其它数据API接口数据平台数据源数据

4、源数据采集数据采集消消息息队队列列KafkaKafka数据仓库数据仓库DWD(明细层)DWS(汇总层)ADS(应用层)DIMCanal-Admin实时开发任务调度任务监控数据质量集群监控数据应用数据应用实时看板挖掘分析数据服务Doris新数仓特点|1 1、数据导入方式简便,针对不同场景数据采用方式如下:、数据导入方式简便,针对不同场景数据采用方式如下:1、routine load:业务数据实时接入Doris 2、broker load:离线数据定时或手工导入Doris(包含:基础维度表、历史数据等)3、insert into:定时作业,从DWD层处理出DWS层,之后处理出ADS层2 2、良好的

5、数据模型,使开发效率更高、良好的数据模型,使开发效率更高 1、unique模型:业务数据接入Doris时使用,防止重复采集 2、aggregate模型:从DWD层到DWS或ADS层使用3 3、使用门槛低,查询效率高、使用门槛低,查询效率高 1、基于MySQL协议,标准的SQL查询语法,查询分析无压力 2、使用物化视图到达预计算效果,如果查询命中,将快速响应4 4、部署架构简便,运维维护成本低、部署架构简便,运维维护成本低 1、针对FE、BE、BROKER角色,配置监控,异常重启如何更友好的使用Doris|大家在意什么大家在意什么 1、快速开发:如何能够简单快速的将数据导入Doris,并快速实现

6、ETL开发 2、调度管理:如何管理上线的任务,保证任务调度的稳定,以及调度恢复能力 3、数据查询:生产与办公网络隔离,如何让大家安全便捷的查询分析 4、集群管理:如何感知节点异常,并且能够重试自动恢复宗旨:宗旨:高效率、高质量、高稳定高效率、高质量、高稳定数据平台-Doris开发|1 1、DorisDoris数据开发,通过快速构建代码,实现数据开发,通过快速构建代码,实现routine loadroutine load、broker loadbroker load任务开发任务开发数据平台-Doris开发|2 2、routine loadroutine load、broker loadbroke

7、r load、常规任务提交或测试、常规任务提交或测试数据平台-Doris调度与监控|3 3、针对、针对routine loadroutine load、broker loadbroker load进行调度查看;进行调度查看;routine loadroutine load可持续监控;可持续监控;broker loadbroker load与常规任务有失败预警与常规任务有失败预警数据平台-Doris数据查询|4 4、自研查询页面,同时集成、自研查询页面,同时集成Doris HelpDoris Help帮助功能帮助功能数据平台-Doris集群监控|5 5、针对、针对FEFE、BEBE、BROKER

8、BROKER节点监控,异常自动提醒节点监控,异常自动提醒 收益现状03|新架构收益|基于基于DorisDoris架构收益架构收益数据接入:新架构数据接入代码可快速构建,3-5分钟完成一个接入。老架构手工部分比较多。接入一张表需要20-30分钟数据开发:doris自带unique、aggregate模型,能够加速ETL开发过程。老架构数据ETL过程没有底层数据模型支撑,很多处理逻辑需要自行开发数据查询:基于doris新架构带有物化视图或Rollup物化索引提升查询效率。同时大表join时doris内部提供很多优化机制数据报表:基于doris的查询展示,报表相应速度基本在秒级或毫秒级响应环境维护:没有hadoop数仓环境复杂,整个平台链路方案清晰。同时doris集群的运维成本远低于hadoop集群运维(迁移一次就懂了)未来展望04|未来展望|规划规划 1、尝试引入Doris Manager对集群进行维护和管理 2、实现基于Flink CDC方式的数据接入。这是我们3.0架构的规划,估计很多小伙伴已经实现了 3、对现有Doris集群进行升级,使用新特性,更快速响应需求 4、针对“指标管理体系”、“数据质量监控体系”进行强化建设感谢您的观看感谢您的观看|

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(1-5 Apache Doris 在同程数科数仓建设中的实践.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部