1、Apache Flink Community China 严禁商业用途 基于Flink+Iceberg构建企业级实时数据湖 胡争 阿里巴巴 / 技术专家 Apache Flink China Meetup 深圳 2020年09月26日 Apache Flink Community China 严禁商业用途 目录 01 数据湖背景介绍02Flink数据湖业务场景介绍 03 为何选择Iceberg 05 社区未来规划 04 Flink+Iceberg流式入湖 Apache Flink Community China 严禁商业用途 数据湖背景介绍 PART 01 Apache Flink Commu
2、nity China 严禁商业用途 数据湖数据湖 存存储储原始数据原始数据 结构化数据 半结构化数据 非结构化数据 二进制数据(图片等) 完善的数据管理完善的数据管理 多种数据源接入 数据连接 Schema管理 权限管理 多种多种计计算模型算模型 批处理 流计算 交互式分析 机器学习 灵活的底灵活的底层层存存储储 S3/OSS/HDFS Parquet/Avro/Orc 数据缓存加速 Apache Flink Community China 严禁商业用途 数据湖和数据数据湖和数据仓库仓库 Apache Flink Community China 严禁商业用途 开源数据湖架构开源数据湖架构 廉价
3、、弹性可扩展的分布式文件系统层 数据加速层,提供本地数据缓存和元数据加速服务。 Table Format层,提供面向用户的表级语义。 计算引擎层。多种计算引擎满足不同的分析需求。 Apache Flink Community China 严禁商业用途 Flink数据湖业务场景介绍 PART 02 Apache Flink Community China 严禁商业用途 场场景一:构建景一:构建实时实时Data Pipeline 原始表原始表提提纯纯后的数据后的数据聚合聚合结结果果 核心优势 可以借助flink实现数据exactly-once语义地入湖 和出湖。 新写入数据可在checkpoint周期内可见。 可以方便地构建data pipeline,满足不同业务层 的数据加工和分析需求。 对比Hive方案: hive的增量写入以partition为单位,长期高频率 的 checkpoint写
1、下载报告失败解决办法 2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。 3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。 4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
【4】基于Flink+Iceberg构建企业级实时数据湖-胡争-阿里巴巴.pdf
基于 Flink CDC 打造 企业级实时数据集成方案.pdf
【15-B01】苏舒-腾讯基于Flink+ Iceberg 全场景实时数仓的建设实践.pdf
【04】李劲松&胡争-Flink如何实时分析Iceberg数据湖的CDC数据.pdf
6-3 网易 Arctic:基于 Apache Iceberg 构建的实时湖仓一体系统.pdf
【15-A04】王展雄 - 腾讯看点基于Flink构建万亿数据量下的实时数仓及实时查询系统.pdf
2、伍翀、徐榜江-Flink CDC 如何简化实时数据入湖入仓.pdf
康琪KangQi - 十荟团基于Flink SQL与Zeppelin构建实时数仓的实践 .pdf
B站基于Iceberg构建秒级响应湖仓一体平台的技术实践.pdf
腾讯云+DLC+支持百万级实时Upsert的企业级数据湖计算实践全解析.pdf
三个皮匠报告专业的行业报告下载站,每日更新,欢迎大家关注!
copyright@2008-2013 长沙景略智创信息技术有限公司版权所有 网站备案/许可证号:湘B2-20190120
专属顾问
机构入驻、侵权投诉、商务合作
三个皮匠报告官方公众号
验证即登录,未注册将自动创建三个皮匠报告账号
使用 微信 扫一扫登陆