《2020年终大会-大数据架构:5-4.pdf》由会员分享,可在线阅读,更多相关《2020年终大会-大数据架构:5-4.pdf(31页珍藏版)》请在三个皮匠报告上搜索。
1、背调数据 人脸数据 交易数据 行为数据 驾驶数据 人 Driver 车 Vehicle 路 Road 安全管理 司机管理 UBI保险 驾驶模式研究 车况数据 行驶数据 能耗数据 事故数据 故障数据 运力调度 主动维修 产品改进 运营定制车设计 路况数据 环境数据 轨迹数据 POI数据 异常数据 地图绘制 实时路况 安全管理 市政管理 风控数据 运力数据 交易数据 城市数据 用户数据 智能调度 智能决策 智能营销 客户体验 数 据 采 集 应 用 场 景 云 Cloud AWS的定义: A data lake is a centralized repository that allows you
2、 to store all your structured and unstructured data at any scale. You can store your data as-is, without having to first structure the data, and run different types of analyticsfrom dashboards and visualizations to big data processing, real-time analytics, and machine learning to guide better decisi
3、ons. 数据湖是一个集中式的存储库,允许您以任意规模存储所有结构化和非结构化数据。您可以按原样存储数 据(无需先对数据进行结构化处理),并运行不同类型的分析 从控制面板和可视化到大数据处理、实时 分析和机器学习,以指导做出更好的决策。 Shared-Nothing 架构 - Shared-Data 架构 存储计算分离:统一存储、弹性计算 数仓即服务:SaaS化体验,共享存储基础设施,计算多租户 持续高可用:在线升级,失败容错 结构化延伸到半结构化数据的处理支持 Multi-Cluster, Shared Data 数据湖存储 Ad-Hoc 计算集群 OLAP 计算集群 机器学习计算集群 数据仓库集计算群 数据加工计算集群 BI 计算集群 没有数据孤岛 存储从计算解耦 任意的数据 原生的结构化&半结构化 无限扩容 多种尺寸 低成本 按需计算 即刻克隆 DEV & QA 跟生产隔离 Data