数据仓库架构及优缺点 原图定位 技术架构:数据仓库的分析对象主要来自 OLTP 数据库的结构化数据,通过预先定义Schema 的方式,运用 ETL(抽去、转换、加载)操作将数据导入数据仓库后,用户可以较为便捷地链接 BI 系统和报表系统。由于与 OLTP 数据库高度结合,数据仓库对于元数据的要求十分严格,很多数据仓库同样满足 ACID 事务能力。早期数据仓库主流采用 MPP(大规模并行处理)架构,通过一定的节点互联网连接多台 SMP 服务器,每个节点之间采用完全无共享(Shared Nothing)结构,具有独立的 CPU、内存和磁盘资源。在实务过程中,来自 OLTP 数据库的数据将根据来源场景、应用特点分配到不同的节点上,在每个处理单元上并行地进行计算分析,最终每个节点计算完成后再统一汇总得到最终结果。