随着信息时代的到来企业越来越意识到数据质量对企业的发展的重要程度,数据仓库不仅能很好的治理海量数据,还能通过数据挖掘提取数据价值,提升企业的竞争力,越来越受企业重视。那么,什么是数据仓库?有哪些优缺点?本文将具体介绍。
![数据仓库 数据仓库](//ziboxinyan.com/FileUpload/ueditor_s/upload/2022-7/6/63792759872013.jpg)
1.数据仓库
《Building the Data
Warehouse》一书的作者W.H.Inmon最先给数据仓库下了定义,即是面向主题的、集成的、相对稳定的、反映历史变化的数据集合。让管理层可以洞察数据趋势、行业动向,进而驱动业务发展。
面向主题:指用户在对数据进行统计分析时关注的维度。一般根据维度来定义主题,从多个业务线抽取出共同的维度建立主题。
集成的:数据仓库中的数据是从业务数据库中通过抽取数据并处理、总结和规划后进行提取和过滤导入的。并要处理杂乱的和分散在不同业务系统的问题,因此可以确保数据仓库中的数据具有全局统一的特性。
相对稳定的:数据从业务系统导入到数据仓库后,被长久的存储起来,主要进行查询操作而不进行修改和更新。通常只是定期的导入数据。
反映历史变化:数据仓库不断从业务系统中收集数据,积累的数据则蕴藏所有历史累计信息,通过分析历史累计的数据对企业的发展方向和行业的发展趋势做出精准的分析和预测。
目前,几乎所有的电商数据仓库都建设在Hadoop大数据技术生态之上。数据仓库包含以下四个模块:数据源、数据存储与管理、OLAP服务器(On-Line
Analysis Processing,联机分析处理)和前端工具与应用。
2.数据仓库优缺点
(1)数据仓库的优点
1)非易失性
存储在数据仓库中的数据是非易失性的,因为存储在数据仓库中的信息无法编辑。一旦将信息插入到数据仓库中,就只能对其进行更新或完全删除。
2)时变性
存储在数据仓库中的信息无法编辑,因此可以在数据仓库中长期存储。如果一个组织想要评估为什么销售额在过去一年中下降,而在两年前的销售额却是不可计数的,这可以通过参考存储在数据库中的信息来参考其当时使用的策略。
3)结构化信息存储
以结构化方式存储的信息。这意味着这里存储的数据是根据其来源划分的,并存储在各自的数据集市中。如果有数据必须添加到销售中,则该信息将进入已在数据仓库中创建的销售数据集市。数据仓库中没有杂乱的数据输入。
4)集成数据
数据集成是数据仓库的主要功能之一。数据的集成存储意味着来自多个来源的数据一起存储在数据仓库中。
(2)数据仓库的缺点
1)无法存储大量数据
无法存储大量数据被认为是数据仓库的主要缺点之一。这导致了大数据没有数据仓库的支持。
2)数据是刚性的
由于信息以指定的文件格式存储,因此要在数据仓库中使用数据,必须将其更改为该文件格式。这导致了数据仓库无法存储混合文件格式的数据的缺点。
3)维护成本高
每当小型组织获得大型IT项目时,就需要高维护系统。这些高维护系统需要财政资源。这会导致组织花费更多的资源而不是从中获利。
以上梳理了数据仓库的定义、系统架构及优缺点,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告的行业知识栏目。
推荐阅读:
数据管理平台有哪些?世界主要数据管理平台品牌一览
什么是数据管理?包括哪些内容?有什么好处?
数据集成是什么意思?方法有哪些?数据集成三种方法介绍
什么是大数据技术?特点是?在农业中的应用分析