信息化、数字化是当前各行业发展的目标,但由于异构数据分散在不同的信息系统中,造成了大量的“信息孤岛”问题,于是,数据整合营运而生。那么,什么是数据整合?方法有哪些?特征是?本文将具体梳理。
![数据整合 数据整合](//ziboxinyan.com/FileUpload/ueditor_s/upload/2022-8/9/6379564264993667235761690.jpg)
1.数据整合
数据整合指的是将不同数据源的数据集成到一个统一的数据集合中。作为信息整合的基础,数据整合的本质就是借助某些技术手段,从逻辑层面或物理层面,将异构数据进行相互关联,并通过可视化视图的方式对关联结果进行展示。
数据整合的对象是异构的数据资源。异构不仅仅指数据的异构,还包括了各种应用系统和运行平台中的硬件、存储位置的异构。
2.数据整合方法
异构数据的整合可以采用两种方式,一种通过数据联邦技术,另一种基于数据仓储。
联邦数据库是构造信息集成系统较早的方式,基本思想是面向多个数据库系统,通过各数据源之间的数据交换格式进行一一映射,实现数据共享。
数据仓库整合方式是将异构数据库系统中的数据复制并提取出来,建立一个消除了差异性的、稳定的数据仓储集合,以提供集中的、统一的检索服务。中介模式的数据整合即是通过诸如中间件、请求代理、标准协议等中介媒介,来完成数据的逻辑集成。其中中间件集成是目前比较通行的基于中介模式的数据整合方法。
3.数据整合的特征
(1)数据获取的直接性
通过不同方式集成后的信息集成系统,应是各异构数据源的有机集成。对一个查询请求,可以直接一次查询多个数据源系统,不需分别访问不同的资源系统。
(2)数据访问的一致性
通过不同方式集成后的信息集成系统,应提供访问数据的全局统一数据视图,以一个统一的界面,使对异构系统中不同信息资源的访问不受数据格式、数据位置和访问接口差异的限制。
(3)数据显示(提取)的完整性
从信息集成系统中获取的数据信息,应保持其在原系统的状态,不可产生数据要素丢失的现象。
已上梳理了数据整合的定义、方法及特征,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告的行业知识栏目。
推荐阅读:
数据仓库是什么?特点是?与数据挖掘、数据湖的区别与联系
我国大数据企业有哪些?企业排名一览
大数据分析是什么?方法有哪些?