|
|
论坛精华
>> SQL之家
>> 数据仓库的概念
由 amtd 发布于: 2001-02-15 10:03
数据仓库的概念
随着市场竞争的加剧和信息社会需求的发展,从大量数据中提取(检索、查询等)
制定市场策略的信息就显得越来越重要了。这种需求既要求联机服务,又涉及大量用
于决策的数据,而传统的数据库系统已无法满足这种需求。其具体体现在三个方面:
历史数据量很大。
辅助决策信息涉及许多部门的数据,而不同系统的数据难以集成。
由于访问数据的能力不足,它对大量数据的访问性能明显下降。
随着C/S技术的成熟和并行数据库的发展,信息处理技术的发展趋势是从大量的
事务型数据库中抽取数据,并将其清理、转换为新的存储格式,即为决策目标把数据
聚合在一种特殊的格式中。随着此过程的发展和完善,这种支持决策的、特殊的数据
存储即被称为数据仓库(Data Warehouse, DW)。
W。H。Inmon对数据仓库的定义为数据仓库是支持管理决策过程的、面向主题的、集成
的、稳定的、不同时间的数据集合。
主题是数据归类的标准,每个主题对应一个客观分析领域,如客户、商店等,它可为
辅助决策集成多个部门不同系统的大量数据。数据仓库包含了大量的历史数据,经集
成后进入数据仓库的数据是极少更新的。数据仓库内的数据时限为5年至10年,主要
用于进行时间趋势分析。数据仓库的数据量很大,一般为10GB左右。它是一般数据库
(100MB)数据量的100倍,大型数据仓库达到TB级。
数据仓库主要应用在两个方面:
使用浏览分析工具在DW中寻找有用的信息。
数据仓库系统支持在DW上的应用,形成决策支持系统(DSS)。
---
数据仓库是关系型的
仓库保存的数据通常是历史数据,而且数据仓库保存的数据量极大,可能达到GB、TB级,
甚至更大。这些数据在数据仓库中很少变动。
对于数据仓库,通常只进行APPEND操作。
对信息源的数据的提取和集成采用批处理的方式进行,通常脱机处理。
作者:blackwhites
__________________
|
资料来源: JSP001.com
|