数据仓库中的数据库分层

在数据仓库中,一般采用多层数据库的设计,以处理庞大的业务数据。一个常用的分层模式是:

(original DB, and other resource) -> ODS -> DW -> (DM1, DM2, ...)

报表一般由 DW 的数据产出,不过不做限定,生产环境下,有时报表查询也用到其他层的数据。

ODS: operational data store, an intermediate data warehouse for databases. 来源多个业务系统的数据,经过data virtualization, data federation, ETL 等数据集成技术,初次入库,一般以业务为导向,建立这一层的数据库。

http://en.wikipedia.org/wiki/Operational_data_store

DW: data warehouse,由 ODS 的数据建立数据仓库,必须包含时间信息。这一层数据往往作为原始的数据来源。

DM: data mart, 由 DW 的数据建立的数据库,方便从中得到报表,一个 DW 可以对应多个 DM. 如从某个公司的 DW 上可以构建偏财务的 DM 和偏用户数据的 DM 等等。