数据仓库

数据仓库是企业或组织对大量信息的电子存储。数据仓库是商业智能的一个重要组成部分,它对商业数据采用分析技术。...

什么是数据仓库(data warehousing)?

数据仓库是企业或组织对大量信息的电子存储。数据仓库是商业智能的一个重要组成部分,它对商业数据采用分析技术。

1988年,IBM研究人员barrydevlin和paulmurphy提出了数据仓库的概念。随着计算机系统变得越来越复杂,处理的数据量越来越大,对数据仓库的需求也随之发展。有关数据仓库的一本重要书籍是W。H。Inmon的《构建数据仓库》于1990年首次出版,此后多次再版。

数据仓库的工作原理

数据仓库用于通过比较从多个异构源整合的数据,提供对公司绩效的更深入了解。数据仓库是用来对来自事务源的历史数据进行查询和分析的。

一旦数据被合并到仓库中,它就不会改变,也不能改变,因为数据仓库通过关注数据随时间的变化来对已经发生的事件进行分析。仓库数据必须以安全、可靠、易于检索和管理的方式存储。

创建数据仓库需要执行某些步骤。第一步是数据提取,包括从多个源点收集大量数据。在数据被编译之后,它将经历数据清理、对数据进行错误梳理以及纠正或排除任何发现的错误的过程。

然后将清理后的数据从数据库格式转换为仓库格式。数据一旦存储在仓库中,就要经过分类、合并、汇总等过程,这样更协调、更容易使用。随着时间的推移,随着多个数据源的更新,更多的数据被添加到仓库中。

关键要点

  • 数据仓库是企业或组织对大量信息的电子存储。
  • 为了商业智能和数据挖掘的目的,数据仓库被设计用来对从事务源中派生的历史数据进行查询和分析。
  • 数据仓库用于通过比较从多个异构源整合的数据,提供对公司绩效的更深入了解。

特别注意事项:数据挖掘

企业可能会将数据存储起来,用于探索和数据挖掘,寻找有助于改进业务流程的信息模式。一个好的数据仓库系统还可以使公司内的不同部门更容易访问彼此的数据。

1:17

现在看:数据挖掘是如何工作的?

例如,数据仓库可以让公司轻松地评估销售团队的数据,并帮助决策如何提高销售或精简部门。这家企业可能会选择关注客户的消费习惯,以便更好地定位产品和增加销量。

通过数据仓库,公司可以收集过去20年客户支出的历史数据,并对这些数据进行分析。由此得到的信息可以提供对其消费者偏好的洞察;销售较大的一天、一个月或一年的时间;或者是今年消费最高的客户。

有效的数据存储和管理也使得启动旅行预订和使用自动柜员机等流程成为可能。

数据挖掘过程分为五个步骤:

  1. 组织收集数据并将其加载到数据仓库中。
  2. 然后,他们在内部服务器或云上存储和管理数据。
  3. 业务分析人员、管理团队和信息技术专业人员访问数据并确定如何组织数据。
  4. 然后应用软件根据用户的结果对数据进行排序
  5. 最终用户以一种易于共享的格式呈现数据,例如图形或表格。

数据仓库与数据库

数据仓库不一定与标准数据库的概念相同。数据库是一种事务性系统,它被设置为监视和更新实时数据,以便只有最新的数据可用。数据仓库是用来在一段时间内聚合结构化数据的。例如,数据库可能只有客户的最新地址,而数据仓库可能拥有客户过去10年居住的所有地址。

  • 发表于 2021-06-02 09:49
  • 阅读 ( 52 )
  • 分类:商业金融

你可能感兴趣的文章

数据库(database)和数据仓库(data warehouse)的区别

数据库与数据仓库 数据库和数据仓库之间区别的基础是数据仓库是一种用于数据分析的数据库。数据库是存储在计算机系统上的有组织的数据集合。以表格方式存储的学校学生、教师和班级的信息就是数据库的一个例子。由...

  • 发布于 2020-10-23 10:28
  • 阅读 ( 231 )

数据仓库(data warehousing)和数据集市(data marts)的区别

数据仓库与数据集市 你应该先建立哪一个:数据仓库还是数据集市?这个问题最近一直困扰着IT经理。大多数供应商都会说,数据仓库很难做到,而且成本很高,因此不可取。他们说建立数据仓库需要很长时间。此外,他们还...

  • 发布于 2021-06-23 12:41
  • 阅读 ( 176 )

数据库(database)和数据仓库(data warehouse)的区别

数据库与数据仓库的主要区别在于,数据库是一个有组织的相关数据集合,以表格形式存储数据,而数据仓库是存储多个数据库中合并数据的中心位置。 数据库包含一组数据。DBMS是一种允许用户创建、操作和管理数据库的软件...

  • 发布于 2021-06-30 17:27
  • 阅读 ( 305 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

数据挖掘和数据仓库的主要区别在于,数据挖掘是从大量数据中识别模式的过程,而数据仓库是将来自多个数据源的数据集成到一个中心位置的过程。 数据挖掘是在大型数据集中发现模式的过程。它使用各种技术,如分类、回...

  • 发布于 2021-06-30 17:39
  • 阅读 ( 519 )

片(slice)和数据仓库中的骰子(dice in data warehouse)的区别

数据仓库中切片和骰子的主要区别在于,切片是从给定数据立方体中选择一个特定维度并提供一个新的子立方体的操作,而骰子是从给定数据立方体中选择两个或多个维度并提供一个新的子立方体的操作。 数据仓库是用于报告...

  • 发布于 2021-07-01 02:40
  • 阅读 ( 489 )

etl公司(etl)和数据仓库(data warehouse)的区别

ETL和数据仓库的主要区别在于ETL是提取、转换和加载数据以将其存储在数据仓库中的过程,而数据仓库是用于存储来自多个数据源的合并数据的中心位置。 数据仓库是一个帮助分析数据、报告和可视化数据以做出业务决策的系...

  • 发布于 2021-07-01 03:18
  • 阅读 ( 469 )

依赖的(dependent)和独立数据集市(independent data marts)的区别

从属数据集市和独立数据集市之间的主要区别在于,从属数据集市从已创建的数据仓库获取数据,而独立数据集市直接从操作源和/或外部源获取数据。 简言之,数据仓库是一个帮助分析数据、创建报表并将其可视化以做出业务...

  • 发布于 2021-07-01 03:47
  • 阅读 ( 517 )

数据湖(data lake)和数据仓库(data warehouse)的区别

数据湖和数据仓库的主要区别在于,数据湖从物联网设备、网站、移动应用程序、社交媒体和企业应用程序获取非关系型和关系型数据,而数据仓库从事务系统、操作数据库和业务线应用程序获取数据。 数据湖是一个集中的存...

  • 发布于 2021-07-01 08:18
  • 阅读 ( 504 )

数据仓库(data warehouse)和商业智能(business intelligence)的区别

数据仓库和商业智能的主要区别在于,数据仓库是一个中心位置,用于存储来自多个数据源的合并数据,而商业智能是一组策略和技术,用于分析和可视化数据以做出商业决策。 一般来说,数据对每个组织都很重要。并且,经...

  • 发布于 2021-07-01 21:59
  • 阅读 ( 485 )

数据仓库(data warehouse)和数据集市(data mart)的区别

数据分析是任何组织最受欢迎的需求之一。分析需求会加快速度和势头,特别是当组织在跨越多个单位和部门的一段时间内成长时。在任何时候,实体都希望评估数据,以了解和/或做出与整个部门或子部门相关的决策。数据仓...

  • 发布于 2021-07-09 12:41
  • 阅读 ( 1513 )
dx31409
dx31409

0 篇文章

相关推荐