数据挖掘(data mining)和数据仓库?(data warehousing?)的区别

业务人员和技术人员经常混淆数据挖掘和数据仓库这两个术语。随着数据采集软件程序的实施和计算机内存成本的降低,整个数据管理领域都经历了惊人的增长。这两个功能背后的主要目的是提供工具和方法来探索大量数据中的模式和意义。...

业务人员和技术人员经常混淆数据挖掘和数据仓库这两个术语。随着数据采集软件程序的实施和计算机内存成本的降低,整个数据管理领域都经历了惊人的增长。这两个功能背后的主要目的是提供工具和方法来探索大量数据中的模式和意义。

Data mining is the use of pattern recognition logic to identity trends within a sample data set and extrapolate this information against the larger data pool, while data warehousing is the process of extracting and storing data to allow easier reporting.

数据挖掘和数据仓库的主要区别在于系统设计、使用的方法和目的。数据挖掘是使用模式识别逻辑来识别样本数据集中的趋势,并根据更大的数据池推断这些信息。数据仓库是提取和存储数据以便于报告的过程。

The goal of using data mining tools is to uncover hidden patterns in information.

数据挖掘是一个通用术语,用于描述从数据中派生模式的一系列业务流程。通常,统计分析软件包用于根据最终用户生成的数据集和查询确定特定模式。数据挖掘的一个典型用途是创建有针对性的营销计划,识别财务欺诈,并将异常行为模式标记为安全审查的一部分。

数据挖掘的一个很好的例子是电话公司向现有客户推销产品的过程。这家电话公司使用数据挖掘软件访问其客户信息数据库。编写查询以识别在特定时间段内已订阅基本电话套餐和互联网服务的客户。选择此数据集后,将编写另一个查询,以确定这些客户中有多少人在试用促销期间利用了免费的附加电话功能。这项数据挖掘工作的结果揭示了一些行为模式,这些行为模式可以推动或帮助完善营销计划,以增加额外电话服务的使用。

值得注意的是,数据挖掘的主要目的是发现数据中的模式。用于定义样本集的规范对输出的相关性和分析的准确性有着巨大的影响。回到上面的例子,如果数据集仅限于特定地理区域内的客户,那么结果和模式将不同于更广泛的数据集。尽管数据挖掘和数据仓库都处理大量信息,但使用的过程却截然不同。

数据仓库是一种软件产品,用于存储大量数据并运行专门设计的查询和报告。商业智能是一个日益增长的研究领域,其重点是数据仓库和相关功能。这些工具旨在提取数据并将其存储在一种旨在提高系统性能的方法中。数据挖掘和数据仓库中的许多术语是相同的,导致了更多的混淆。

  • 发表于 2021-12-15 10:46
  • 阅读 ( 134 )
  • 分类:互联网

你可能感兴趣的文章

数据挖掘(data mining)和机器学习(machine learning)的区别

数据挖掘(data mining)和机器学习(machine learning)的区别 数据挖掘和机器学习是两个密切相关的领域。作为亲属,他们是相似的,但他们有不同的父母。但目前,两者的生长越来越相似,几乎与双胞胎相似。因此,有人将机器学习...

  • 发布于 2020-10-29 00:13
  • 阅读 ( 236 )

数据仓库(data warehousing)和数据集市(data marts)的区别

数据仓库与数据集市 你应该先建立哪一个:数据仓库还是数据集市?这个问题最近一直困扰着IT经理。大多数供应商都会说,数据仓库很难做到,而且成本很高,因此不可取。他们说建立数据仓库需要很长时间。此外,他们还...

  • 发布于 2021-06-23 12:41
  • 阅读 ( 168 )

数据挖掘(data mining)和预测分析(predictive analytics)的区别

数据挖掘和预测分析的主要区别在于,数据挖掘是使用算法和挖掘工具识别数据隐藏模式的过程,而预测分析是将业务知识应用于发现的模式以进行预测的过程。 数据挖掘是在大型数据集中发现模式的过程。它提取数据实体之...

  • 发布于 2021-07-01 00:14
  • 阅读 ( 433 )

数据集成(data integration)和etl公司(etl)的区别

数据集成与ETL的主要区别在于,数据集成是将不同数据源中的数据进行组合,为用户提供统一的视图的过程,而ETL是在数据仓库环境中提取、转换和加载数据的过程。 数据集成是指将来自不同来源的数据组合成有意义和有价值...

  • 发布于 2021-07-01 03:55
  • 阅读 ( 603 )

数据湖(data lake)和数据仓库(data warehouse)的区别

数据湖和数据仓库的主要区别在于,数据湖从物联网设备、网站、移动应用程序、社交媒体和企业应用程序获取非关系型和关系型数据,而数据仓库从事务系统、操作数据库和业务线应用程序获取数据。 数据湖是一个集中的存...

  • 发布于 2021-07-01 08:18
  • 阅读 ( 491 )

数据仓库(data warehouse)和数据集市(data mart)的区别

数据仓库和数据集市之间的主要区别在于,数据仓库是一个允许数据整合、分析和报告以做出业务决策的系统,而数据集市是数据仓库的子集,集中于组织的单个功能领域。 数据仓库是一个系统,它帮助分析数据、创建报表并...

  • 发布于 2021-07-01 08:24
  • 阅读 ( 528 )

数据仓库(data warehouse)和商业智能(business intelligence)的区别

数据仓库和商业智能的主要区别在于,数据仓库是一个中心位置,用于存储来自多个数据源的合并数据,而商业智能是一组策略和技术,用于分析和可视化数据以做出商业决策。 一般来说,数据对每个组织都很重要。并且,经...

  • 发布于 2021-07-01 21:59
  • 阅读 ( 476 )

数据仓库(data warehouse)和数据集市(data mart)的区别

数据分析是任何组织最受欢迎的需求之一。分析需求会加快速度和势头,特别是当组织在跨越多个单位和部门的一段时间内成长时。在任何时候,实体都希望评估数据,以了解和/或做出与整个部门或子部门相关的决策。数据仓...

  • 发布于 2021-07-09 12:41
  • 阅读 ( 1502 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

关键区别:数据挖掘实际上是对数据的分析。它是一种计算机辅助的过程,通过挖掘和分析由计算机编译或输入计算机的大量数据集。数据仓库是将信息或数据编译到数据仓库中的过程。数据仓库是用来存储数据的数据库。 数...

  • 发布于 2021-07-13 06:43
  • 阅读 ( 166 )

数据仓库(data warehouse)和数据集市(data mart)的区别

关键区别:数据仓库是历史数据的大型中央存储库。这些数据来自公司的不同部门和单位。数据集市可以被看作是数据仓库的一个子集,或者仅仅是一个数据存储库,通常集中在一个单一的功能领域。它们主要在范围和使用领...

  • 发布于 2021-07-14 00:12
  • 阅读 ( 181 )
绣虎123
绣虎123

0 篇文章