数据挖掘(data mining)和数据仓库(data warehousing)的区别

数据挖掘和数据仓库都是非常强大和流行的数据分析技术。倾向于统计的用户使用数据挖掘。他们利用统计模型来寻找数据中隐藏的模式。数据挖掘者感兴趣的是在不同的数据元素之间寻找有用的关系,这对企业最终是有利可图的。但另一方面,能够直接分析业务维度的数据专家倾向于使用数据仓库。...

数据挖掘与数据仓库

数据挖掘和数据仓库都是非常强大和流行的数据分析技术。倾向于统计的用户使用数据挖掘。他们利用统计模型来寻找数据中隐藏的模式。数据挖掘者感兴趣的是在不同的数据元素之间寻找有用的关系,这对企业最终是有利可图的。但另一方面,能够直接分析业务维度的数据专家倾向于使用数据仓库。

数据挖掘也称为数据中的知识发现(KDD)。如前所述,它是计算机科学的一个领域,研究从原始数据中提取先前未知和有趣的信息。由于数据的指数级增长,特别是在商业等领域,数据挖掘已经成为将大量数据转化为商业智能的非常重要的工具,因为在过去几十年中,人工提取模式似乎变得不可能。例如,它目前被用于各种应用,如社交网络分析、欺诈检测和营销。数据挖掘通常处理以下四个任务:聚类、分类、回归和关联。从非结构化组中识别相似的数据。分类是可以应用于新数据的学习规则,通常包括以下步骤:数据预处理、建模设计、学习/特征选择和评估/验证。回归是寻找对数据建模误差最小的函数。关联是寻找变量之间的关系。数据挖掘通常用来回答这样的问题:哪些主要产品可能有助于沃尔玛明年获得高利润?

如前所述,数据仓库也用于分析数据,但由不同的用户集和头脑中的目标稍有不同。例如,在零售领域,数据仓库用户更关心的是什么样的购买方式在客户中比较受欢迎,因此分析结果可以通过改善客户体验来帮助客户。但数据挖掘者首先会推测出一个假设,比如顾客购买某种类型的产品,然后对数据进行分析,以验证这一假设。数据仓库可以由一家大型零售商执行,该零售商最初在其门店中储存相同尺寸的产品,后来发现纽约门店销售的库存规模较小,远远快于芝加哥门店。因此,通过观察这个结果,零售商可以在纽约的商店里储存比芝加哥商店更小的尺寸。

  • 发表于 2020-10-23 19:18
  • 阅读 ( 114 )
  • 分类:IT

你可能感兴趣的文章

数据挖掘(data mining)和机器学习(machine learning)的区别

数据挖掘(data mining)和机器学习(machine learning)的区别 数据挖掘和机器学习是两个密切相关的领域。作为亲属,他们是相似的,但他们有不同的父母。但目前,两者的生长越来越相似,几乎与双胞胎相似。因此,有人将机器学习...

  • 发布于 2020-10-29 00:13
  • 阅读 ( 244 )

数据仓库(data warehousing)和数据集市(data marts)的区别

数据仓库与数据集市 你应该先建立哪一个:数据仓库还是数据集市?这个问题最近一直困扰着IT经理。大多数供应商都会说,数据仓库很难做到,而且成本很高,因此不可取。他们说建立数据仓库需要很长时间。此外,他们还...

  • 发布于 2021-06-23 12:41
  • 阅读 ( 176 )

数据挖掘(data mining)和预测分析(predictive analytics)的区别

数据挖掘和预测分析的主要区别在于,数据挖掘是使用算法和挖掘工具识别数据隐藏模式的过程,而预测分析是将业务知识应用于发现的模式以进行预测的过程。 数据挖掘是在大型数据集中发现模式的过程。它提取数据实体之...

  • 发布于 2021-07-01 00:14
  • 阅读 ( 440 )

数据集成(data integration)和etl公司(etl)的区别

数据集成与ETL的主要区别在于,数据集成是将不同数据源中的数据进行组合,为用户提供统一的视图的过程,而ETL是在数据仓库环境中提取、转换和加载数据的过程。 数据集成是指将来自不同来源的数据组合成有意义和有价值...

  • 发布于 2021-07-01 03:55
  • 阅读 ( 611 )

数据湖(data lake)和数据仓库(data warehouse)的区别

数据湖和数据仓库的主要区别在于,数据湖从物联网设备、网站、移动应用程序、社交媒体和企业应用程序获取非关系型和关系型数据,而数据仓库从事务系统、操作数据库和业务线应用程序获取数据。 数据湖是一个集中的存...

  • 发布于 2021-07-01 08:18
  • 阅读 ( 504 )

数据仓库(data warehouse)和数据集市(data mart)的区别

数据仓库和数据集市之间的主要区别在于,数据仓库是一个允许数据整合、分析和报告以做出业务决策的系统,而数据集市是数据仓库的子集,集中于组织的单个功能领域。 数据仓库是一个系统,它帮助分析数据、创建报表并...

  • 发布于 2021-07-01 08:24
  • 阅读 ( 536 )

数据仓库(data warehouse)和商业智能(business intelligence)的区别

数据仓库和商业智能的主要区别在于,数据仓库是一个中心位置,用于存储来自多个数据源的合并数据,而商业智能是一组策略和技术,用于分析和可视化数据以做出商业决策。 一般来说,数据对每个组织都很重要。并且,经...

  • 发布于 2021-07-01 21:59
  • 阅读 ( 486 )

数据仓库(data warehouse)和数据集市(data mart)的区别

数据分析是任何组织最受欢迎的需求之一。分析需求会加快速度和势头,特别是当组织在跨越多个单位和部门的一段时间内成长时。在任何时候,实体都希望评估数据,以了解和/或做出与整个部门或子部门相关的决策。数据仓...

  • 发布于 2021-07-09 12:41
  • 阅读 ( 1513 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

关键区别:数据挖掘实际上是对数据的分析。它是一种计算机辅助的过程,通过挖掘和分析由计算机编译或输入计算机的大量数据集。数据仓库是将信息或数据编译到数据仓库中的过程。数据仓库是用来存储数据的数据库。 数...

  • 发布于 2021-07-13 06:43
  • 阅读 ( 173 )

数据仓库(data warehouse)和数据集市(data mart)的区别

关键区别:数据仓库是历史数据的大型中央存储库。这些数据来自公司的不同部门和单位。数据集市可以被看作是数据仓库的一个子集,或者仅仅是一个数据存储库,通常集中在一个单一的功能领域。它们主要在范围和使用领...

  • 发布于 2021-07-14 00:12
  • 阅读 ( 187 )
老王就是王老大
老王就是王老大

0 篇文章