kdd公司(kdd)和数据挖掘(data mining)的区别

KDD(knowledgediscoveryingindatabases)是计算机科学的一个领域,它包括帮助人类从大量的数字化数据中提取有用的和以前未知的信息(即知识)的工具和理论。KDD包括几个步骤,数据挖掘就是其中之一。数据挖掘是应用特定的算法从数据中提取模式。尽管如此,KDD和数据挖掘是可以互换使用的。...

KDD与数据挖掘

KDD(knowledgediscoveryingindatabases)是计算机科学的一个领域,它包括帮助人类从大量的数字化数据中提取有用的和以前未知的信息(即知识)的工具和理论。KDD包括几个步骤,数据挖掘就是其中之一。数据挖掘是应用特定的算法从数据中提取模式。尽管如此,KDD和数据挖掘是可以互换使用的。

什么是KDD?

如上所述,KDD是计算机科学的一个领域,它处理从原始数据中提取先前未知和有趣的信息。KDD是通过开发适当的方法或技术来尝试理解数据的整个过程。这个过程处理的是将低级数据映射到其他更紧凑、抽象和有用的形式。这是通过创建短报告、对生成数据的过程进行建模以及开发可以预测未来病例的预测模型来实现的。由于数据的指数级增长,特别是在商业等领域,KDD已经成为将大量数据转化为商业智能的一个非常重要的过程,因为在过去几十年中,人工提取模式似乎变得不可能。例如,它目前被用于各种应用,如社会网络分析、欺诈检测、科学、投资、**、电信、数据清理、体育、信息检索等,而且主要用于市场营销。KDD通常用来回答这样的问题:哪些主要产品可能有助于明年在沃尔玛获得高利润?。这个过程有几个步骤。它从了解应用程序域和目标开始,然后创建目标数据集。接下来是数据的清理、预处理、缩减和投影。下一步是使用数据挖掘(下面解释)来识别模式。最后,发现的知识通过可视化和/或解释来巩固。

什么是数据挖掘?

如上所述,数据挖掘只是整个KDD过程中的一个步骤。应用程序的目标定义了两个主要的数据挖掘目标,即验证或发现。验证是验证用户对数据的假设,而发现是自动发现有趣的模式。有四个主要的数据挖掘任务:聚类、分类、回归和关联(摘要)。聚类是从非结构化数据中识别相似的组。分类是学习可以应用于新数据的规则。回归是寻找对数据建模误差最小的函数。关联是寻找变量之间的关系。然后,需要选择具体的数据挖掘算法。根据目标,可以选择线性回归、logistic回归、决策树和朴素贝叶斯等不同的算法。然后在一个或多个表示形式中搜索感兴趣的模式。最后,使用预测精度或可理解性对模型进行评估。

KDD和数据挖掘有什么区别?

  • 发表于 2020-10-26 14:53
  • 阅读 ( 132 )
  • 分类:IT

你可能感兴趣的文章

数据挖掘(data mining)和机器学习(machine learning)的区别

数据挖掘(data mining)和机器学习(machine learning)的区别 数据挖掘和机器学习是两个密切相关的领域。作为亲属,他们是相似的,但他们有不同的父母。但目前,两者的生长越来越相似,几乎与双胞胎相似。因此,有人将机器学习...

  • 发布于 2020-10-29 00:13
  • 阅读 ( 236 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

数据挖掘和数据仓库的主要区别在于,数据挖掘是从大量数据中识别模式的过程,而数据仓库是将来自多个数据源的数据集成到一个中心位置的过程。 数据挖掘是在大型数据集中发现模式的过程。它使用各种技术,如分类、回...

  • 发布于 2021-06-30 17:39
  • 阅读 ( 503 )

数据挖掘(data mining)和预测分析(predictive analytics)的区别

数据挖掘和预测分析的主要区别在于,数据挖掘是使用算法和挖掘工具识别数据隐藏模式的过程,而预测分析是将业务知识应用于发现的模式以进行预测的过程。 数据挖掘是在大型数据集中发现模式的过程。它提取数据实体之...

  • 发布于 2021-07-01 00:14
  • 阅读 ( 432 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

关键区别:数据挖掘实际上是对数据的分析。它是一种计算机辅助的过程,通过挖掘和分析由计算机编译或输入计算机的大量数据集。数据仓库是将信息或数据编译到数据仓库中的过程。数据仓库是用来存储数据的数据库。 数...

  • 发布于 2021-07-13 06:43
  • 阅读 ( 166 )

什么是不同的数据挖掘方法?(the different data mining methods?)

... 在软件选项和理论概念中使用了各种不同的数据挖掘方法。这使得用户能够利用各种工具从个人和公司收集的数据中提取信息。大量数据可用于确定单个受试者或多个受试者的各种因素。这些数据挖掘方法最常用于...

  • 发布于 2021-12-08 14:44
  • 阅读 ( 169 )

什么是数据挖掘应用?(data mining applications?)

数据挖掘应用程序是能够从存储的数据中提取和识别模式的计算机软件程序或包。这类工具通常是一个软件接口,它与包含客户或其他重要数据的大型数据库进行交互。数...

  • 发布于 2021-12-08 16:47
  • 阅读 ( 181 )

什么是数据挖掘工具?(data mining tools?)

数据挖掘工具是允许用户从数据中提取信息的软件组件和理论。这些工具使个人和公司能够收集大量数据,并使用这些数据确定特定用户或用户组。数据挖掘工具的一些最...

  • 发布于 2021-12-08 16:48
  • 阅读 ( 123 )

什么是不同类型的数据挖掘技术?(the different types of data mining technology?)

...从原始数据中检索信息的过程中,使用了许多不同类型的数据挖掘技术。每种技术的使用都有多种原因,包括营销、安全和一般信息收集。数据挖掘技术通常用于测试数据样本,而不是整个内容样本,允许分析师验证和验证信息...

  • 发布于 2021-12-08 19:30
  • 阅读 ( 143 )

什么是数据挖掘系统?(a data mining system?)

数据挖掘系统是一种收集、组织和分析数据集的系统方法。在收集的数据中发现模式和关系是数据挖掘的目标。发现的模式和关系有助于组织根据过去的模式预测未来趋势...

  • 发布于 2021-12-10 10:22
  • 阅读 ( 95 )

什么是数据挖掘?(data mining?)

数据挖掘使用对大量数据进行操作的相对较大的计算能力来确定数据点之间的规则性和连接。采用统计学、机器学习和模式识别技术的算法用于自动搜索大型数据库。数据...

  • 发布于 2021-12-13 12:58
  • 阅读 ( 151 )
figoim486
figoim486

0 篇文章

相关推荐