聚类(clustering)和分类(classification)的区别

聚类与分类的关键区别在于,聚类是一种基于特征对相似实例进行分组的无监督学习技术,而分类是一种基于特征为实例分配预定义标签的监督学习技术。...

聚类与分类的关键区别在于,聚类是一种基于特征对相似实例进行分组的无监督学习技术,而分类是一种基于特征为实例分配预定义标签的监督学习技术。

尽管聚类和分类看起来是相似的过程,但基于它们的含义,它们之间还是有区别的。在数据挖掘领域,聚类和分类是两种类型的学习方法。这两种方法都通过一个或多个特征将对象特征化为组。

目录

1. 概述和主要区别
2. 什么是群集
3.什么是分类
4. 并列比较-聚类与表格形式的分类
5.摘要

什么是聚类(clustering)?

聚类是一种对对象进行分组的方法,使具有相似特征的对象**在一起,而具有不同特征的对象分开。它是机器学习和数据挖掘中常用的统计数据分析技术。探索性数据分析和泛化也是使用聚类的一个领域。

聚类(clustering)和分类(classification)的区别

图01:聚类

聚类属于无监督数据挖掘。它不是一个单一的特定算法,但它是解决一个任务的通用方法。因此,可以使用各种算法来实现聚类。适当的聚类算法和参数设置取决于各个数据集。这不是一个自动的任务,但它是一个迭代的发现过程。因此,有必要对数据处理和参数建模进行修改,直到结果达到预期的性能。K均值聚类和层次聚类是数据挖掘中常用的两种聚类算法。

什么是分类(classification)?

分类是使用一组训练数据来识别、区分和理解对象的分类过程。分类是一种有监督的学习技术,其中训练集和正确定义的观测值是可用的。

聚类(clustering)和分类(classification)的区别

图02:分类

实现分类的算法是分类器,而观察是实例。K-最近邻算法和决策树算法是数据挖掘中最著名的分类算法。

聚类(clustering)和分类(classification)的区别

聚类是一种无监督学习,而分类是一种有监督的学习技术。它根据特征对相似的实例进行分组,而分类则根据特征为实例分配预定义的标记。聚类将数据集拆分为子集,以将具有相似特征的实例分组。它不使用带标签的数据或训练集。另一方面,根据训练集的观察结果对新数据进行分类。训练集已标记。

聚类的目标是对一组对象进行分组,以确定它们之间是否存在任何关系,而分类的目标是从预定义的类集合中找出新对象属于哪个类。

聚类(clustering)和分类(classification)的区别

总结 - 聚类(clustering) vs. 分类(classification)

Image Courtesy:
1.”Cluster-2″ by Cluster-2.gif: hellisp derivative work: (Public Domain) via Wikimedia Comm***  2.”Magneti**” by John Aplessed – Own work. (Public Domain) via Wikimedia Comm***

  • 发表于 2020-10-28 16:16
  • 阅读 ( 537 )
  • 分类:IT

你可能感兴趣的文章

分类(classification)和二项式命名法(binomial nomenclature)的区别

...较——表格形式的分类与二项命名法 6. 摘要 什么是分类(classification)? 分类是根据相似性和不同性对生物体进行分组。它把生物组织成群,因此很容易对它们进行研究。分类是分类学中最重要的组成部分之一。有不同级别的分...

  • 发布于 2020-09-22 04:52
  • 阅读 ( 488 )

酚类(phenetics)和分支学(cladistics)的区别

...学有助于对各种系统进行分类,同时有助于对生物体进行聚类和分组。在这一点上,酚类和支系学在建立生物体之间的关系方面起着重要作用。 目录 1. 概述和主要区别 2. 什么是酚类 3. 什么是分支学 4. 酚类与分支学的相似性 5. ...

  • 发布于 2020-10-16 02:54
  • 阅读 ( 340 )

被监督的(supervised)和无监督机器学习(unsupervised machine learning)的区别

...机器学习相关的算法有很多种。其中一些是回归、分类和聚类。开发基于机器学习的应用程序最常用的编程语言是R和Python。也可以使用其他语言,如java、C++和MATLAB。 目录 1. 概述和主要区别 2. 什么是监督学习 3. 什么是无监督学...

  • 发布于 2020-10-19 03:49
  • 阅读 ( 710 )

丛生的(clustered)和非聚集索引(nonclustered index)的区别

...–以表格形式显示**索引与非**索引 6. 摘要 什么是**索引(clustered index)? 在**索引中,索引组织实际数据。它类似于电话簿。电话号码是按字母顺序排列的。在搜索特定姓名时,可以找到相应的电话号码。因此,聚类索引以有组...

  • 发布于 2020-10-19 06:34
  • 阅读 ( 257 )

分类(classification)和回归(regression)的区别

... 4. 并列比较-分类与表格形式的回归 5. 摘要 什么是分类(classification)? 分类是一种用于获得示意图的技术,该示意图显示以前体变量开始的数据组织。因变量是对数据进行分类的变量。 图01:数据挖掘 分类树从自变量开始,根...

  • 发布于 2020-10-23 10:08
  • 阅读 ( 422 )

分类(classification)和预测(prediction)的区别

分类(classification)和预测(prediction)的区别 分类和预测是与数据挖掘相关的两个术语。数据对于几乎所有的组织来说都是重要的,以增加利润和了解市场。纯数据没有多大价值。因此,为了得到有用的信息,应该对数据进行处理...

  • 发布于 2020-10-24 01:57
  • 阅读 ( 1465 )

聚类(clustering)和分类(classification)的区别

... 4. 并列比较-聚类与表格形式的分类 5.摘要 什么是聚类(clustering)? 聚类是一种对对象进行分组的方法,使具有相似特征的对象**在一起,而具有不同特征的对象分开。它是机器学习和数据挖掘中常用的统计数据分析技术。探索性...

  • 发布于 2020-10-28 16:16
  • 阅读 ( 537 )

集群(cluster)和分层抽样(stratified sampling)的区别

聚类与分层抽样 调查在市场营销、健康和社会学领域的各种研究中都有应用。他们通常是采取一个人口样本,因为对整个人口进行调查将是昂贵的。除此之外,抽样使数据收集更快,因为它只关注人口的一小部分。保证了采集...

  • 发布于 2021-06-23 21:45
  • 阅读 ( 523 )

命名法(nomenclature)和分类(classification)的区别

...名法和分类法的区别是什么?主要区别的比较 关键术语 Classification, Nomenclature, Taxonomy, Scientific Names 什么是分类(classification)? 在生物学中,分类是科学家根据生物的相似性和不同性,将生物组织成一系列的群体和亚群体的过程...

  • 发布于 2021-07-02 17:17
  • 阅读 ( 462 )

分类(classification)和制表(tabulation)的区别

...现数据以便更容易解释和比较的方法称为制表法。分类(classification) vs. 制表(tabulation)分类和制表的区别在于,“分类”是指将数据分成不同的类别,制表是指将数据以表格形式列出。数据收集后分类,分类后制表。在收集数据的...

  • 发布于 2021-07-07 04:50
  • 阅读 ( 541 )
帅气无敌就是哥
帅气无敌就是哥

0 篇文章