关键区别-有监督和无监督机器学习
有监督学习和无监督学习是机器学习的两个核心概念。监督学习是一种机器学习任务,学习基于示例输入输出对将输入映射到输出的函数。无监督学习是从未标记的数据中推断出一个描述隐藏结构的函数的机器学习任务。有监督和无监督机器学习的关键区别在于,有监督学习使用带标签的数据,而无监督学习使用未标记的数据。
机器学习是计算机科学中的一个领域,它使计算机系统能够在没有明确编程的情况下从数据中学习。它允许分析数据并预测其中的模式。机器学习有许多应用。其中包括人脸识别、手势识别和语音识别。与机器学习相关的算法有很多种。其中一些是回归、分类和聚类。开发基于机器学习的应用程序最常用的编程语言是R和Python。也可以使用其他语言,如java、C++和MATLAB。
目录
1. 概述和主要区别
2. 什么是监督学习
3. 什么是无监督学习
4. 有监督和无监督机器学习的相似性
5. 并列比较-表格形式的有监督和无监督机器学习
6. 摘要
什么是监督学习(supervised learning)?
在基于机器学习的系统中,模型根据算法工作。在监督学习中,模型是有监督的。首先,需要对模型进行训练。利用所获得的知识,它可以预测未来实例的答案。模型是使用带标签的数据集进行训练的。当一个样本外的数据给系统时,它可以预测结果。下面是从流行的虹膜数据集中提取的一个小片段。
根据上表,萼片长、萼片宽、瓣长、瓣宽和种被称为属性。这些列被称为特征。一行包含所有属性的数据。因此,一行被称为观察。数据可以是数字的,也可以是分类的。模型以相应的物种名称作为输入,给出观测值。当一个新的观察被给予时,模型应该预测它所属的物种类型。
在监督学习中,有分类和回归算法。分类是对标记数据进行分类的过程。模型创建了分隔数据类别的边界。当向模型提供新数据时,它可以根据点所在的位置进行分类。K-最近邻(KNN)是一种分类模型。根据k值,决定类别。例如,当k为5时,如果某个特定数据点接近a类中的8个数据点和B类中的6个数据点,则该数据点将被归类为a。
回归是预测先前数据的趋势以预测新数据的结果的过程。在回归中,输出可以由一个或多个连续变量组成。预测是用覆盖大多数数据点的一条线来完成的。最简单的回归模型是线性回归。它是快速的,不需要调整参数,如在KNN。如果数据呈抛物线趋势,则线性回归模型不适用。
这些是有监督学习算法的一些例子。一般来说,由于输入数据是已知的,并且标记了标签,因此,由监督学习方法产生的结果更准确、更可靠。因此,机器只需分析隐藏的模式。
什么是无监督学习(unsupervised learning)?
在无监督学习中,模型是不受监督的。该模型独立工作,以预测结果。它使用机器学习算法对未标记的数据得出结论。一般来说,由于信息量少,无监督学习算法比有监督学习算法困难。聚类是一种无监督学习。它可以用算法对未知数据进行分组。k均值聚类和基于密度的聚类是两种聚类算法。
k均值算法,为每个簇随机放置k个质心。然后将每个数据点指定给最近的质心。欧氏距离用于计算数据点到质心的距离。数据点被分成组。再次计算k质心的位置。新的质心位置由组中所有点的平均值确定。同样,每个数据点都指定给最近的质心。这个过程会重复,直到质心不再变化。k-mean是一种快速的聚类算法,但没有指定聚类点的初始化。另外,基于聚类点初始化的聚类模型也有很大的变化。
另一种聚类算法是基于密度的聚类。它也被称为基于密度的带噪空间聚类应用。它的工作原理是将簇定义为最大密度连接点集。它们是用于基于密度的聚类的两个参数。它们是Ɛ(epsilon)和最小点。Ɛ是邻域的最大半径。最小点是Ɛ邻域中定义簇的最小点数。这些是属于无监督学习的聚类的一些例子。
一般来说,无监督学习算法产生的结果不太准确和可靠,因为机器在确定隐藏模式和函数之前必须定义和标记输入数据。
什么是有监督和无监督机器学习的相似性(the similarity between supervised and unsupervised machine learning)?
- 有监督学习和无监督学习都是机器学习的类型。
被监督的(supervised)和无监督机器学习(unsupervised machine learning)的区别
有监督与无监督机器学习 | |
监督学习是一种机器学习任务,学习基于示例输入输出对将输入映射到输出的函数。 | 无监督学习是从未标记的数据中推断出一个描述隐藏结构的函数的机器学习任务。 |
主要功能 | |
在监督学习中,该模型根据标记的输入数据预测结果。 | 在无监督学习中,该模型通过自己识别模式来预测无标记数据的结果。 |
结果的准确性 | |
由监督学习方法产生的结果更准确可靠。 | 无监督学习方法产生的结果不太准确可靠。 |
主要算法 | |
有监督学习中有回归和分类算法。 | 无监督学习中有聚类算法。 |
总结 - 被监督的(supervised) vs. 无监督机器学习(unsupervised machine learning)
有监督学习和无监督学习是机器学习的两种类型。监督学习是一种机器学习任务,学习基于示例输入输出对将输入映射到输出的函数。无监督学习是从未标记的数据中推断出一个描述隐藏结构的函数的机器学习任务。有监督和无监督机器学习的区别在于,有监督学习使用带标签的数据,而无监督学习使用未标记的数据。
引用
1.大数据大学。机器学习——有监督与无监督学习,认知课程,2017年3月13日。此处提供2.“无监督学习”,维基百科,维基媒体基金会,2018年3月20日。此处提供3.“监督学习”,维基百科,维基媒体基金会,2018年3月15日。此处提供
2.“无监督学习”,维基百科,维基媒体基金会,2018年3月20日。
3.“监督学习”,维基百科,维基媒体基金会,2018年3月15日。