分类(classification)和预测(prediction)的区别
分类和预测是与数据挖掘相关的两个术语。数据对于几乎所有的组织来说都是重要的,以增加利润和了解市场。纯数据没有多大价值。因此,为了得到有用的信息,应该对数据进行处理。数据挖掘是从大量数据中提取信息的技术。这有助于对数据有更广泛的了解。数据挖掘的一些应用包括市场分析、生产控制和欺诈检测。分类和预测是与数据挖掘相关的两个术语。本文讨论了分类与预测的区别。分类是识别新观察所属的类别或类别标签的过程。预测是指为新的观测确定丢失或不可用的数值数据的过程。这就是分类和预测的关键区别。谓词与分类中的类标签无关。
目录
1. 概述和主要区别
2. 什么是分类
3. 什么是预测
4. 分类与预测的相似性
5. 并列比较-分类与表格形式的预测
6. 摘要
什么是分类(classification)?
分类是指识别一个新观察的类别或类别标签。首先,使用一组数据作为训练数据。给出了算法的输入数据集和相应的输出。因此,训练数据集包括输入数据及其相关的类标签。该算法利用训练数据集导出模型或分类器。导出的模型可以是决策树、数学公式或神经网络。在分类中,当一个未标记的数据被赋予模型时,它应该找到它所属的类。提供给模型的新数据是测试数据集。
分类是对记录进行分类的过程。分类的一个简单例子是检查是否下雨。答案可以是“是”也可以是“否”。因此,有很多选择。有时可以有两个以上的类进行分类。这就是所谓的多类分类。分析客户在实际生活中给予贷款是否有风险。在这个例子中,构造了一个模型来查找分类标签。标签是危险的或安全的。
什么是预测(predication)?
数据分析的另一个过程是预测。它用于查找数值输出。与分类一样,训练数据集包含输入值和相应的数值输出值。该算法根据训练数据集推导出模型或预报器。当给出新的数据时,模型应该找到一个数值输出。与分类不同,此方法没有类标签。该模型预测连续值函数或序值。
回归通常用于预测。根据房间数量、总面积等事实来预测房屋的价值就是一个例子。公司可能会发现客户在销售过程中花费的金额。这也是一个预测的例子。
什么是分类与预测的相似性(the similarity between classification and predication)?
- 分类和预测都是数据挖掘中使用的数据分析形式。
分类(classification)和预测(predication)的区别
分类与预测 | |
分类是根据包含已知类别成员的观测值的训练数据集,识别新观测值属于哪个类别的过程。 | 预测是指为新的观测确定丢失或不可用的数值数据的过程。 |
准确度 | |
在分类中,准确率取决于正确地找到类标签。 | 在谓词中,精确度取决于给定谓词对新数据的谓词属性值的猜测程度。 |
模型 | |
构造一个模型或分类器来查找分类标签。 | 我们将构造一个模型或预测器来预测连续值函数或有序值。 |
模型的同义词 | |
在分类中,模型可以称为分类器。 | 在预测中,模型可以称为预测因子。 |
总结 - 分类(classification) vs. 预测(prediction)
从巨大的数据集中提取有意义的信息称为数据挖掘。本文讨论了数据挖掘中的两种数据分析方法:分类和预测。在分类和预测方法中,速度、可扩展性和鲁棒性是相当重要的因素。分类是确定新观察所属的类别或类别标签的过程。预测是指为新的观测确定丢失或不可用的数值数据的过程。这就是分类和预测的区别。
引用
1.要点,教程。“数据挖掘分类与预测”,教程点,2018年1月8日。此处提供2.“统计分类”,维基百科,维基媒体基金会,2018年3月6日。此处提供
2.“统计分类”