分類(classification)和預測(prediction)的區別
分類和預測是與數據挖掘相關的兩個術語。數據對於幾乎所有的組織來說都是重要的,以增加利潤和了解市場。純數據沒有多大價值。因此,為了得到有用的信息,應該對數據進行處理。數據挖掘是從大量數據中提取信息的技術。這有助於對數據有更廣泛的瞭解。數據挖掘的一些應用包括市場分析、生產控制和欺詐檢測。分類和預測是與數據挖掘相關的兩個術語。本文討論了分類與預測的區別。分類是識別新觀察所屬的類別或類別標籤的過程。預測是指為新的觀測確定丟失或不可用的數值數據的過程。這就是分類和預測的關鍵區別。謂詞與分類中的類標籤無關。
目錄
1. 概述和主要區別
2. 什麼是分類
3. 什麼是預測
4. 分類與預測的相似性
5. 並列比較-分類與表格形式的預測
6. 摘要
什麼是分類(classification)?
分類是指識別一個新觀察的類別或類別標籤。首先,使用一組數據作為訓練數據。給出了算法的輸入數據集和相應的輸出。因此,訓練數據集包括輸入數據及其相關的類標籤。該算法利用訓練數據集導出模型或分類器。導出的模型可以是決策樹、數學公式或神經網絡。在分類中,當一個未標記的數據被賦予模型時,它應該找到它所屬的類。提供給模型的新數據是測試數據集。
分類是對記錄進行分類的過程。分類的一個簡單例子是檢查是否下雨。答案可以是“是”也可以是“否”。因此,有很多選擇。有時可以有兩個以上的類進行分類。這就是所謂的多類分類。分析客戶在實際生活中給予貸款是否有風險。在這個例子中,構造了一個模型來查找分類標籤。標籤是危險的或安全的。
什麼是預測(predication)?
數據分析的另一個過程是預測。它用於查找數值輸出。與分類一樣,訓練數據集包含輸入值和相應的數值輸出值。該算法根據訓練數據集推導出模型或預報器。當給出新的數據時,模型應該找到一個數值輸出。與分類不同,此方法沒有類標籤。該模型預測連續值函數或序值。
迴歸通常用於預測。根據房間數量、總面積等事實來預測房屋的價值就是一個例子。公司可能會發現客戶在銷售過程中花費的金額。這也是一個預測的例子。
什麼是分類與預測的相似性(the similarity between classification and predication)?
- 分類和預測都是數據挖掘中使用的數據分析形式。
分類(classification)和預測(predication)的區別
分類與預測 | |
分類是根據包含已知類別成員的觀測值的訓練數據集,識別新觀測值屬於哪個類別的過程。 | 預測是指為新的觀測確定丟失或不可用的數值數據的過程。 |
準確度 | |
在分類中,準確率取決於正確地找到類標籤。 | 在謂詞中,精確度取決於給定謂詞對新數據的謂詞屬性值的猜測程度。 |
模型 | |
構造一個模型或分類器來查找分類標籤。 | 我們將構造一個模型或預測器來預測連續值函數或有序值。 |
模型的同義詞 | |
在分類中,模型可以稱為分類器。 | 在預測中,模型可以稱為預測因子。 |
總結 - 分類(classification) vs. 預測(prediction)
從巨大的數據集中提取有意義的信息稱為數據挖掘。本文討論了數據挖掘中的兩種數據分析方法:分類和預測。在分類和預測方法中,速度、可擴展性和魯棒性是相當重要的因素。分類是確定新觀察所屬的類別或類別標籤的過程。預測是指為新的觀測確定丟失或不可用的數值數據的過程。這就是分類和預測的區別。
引用
1.要點,教程。“數據挖掘分類與預測”,教程點,2018年1月8日。此處提供2.“統計分類”,維基百科,維基媒體基金會,2018年3月6日。此處提供
2.“統計分類”