數據挖掘(data mining)和機器學習(machine learning)的區別
數據挖掘和機器學習是兩個密切相關的領域。作為親屬,他們是相似的,但他們有不同的父母。但目前,兩者的生長越來越相似,幾乎與雙胞胎相似。因此,有人將機器學習用於數據挖掘。然而,當您閱讀本文時,您將瞭解到機器語言不同於數據挖掘。一個關鍵的區別在於,數據挖掘是用來從現有數據中獲取規則,而機器學習則教會計算機學習和理解給定的規則。
什麼是數據挖掘(data mining)?
數據挖掘是從數據中提取隱含的、先前未知的、潛在有用的信息的過程。儘管數據挖掘聽起來很新,但技術卻不是。數據挖掘是大型數據集中模式計算披露的主要方法。它還涉及機器學習、人工智能、統計和數據庫系統的交叉點。數據挖掘領域包括數據庫和數據管理、數據預處理、推理考慮、複雜性考慮、發現結構的後處理和在線更新。數據挖掘、數據釣魚和數據窺探是數據挖掘中更常見的術語。
如今,公司多年來都在使用功能強大的計算機來檢查大量數據和分析市場研究報告。數據挖掘幫助這些公司識別內部因素(如價格、員工技能)和外部因素(如競爭、經濟狀況和客戶人口統計)之間的關係。
什麼是機器學習(machine learning)?
機器學習是計算機科學的一部分,與數據挖掘非常相似。機器學習還用於在系統中搜索模式,探索算法的構造和學習。機器學習是一種人工智能,它為計算機提供學習的能力,而無需顯式編程。機器學習的主要目標是開發計算機程序,這些程序能夠教會自己根據新的情況成長和變化,它真正接近於計算統計學。它也與數學優化有很強的聯繫。機器學習的一些最常見的應用是垃圾郵件過濾、光學字符識別和搜索引擎。
機器學習有時與數據挖掘相沖突,因為兩者都像骰子上的兩張臉。機器學習任務通常分為三大類,如監督學習、無監督學習和強化學習。
數據挖掘(data mining)和機器學習(machine learning)的區別
它們的工作原理
數據挖掘:數據挖掘是一個從明顯的非結構化數據開始尋找有趣模式的過程。
機器學習:機器學習使用很多算法。
數據
數據挖掘:數據挖掘用於從任何數據倉庫中提取數據。
機器學習:機器學習是閱讀與系統軟件有關的機器。
應用
數據挖掘:數據挖掘主要利用來自特定領域的數據。
機器學習:機器學習技術是相當普遍的,可以應用於各種設置。
集中
數據挖掘:數據挖掘社區主要關注算法和應用程序。
機器學習:機器學習社區在理論上付出更多。
方**
數據挖掘:數據挖掘用於從數據中獲取規則。
機器學習:機器學習教會計算機學習和理解給定的規則。
研究
數據挖掘:數據挖掘是一個使用機器學習等方法的研究領域。
機器學習:機器學習是一種讓計算機完成智能任務的方法。
小結:
數據挖掘與機器學習
雖然機器學習與數據挖掘完全不同,但它們之間通常是相似的。數據挖掘是從大量數據中提取隱藏模式的過程,而機器學習是一種也可以用於此的工具。機器學習領域隨著人工智能的發展而進一步發展。數據挖掘者通常對機器學習有強烈的興趣。數據挖掘和機器學習,在人工智能的發展和研究領域都是平等合作的。
Image Courtesy:
1. "CRISP-DM Process Diagram" by Kenneth Jensen - Own work. [CC BY-SA 3.0] via Wikimedia Comm***
2. "Automated online assistant" by Bemidji State University [Public Domain] via Wikimedia Comm***