數據挖掘與OLAP
數據挖掘和OLAP都是兩種常見的商業智能(BI)技術。商業智能是指基於計算機的方法,從商業數據中識別和提取有用的信息。數據挖掘是計算機科學的一個領域,研究從大量數據中提取有趣的模式。它結合了人工智能、統計學和數據庫管理等多種方法。OLAP(online ****ytic processing,聯機分析處理)顧名思義是一種查詢多維數據庫的方法的彙編。
數據挖掘也稱為數據中的知識發現(KDD)。如前所述,它是計算機科學的一個領域,研究從原始數據中提取先前未知和有趣的信息。由於數據的指數級增長,特別是在商業等領域,數據挖掘已經成為將大量數據轉化為商業智能的非常重要的工具,因為在過去幾十年中,人工提取模式似乎變得不可能。例如,它目前被用於各種應用,如社交網絡分析、欺詐檢測和營銷。數據挖掘通常處理以下四個任務:聚類、分類、迴歸和關聯。聚類是從非結構化數據中識別相似的組。分類是可以應用於新數據的學習規則,通常包括以下步驟:數據預處理、建模設計、學習/特徵選擇和評估/驗證。迴歸是尋找對數據建模誤差最小的函數。關聯是尋找變量之間的關係。數據挖掘通常被用來回答這樣的問題:哪些是可能有助於沃爾瑪明年獲得高利潤的主要產品。
OLAP是一類為多維查詢****的系統。通常OLAP用於市場營銷、預算、預測和類似的應用程序。不用說,用於OLAP的數據庫配置用於複雜的即席查詢,並且考慮到了快速的性能。通常,矩陣用於顯示OLAP的輸出。行和列由查詢的維度組成。他們經常使用在多個表上聚合的方法來獲得摘要。例如,它可以用來了解沃爾瑪今年的銷售額與去年相比?對下一季度的銷售額有什麼預測?從百分比變化來看,對這一趨勢有何看法?