大多數情況下,當您運行統計時,您希望使用統計軟件。這些工具是用來做計算的,比如t檢驗、卡方檢驗、相關性等等。Excel不是用來進行數據分析的。但這並不意味著你做不到。
不幸的是,Excel的統計功能並不總是直觀的。他們通常會給你一些深奧的結果。因此,我們不使用stats函數,而是使用go to Excel statistics外接程序:數據分析工具包。
儘管Toolpak的拼寫相當糟糕,但它包含了大量有用的統計功能。讓我們看看我們能用Excel統計做些什麼。
雖然您可以不用數據分析工具包來進行統計,但使用它要容易得多。要在Excel 2016中安裝Toolpak,請轉到“文件”>;“選項”>;“加載項”。
單擊“管理:Excel加載項”旁邊的“轉到”
在生成的窗口中,選中Analysis Toolpak旁邊的框,然後單擊OK。
如果您將數據分析工具包正確添加到Excel中,您將在“數據”選項卡中看到一個數據分析按鈕,分組到“分析”部分:
如果您想要更強大的功能,請務必查看Excel的其他加載項。
無論您正在運行什麼統計測試,您可能都希望首先獲得Excel的描述性統計數據。這將為您提供有關均值、中位數、方差、標準差和誤差、峰度、偏度和各種其他數字的信息。
在Excel中運行描述性統計很容易。單擊“數據”選項卡中的“數據分析”,選擇“描述性統計”,然後選擇輸入範圍。單擊“輸入範圍”字段旁邊的箭頭,單擊並拖動以選擇數據,然後按Enter鍵(或單擊相應的向下箭頭),如下面的GIF所示。
之後,確保告訴Excel您的數據是否有標籤,您希望輸出在新的工作表中還是在同一個工作表上,以及您希望彙總統計信息和其他選項。
之後,點擊OK,您將得到描述性統計:
t檢驗是最基本的統計檢驗之一,用Toolpak在Excel中很容易計算。單擊數據分析按鈕並向下滾動,直到看到t-test選項。
您有三個選擇:
要測試兩個樣本的方差是否相等,需要進行F檢驗。在分析工具列表中找到F-Test Two Sample for Variances,選擇它,然後單擊OK。
在輸入範圍框中輸入兩個數據集。把alpha值保持在0.05,除非你有理由改變它——如果你不知道這意味著什麼,就離開吧。最後,單擊“確定”。
Excel將在新工作表中顯示結果(除非您在當前工作表中選擇了輸出範圍和單元格):
你看到的是P值。如果小於0.05,則方差不相等。所以要運行t檢驗,應該使用不等方差選項。
要運行t測試,請從“分析工具”窗口中選擇適當的測試,並以與F測試相同的方式選擇兩組數據。將alpha值保留為0.05,然後單擊“確定”。
結果包括了t檢驗需要報告的所有內容:均值、自由度(df)、t統計量以及單尾和雙尾檢驗的P值。如果P值小於0.05,則兩個樣本存在顯著差異。
如果你不確定是使用單尾t檢驗還是雙尾t檢驗,請查看加州大學洛杉磯分校的解釋。
Excel數據分析工具包提供了三種類型的方差分析(ANOVA)。不幸的是,它不能讓您運行必要的後續測試,如Tukey或Bonferroni。但是你可以看到幾個不同的變量之間有沒有關係。
以下是Excel中的三個方差分析測試:
我們將在這裡進行單因素分析。在我們的示例中,我們將查看三組數字,分別標記為“干預1”、“干預2”和“干預3”。要運行方差分析,請單擊“數據分析”,然後選擇“方差分析:單因素”。
選擇輸入範圍並確保告訴Excel您的組是列還是行。我還在這裡選擇了“第一行中的標籤”,以便在結果中顯示組名。
點擊OK後,我們得到以下結果:
注意P值小於0.05,所以我們得到了一個顯著的結果。這意味著在測試中至少有兩個組之間存在顯著差異。但是,由於Excel不提供測試來確定哪些組不同,所以最好查看摘要中顯示的平均值。在我們的例子中,干預3看起來可能是不同的。
這在統計上並不合理。但如果你只是想看看有沒有區別,看看是哪個群體造成的,那就行了。
雙因素方差分析更為複雜。如果您想了解有關何時使用雙因素法的更多信息,請參閱下面的視頻索菲亞網站而“無複製”和“有複製”的例子來自真實的統計數據。
在Excel中計算相關性比t檢驗或方差分析簡單得多。使用“數據分析”按鈕打開“分析工具”窗口並選擇“相關性”。
選擇輸入範圍,將組標識為列或行,並告訴Excel是否有標籤。之後,點擊OK。
你不會得到任何有意義的度量,但是你可以看到每個組是如何與其他組相關聯的。值為1表示絕對相關,表示兩個值完全相同。相關值越接近1,相關性越強。
迴歸是工業中最常用的統計測試之一,Excel為這種計算提供了驚人的能力。我們將在Excel中快速運行多元迴歸。如果您不熟悉迴歸,請查看HBR的《為業務使用迴歸指南》。
假設我們的因變量是血壓,兩個自變量是體重和鹽攝入量。我們想看看哪一個能更好地預測血壓(或者兩者是否都好)。
單擊數據分析並選擇迴歸。這次填寫輸入範圍框時需要小心。輸入Y範圍框應包含單個因變量。輸入X範圍框可以包含多個自變量。對於一個簡單的迴歸,不要擔心其餘的(儘管如果選擇了標籤,記得告訴Excel)。
下面是我們的計算結果:
點擊OK後,你會得到一個大的結果列表。我在這裡強調了體重和鹽攝入量的P值:
如你所見,體重的P值大於0.05,因此沒有顯著的關係。然而,鹽的P值低於0.05,表明它是一個很好的預測血壓的指標。
如果您計劃顯示迴歸數據,請記住,您可以在Excel中將回歸線添加到散點圖中。這是一個偉大的視覺輔助分析。
雖然Excel並不以其統計功能而聞名,但它實際上包含了一些非常有用的功能,例如PowerQuery工具,它對於組合數據集之類的任務非常方便。(學習如何生成您的第一個Microsoft Power Query腳本。)還有數據分析Toolpak statistics插件,它真正展示了Excel的一些最佳功能。我希望您已經學習瞭如何使用Toolpak,現在您可以自己玩一下,弄清楚如何使用它的更多功能。
有了這個,你就可以把你的Excel技能提高到一個新的水平了,我們的文章介紹瞭如何使用Excel的Goal Seek功能來處理更多的數據,以及如何使用vlookup搜索值。在某些時候,您可能還想學習如何將Excel數據導入Python。
... 透過使用一個簡單的資訊電子表格,我們將向您展示如何**一個有用的餅圖。一旦你掌握了竅門,你就可以使用更多的資料來探索各種選擇。 ...
... 如果需要修改資料,可以在編輯器中進行修改。簡單的改變很容易。例如: ...
...到免費的Microsoft Office替代方案,如Office Online,下面介紹如何取消您的Office 365訂閱。) ...
如何快速成為Microsoft Excel超級使用者?畢竟,學習應用程式中的許多命令、公式和快捷方式可能需要很長時間;它的功能遠遠超過人們的想象。 ...