簡單隨機樣本與系統隨機樣本
數據是統計中最重要的一件事。由於實際困難,當一個假設被檢驗時,將無法利用來自整個人口的數據。因此,從樣本中獲取數據值,以推斷一個種群。因為,並非所有數據都被使用;在作出的推論中存在不確定性(稱為採樣誤差)。為了儘量減少這種不確定性,選擇無偏樣本是很重要的。
當個體被選為一個樣本時,群體中的每個個體被選中的概率相等,那麼這樣的樣本就被稱為隨機樣本。例如,假設一個社區的100所房子中有10所被選為樣本。每棟房子的編號都寫在一張紙上,100張都放在一個籃子裡。一個人從籃子裡隨機選擇10張不同的紙來替換。然後選擇10個數字作為隨機樣本。
簡單隨機抽樣和系統隨機抽樣都是抽樣技術,其結果是隨機抽樣具有一些不同的性質。
什麼是簡單的隨機抽樣?
簡單隨機樣本是一個隨機樣本,以這樣的方式選擇,即該樣本量的每個樣本(可從總體中選擇)具有相等的被選為樣本的概率。這種抽樣技術要求在整個人群範圍內都能達到。換言之,總體在時間和空間上都應該足夠小,以便有效地進行簡單的隨機抽樣。回過頭來看例子,在第二段中,我們可以看到這裡所做的是簡單的隨機抽樣,用這種方法抽取的10棟房子的樣本是一個簡單的隨機抽樣。
例如,考慮對一家公司生產的燈泡進行終身測試。考慮的人口是該公司生產的所有燈泡。但在這種情況下,有些燈泡尚未生產,有些燈泡已經售出。因此,取樣時間上僅限於目前庫存的燈泡。在這種情況下,不能進行簡單的隨機抽樣,因為不可能確保對於每個k,每個k大小的樣本被選為要調查的樣本的概率相等。
什麼是系統隨機抽樣?
用系統模式選擇的隨機樣本稱為系統隨機樣本。使用這種方法選擇樣本有幾個步驟。
- 編制總體索引(數字應隨機分配)
- 計算採樣間隔的最大值(總體中的個體數除以要為樣本選擇的個體數)
- 選擇一個介於1和最大值之間的隨機數。
- 重複添加“最大值”以選擇其餘的個體。
- 通過選擇與獲得的數字序列相對應的個體來選擇樣本。
例如,考慮在100套房子中選擇10套房子。然後,將房屋編號從1到100,以找到一個系統的隨機樣本。然後,最大值為100/10=10。現在,在1-10範圍內隨機選擇一個數字。這可以通過抽籤來完成。例如,7是由此獲得的數字。隨機抽樣是編號為7、17、27、37、47、57、67、77、87和97的房屋。
簡單隨機抽樣和系統隨機抽樣有什麼區別?•簡單隨機抽樣要求對每個個體分別進行選擇,而系統隨機抽樣則不要求。•在簡單隨機抽樣中,對於每個k,大小為k的每個樣本被選為樣本的概率相等,但在系統隨機抽樣中並非如此 |