中央極限定理,母體非常態分配

2014-06-11 9:30 pm
那為什麼從中抽取的樣本的平均數會服從常態分怖?能有人詳細些解釋嗎?

那如母體機率分怖是均衡的,那怎樣抽,它的樣本機率分怖也應該是均衡的呀?
更新1:

謝謝老怪物,看了骰子那個例子我懂多了,真的是很專業的統計解釋呢!謝謝

回答 (4)

2014-06-12 6:30 pm
✔ 最佳答案
剛才打了一大篇結果都不見了, 懶得重來.

這裡 http://estat.ncku.edu.tw/java/Clt/CLT1.html 有丟骰子實驗的程序.
雖然 n 最大只到 6, 但也可以看到 "樣本平均數" 的抽樣分布因 n 增大
而向中央 "集中" 的趨勢.

這裡 http://www.statisticalengineering.com/central_limit_theorem.htm
則呈現群體是均勻分布時 n = 1, 2, 3, 4, 8, 16, 32 時 Xbar 的抽樣分布的
圖形. 可以看出 n 愈大, Xbar 的抽樣分布愈接近常態.

2014-06-11 17:54:17 補充:
為什麼 Xbar 的抽樣分布會是向中央(群體平均數)集中?

因為, Xbar = (X1+...+Xn)/n, 除非 Xi 都偏低或都偏高, Xbar 才會
極端的偏低或偏高. 但在隨機抽樣時, 當 X1 偏高時, 其他 Xi 不
一定同時偏高. 比較可能的是有高有低. 因此, 高低綜合的結果,
使 Xbar 更向中央集中. 這也是為什麼 Xbar 的抽樣分布的標準
差會比單一觀測值 Xi 的標準差來得小.

2014-06-11 17:54:29 補充:
例如丟骰子, 同時出現 1點或 6點的機率較小, 因此丟 n=2 個骰
子其平均點數是 1 或 6 的機率較小; 另一方面, 平均點數是 3.5
的情形有 1+6, 2+5, 3+4, 4+3, 5+2 及 6+1 共 6 種情形, 其機率
比平均點數是 1 或 6 的大多了.
.

2014-06-12 10:07:57 補充:
哦, 這次不是系統判違規, 是我自己電腦出問題.

我就把上面的東西貼到回答區好了.

2014-06-12 10:30:18 補充:
如果群體分布是均勻的, 那隨機抽, 不管抽多大樣本, 樣本數據的分布
都應該是接近均勻的 --- 當然 n 太小是看不出來的, 可能 n 在 100 以
上可以顯現吧? 或許 n 至少 1000.

這是 "大數法則"(the Law of Large Numbers) 的體現.


而中央極限定理看的是樣本平均數的 "抽樣分布".

抽樣分布 (sampling distribution) 是指統計量的分布;
樣本分布 (sample distribution) 是指樣本數據的分布, 是與群體分布
(population distribution) 相對的.


先看兩個說明和例子.

這裡 http://estat.ncku.edu.tw/java/Clt/CLT1.html 有丟骰子實驗的程序.
雖然 n 最大只到 6, 但也可以看到 "樣本平均數" 的抽樣分布因 n 增大
而向中央 "集中" 的趨勢.這裡 http://www.statisticalengineering.com/central_limit_theorem.htm
則呈現群體是均勻分布時 n = 1, 2, 3, 4, 8, 16, 32 時 Xbar 的抽樣分布的
圖形. 可以看出 n 愈大, Xbar 的抽樣分布愈接近常態.
為什麼 Xbar 的抽樣分布會是向中央(群體平均數)集中?因為, Xbar = (X1+...+Xn)/n, 除非 Xi 都偏低或都偏高, Xbar 才會
極端的偏低或偏高. 但在隨機抽樣時, 當 X1 偏高時, 其他 Xi 不
一定同時偏高. 比較可能的是有高有低. 因此, 高低綜合的結果,
使 Xbar 更向中央集中. 這也是為什麼 Xbar 的抽樣分布的標準
差會比單一觀測值 Xi 的標準差來得小.
例如丟骰子, 同時出現 1點或 6點的機率較小, 因此丟 n=2 個骰
子其平均點數是 1 或 6 的機率較小; 另一方面, 平均點數是 3.5
的情形有 1+6, 2+5, 3+4, 4+3, 5+2 及 6+1 共 6 種情形, 其機率
比平均點數是 1 或 6 的大多了.


不管群體的分布是什麼樣子, 考慮抽取 n 個數據計算.樣本平均
數時, 都抽到很偏低或很偏高的數據的機率總是比較小的, 通常
是有高有低, 因此 Xbar 總是向中心(群體平均)趨近. 這種現象在
n=2 就能看到了, 而 n 愈大, 愈不可能一律抽到偏低的, 或一律抽
到偏高的. 這就造成 n 愈大, Xbar 的抽樣分布愈像中央集中 (所
以 Var(Xbar) 比群體變異數 Var(X) 要小), 而且形狀趨向鐘形分
布. 而在數學上能證明出: 這終極的形狀, 是常態分布, 或稱 "高
斯分布".


當然, 也有 "例外". 例如 Cauchy 分布群體, 因為尾巴太厚, 也就
是相對於尾巴 "薄" 的分布, 抽到 "極端值" 的機會偏高很多, 因
此雖然 X1,...,Xn 也是高低互見, 但 Xbar 卻無法向中心靠攏. 事
實上不管 n 多大, 從 Cauchy 群體抽出樣本計算 Xbar, 其 Xbar
的抽樣分布與群體分布一模一樣.


尾巴厚到無法計算變異數(或變異數是無窮大), 就可能使中央
極限定理無法成立; 而 Cauchy 分布的尾巴是厚到連平均數都
無法計算.

2014-06-23 1:49 am
到下面的網址看看吧

▶▶http://candy5660601.pixnet.net/blog
2014-06-21 7:49 am
到下面的網址看看吧

▶▶http://candy5660601.pixnet.net/blog
2014-06-12 9:43 am
為了讓 老怪物 師父的答案得以保留,我建議發問者 蛁 網友另開新帖發問,讓 老 怪物 再作答,然後把此帖刪去,那就最理想。

有時候系統很討厭,只要回答當中有一些字眼觸動系統就要強制刪除回答,浪費人家的心機。

大家可以在意見欄先分小段貼出,就自然知道是哪一段文字出問題,有時候是連結,有時候是連續的一堆符號。

雖然比較麻煩,但總好過浪費了心血。

此外,老怪物 應該可以在電郵看到自己被指違規的回答,不必重打。
只要每小段測試貼出即可。

2014-06-13 02:43:55 補充:
給兩位一個實用參考:

《抽樣與抽樣分配》
http://lmh-ymh.myweb.hinet.net/Stat1/ch7.htm


收錄日期: 2021-05-04 01:56:38
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20140611000016KK03620

檢視 Wayback Machine 備份