中央極限定理相關問題

2011-06-28 4:19 am
1.中央極限定理是不是在說若樣本數夠大樣本平均數會趨近於母體平均數?
_
2.為何標準化是(x-μ) / (σ/√n),而不是直接除σ就好,為何還要σ/√n?(那為何不√n-1要√n)
3.標準化公式不是(觀察值-平均數)/標準差嗎?
4.http://www.math.nsysu.edu.tw/StatDemo/CentralLimitTheorem/CentralLimit.html中的2.方法,n→∞ 這個是什麼東西阿?N(0,1)代表什麼,整個東西是什麼? --→N(0,1)
更新1:

1.什麼是(LLN)? 2."→"這個符號代表什麼意思        _ 3.為何標準化是(x-μ) / (σ/√n),我還是看不懂,可以簡單的說嗎? 4.N(0,1) 即平均μ=0,平均為0有意義嗎?為什麼是要標準差為1?? 5.大小X有差別嗎? 6.SAM你是分為標準常態跟中央極限定理(上下)來說嗎?

更新2:

1.所以0是中央,往左代表負的,往右代表正的,那幾個正負標準差包含所有的資料? 2.常態分佈是鐘形嗎?代表機率的分佈嗎?那中央的0可以代成標本的平均數嗎?這才可以檢定不是嗎?若是正負幾個標準差沒有一個明確答案怎麼檢定?

更新3:

(√n*σ)/n是怎麼變成σ/√n的? N(0,1)為何標準差要設為1而不是2或3?

更新4:

那正負1、2、3個標準差是包含68.26%、95.44%、99.72%對吧,那68.26%、95.44%、99.72%這些值怎麼算來的

更新5:

若N(0,1)改成N(0,2),當Z=1的時候,是不是就包含正負2個標準差的範圍?那是不是也可改成N(0,0.5)

更新6:

謝謝,非常的瞭解了,Z=(x-u)/ σ,若標準差越大則Z值越小,這的標準差指的是N(0,1)的1嗎?正負1S的68%要怎麼算?所以N(0,X) X要多少都可以自己設,只是要服從平均數=0,σ^2=X 對吧?

更新7:

1.所以只能透過查表得到數字68%,無法透過計算,那落在正負1s之內的機率是68%的意思嗎? 2.固定σ所設定的極限值指的是N(0,1)的1還是全部樣本母體標準差?

更新8:

1.所以資料落在正負3S之外的機率是1-(0.4987*2)對吧? 2.信心水準95%代表正負1.96S之內的資料都是可信的對吧?剩下5%為不可信是嗎? 3.N(0,4)範圍是-3.92~3.92,3.92我要怎麼找表才可以找到3.92? 4.=norminv(p,0,1)以機率找Z值但P我代0.95為何出來不是1.96而是1.644,而=normdist(Z,0,1,true) Z代1.96是0.975不是0.95 5.N(4,4)信心水準95%範圍是(0.08~7.92) ,那資料落在0.08~7.92的機率是多少阿?

更新9:

謝謝舒凡回答的這麼仔細,我的疑問只剩下2011-06-30 14:43:52 補充的3~5了,可以請舒凡幫我解答一下嗎

更新10:

所以Z值(倍數)的決定是看信心水準去查表,在乘上σ就是真實的範圍了吧,這次我應該說對了!?

更新11:

若考中興財金研究所,統計我應該注重哪個部分,舒凡知道嗎?

更新12:

抽樣單點的機率,標準化是(x-μ) / σ ↑什麼是抽樣單點的機率? 抽樣平均數,標準化是(x-μ) / (σ/√n) ↑什麼是抽樣平均數?是抽樣平均數的機率嗎? 兩者差別在哪阿?這攸關標準差採用

更新13:

所以中央極限定理用平均數的標準差的主要原因在「當樣本數夠大時,"抽樣的平均數",其分配會接近常態分配」雙引號內的原因 若只是要看樣本的分佈狀況用σ就好了 以上解釋對嗎?

更新14:

我問你答的問題應該就是全部中央極限的範圍了吧,感覺全部講完了

更新15:

我很好奇,若母體不為常態分佈,那樣本夠大,樣本平均數還會接近常態嗎?還是抽樣平均數不受母體分佈影響?

更新16:

所以指的是"抽樣平均數"並非抽樣分配達常態是嗎

回答 (4)

2011-06-29 6:27 pm
✔ 最佳答案
您好,舒凡很高興為您說明 1.中央極限定理是不是在說若樣本數夠大樣本平均數會趨近於母體平均數?
正確的說法:當樣本數夠大時,抽樣的平均數,其分配會接近常態分配。
2.為何標準化是(x-μ) / (σ/√n),而不是直接除σ就好,為何還要σ/√n?(那為何不√n-1要√n)這裡的σ是抽樣或母體的標準差,如果你計算抽樣單點的機率,標準化是(x-μ) / σ而(σ/√n)是平均數的標準差,當我們計算的對象是”抽樣平均數”,就要用平均數的標準差。為什麼不是/√(n-1)呢?因為抽樣平均的標準差是這樣來的當兩獨立變數(A,B)相加時,其變異數(σ^2)=兩者變異數的相加=(σA^2+σB^2)因此對單一母體進行抽樣,如果一次抽n個,這n個相加(總和)的變異數=n*σ^2總和的標準差=√n*σ平均數的標準差=總和的標準差/n=(√n*σ)/n=σ/√n
3.標準化公式不是(觀察值-平均數)/標準差嗎?是的!!這公式沒有改變但是如果你是計算平均數的分布機率,你的標準差,就要用平均數的標準差(σ/√n)(抽1個數的Z值=(觀察值-母體平均數)/標準差)(抽5個的平均的Z值=(觀察平均值-母體平均數)/(平均數的標準差)
4.http://www.math.nsysu.edu.tw/StatDemo/CentralLimitTheorem/CentralLimit.html中的2.方法,n→∞ 這個是什麼東西阿?N(0,1)代表什麼,整個東西是什麼? --→N(0,1)N(0,1)代表: 平均數為0,變異數為1 的常態分佈
標準差=變異數開根號,因此在N(0,1)之下,標準差也等於1
常態分布是以平均數為中心,然後依照標準差的倍數(Z=(x-u)/ σ)向左右進行延伸~因此變異數的大小,會決定這個分配的分布程度~ 有關常態分配的解說,可以到以下網址參閱http://www3.nccu.edu.tw/~soci1005/CH5.pdf其實網路上常態分配的講義很多,自己也可以搜尋到希望有幫到您若還有疑問,補充後會繼續回答

2011-06-29 15:25:45 補充:
幾個正負標準差包含所有的資料?答案是無限大~
常態又稱鐘型,Z值代表標準差的倍數,中央0通常指母體的平均數,但可以用樣本平均數代替。
若要進行檢定,就要先確定顯著水準或信心水準,也就是要定義,在多少範圍內算相同,多少以外算不同,常見的信心水準有90%,95%或99%。

2011-06-29 15:26:48 補充:
有了信心水準(涵蓋的機率),就可以找出對應的Z值(判定臨界值),然後就可以進行檢定了~~

2011-06-29 16:23:55 補充:
N(0,2),再次說明這個函數的定義=服從平均值0,變異數 =2的常態分配,因此標準差是1.41
在常態分配中,相同Z值所涵蓋的機率是一樣的
當你的規格設定為Z=1時,不管變異數多少,0+/- (Z=1)的機率永遠是68%
因此規格界線是+/-1.41
N(0,2)在這時所代表的定義是
0+/- 1.41的範圍涵蓋68%的機率(因為1.41剛好是1倍標準差,Z=1)
如果改為N(0,1)但是規格還是+/-1.41,那我們就要查Z=1.41的涵蓋機率,查表p=0.8414
也就是0+/- 1.41的範圍涵蓋84.14%

2011-06-29 16:26:00 補充:
目前常態分配,大多用查表
http://www.cust.edu.tw/mathmet/stat/z-dist.doc
也可以用excel 的公式
Z值以下的機率=normdist(Z,0,1,true)
機率p反查Z值=norminv(p,0,1)

2011-06-30 10:29:57 補充:
Z=(x-u)/ σ,若標準差越大則Z值越小:前提是你所設定的極限值,要固定
sigma是指一個全體的分布狀況,因此他不是愛喊多少就多少,是依照群體或抽樣的結過計算出來的。
正負1倍標準差的機率怎算?查表
我們從表上可以查到Z=1.0 , p=0.3413,注意此表的右下角,有一個圖,是說表中的機率是P(平均值~Z)機率,因此,P(Z=0~1)=0.3413
-而常態是左右對稱,因此P(Z=0~-1)也是0.3413
相加後P(-1<1)=0.6826=68.26%

2011-06-30 11:57:23 補充:
所謂極限值,是你要檢定的量,例如信心水準設95%,換算Z值=1.96 ,你的範圍就會是(-1.96<1.96)
如果你的分配是N(0,1)那實際的範圍就是-1.96~1.96
但如果你的分配N(0,4)那實際值範圍就是-3.92~3.92
常態分配的平均值,也可以不為0 ,如果N(4,4)那95%的信心水準範圍應該就是(0.08~7.92)

2011-06-30 14:58:55 補充:
1.你對了
2.信心水準95%代表有95%的數據會在這個範圍內,而這個範圍是+/-1.96S

2011-06-30 15:12:19 補充:
N(0,4),標準差=2
P(-1.96<1.96)=P(2*-1.96<2*1.96)=95%
excel公式的部份,請認真看,
=normdist(Z,0,1,true)是指Z值以下的機率,所以是單邊的機率,信心水準是雙邊的。
請認真一個字一個字看

2011-06-30 15:48:10 補充:
3.92=2*1.96
1.96是Z值,代表標準差倍數,而真實數據的標準差是2 ,因此Z=1.96 ,真實數據的點就是2*1.96=3.92
Z值以下的機率代表從負無窮大到那個Z值的機率,而我們的95%是以中心向外擴散~
在此所謂超出95%,是小於-1.96有0.025 ,大於1.96也有0.025 相加,就是0.05
1-0.975=0.025 這是Z>1.96的機率
.N(4,4)信心水準95%範圍是(0.08~7.92)=有95%的數據落在(0.08~7.92)

2011-06-30 18:51:57 補充:
是的,只要注意你衡量的對象,然後選用抽樣的標準差 還是平均數的標準差

2011-07-01 05:56:39 補充:
抱歉~~我不知道研究所會考甚麼

2011-07-01 13:16:48 補充:
如果你研究抽樣的分布狀況,用抽樣或母體的標準差
例如,抽100個人,有多少人在某個範圍之內,這樣用標準差。
但如果你研究的是抽樣的平均數,就要用平均數的標準差來估計
例如,抽100個人的身高平均,落在某個範圍的機率

2011-07-01 15:54:36 補充:
對了!!重點就是一個是講平均數分布,一個講樣本分布

2011-07-02 06:28:11 補充:
當樣本數夠大時,抽樣的平均數,其分配會接近常態分配
不管母體是甚麼分配,只要樣本數夠大,就會趨近
即使偏態的分配,只要樣本數多,還是會呈現常態。
你去看的那個網頁,不就用骰子?骰子是均勻分配(非常態),但丟多,平均數還是會變成常態。

2011-07-04 10:41:13 補充:
抽樣的分配,量大時,其分配會與母體相當
抽樣的平均數,其分配會服從常態
(好像寫了很多次了)
2011-07-06 8:47 am
舒凡,那我可以問妳CDF定義,F(x)=P(X≦x),X、x代表什麼阿,我看不懂耶,P()不是機率的意思嗎
2011-06-28 10:40 am
1.中央極限定理是不是在說若樣本數夠大樣本平均數會趨近於母體平均數?

這是大數法則 (law of large numbers).

       _
2.為何標準化是(x-μ) / (σ/√n),而不是直接除σ就好,為何還要σ/√n?(那為何不√n-1要√n)


因為 (Xbar-μ)/σ→0 (LLN), 又因為 Var(Xbar)=σ^2/n.
前者表示在樣本數很大時要看 Xbar 的分布必須 "放大" 來看,
後者指出放大倍數是 √n. 至於用 √(n-1) 代替 √n 當然也可以,
但既沒比較合理也沒必要.
2011-06-28 7:11 am
N(0,1) 標準常態分佈,即平均為μ=0,標準差σ=1之常態分佈。

X 之 平均為μ ,標準差為σ, (x-μ) / σ=N(0,1)

XBAR=(X1+X2+...+Xn)/n 之 平均為μ ,標準差為σ/√n
xBAR-μ) / (σ/√n)=N(0,1)

中央極限定理:任何 平均為μ ,標準差為σ,
(xBAR-μ) / (σ/√n)--->N(0,1)。不是(x-μ) / (σ/√n)--->N(0,1)。
請再仔細看 : 2.方法,n→∞ ......之部分。


收錄日期: 2021-05-04 01:44:55
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20110627000010KK07863

檢視 Wayback Machine 備份