如何得知SAMPLE是否NORMAL DISTRIBUTE?

2011-02-25 3:15 pm
我有一SET SAMPLE,但唔知道是否FOLLOW NORMAL DISTRIBUTION? 如果要TEST是否看skewness?

回答 (1)

2011-02-25 7:37 pm
✔ 最佳答案
可以循以下步驟思考:

1 搜集的數據是關於甚麼的。例如燈泡的壽命﹐傳呼台收到的呼叫次數便不會服從正態分佈。反之﹐若果這個數據的值是受多個因素影響﹐而每個因素的影響都是微弱的﹐則這個數據很可能服從正態分佈。

2 正態分佈的平均數﹐中位數和眾數都是一樣的。我們可以計算樣本這三個數值﹐若果相差很大就可以認為數據不服從正態分佈。當然也可以計算偏度或其它有用的統計量。

3 將數據繪圖。正態分佈的標準圖形如下


圖片參考:http://blufiles.storage.live.com/y1p45CsR_1vJTOUcPqq9Spl2NM9NzNgta182muUzd2CLGVpBQPi6eMrDQKb1ZwwpXwXICm8ZtkZ440


若果繪出來的圖不像這個樣子﹐則可以斷定數據不服從正態分佈。

4 若果認為數據看起來服從正態分佈﹐則可以進一步用P-P Plot (probability-probability plot or percent plot),Q-Q Plot (quantile-quantile plot) 去檢驗數據。P-P Plot 是以標準化常態機率(Standardized normal probability)畫出來的﹐而Q-Q Plot 是以變數分佈之分位數(quantile)對應常態分佈之分位數所畫出來的。若果數據服從正態分佈﹐則繪出來的應該接近一條直線。對非常態分配﹐P-P Plot 對中間範圍的數據比較敏感,而Q-Q Plot則對近尾端的數據比較敏感。

5 最後可以用 normality test 去檢驗數據。常用的有Anderson-Darling Test﹐Shapiro-Wilks Test﹐Skewness-Kurtosis All Test (一般統計軟件都會有)。若果這三個test都通過﹐則可以認為數據符合正態分佈。

附註: 根據Chan提出的常態分配與樣本數的原則﹐有以下建議:

小樣本(n<30): 永遠不屬常態分配。
中樣本(30<100): 如果正式統計檢定是有意義的,接受其為非常態分配。否則需藉圖表、偏度和峰態等加以重新檢視,以確認是否屬常態分配。
大樣本(n>100): 如果正式統計檢定顯示沒有意義的,接受其為常態分配。否則需藉圖表、偏度和峰態等加以重新檢視,以確認其非屬常態分配。


收錄日期: 2021-04-13 17:51:11
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20110225000051KK00202

檢視 Wayback Machine 備份