✔ 最佳答案
可以循以下步驟思考:
1 搜集的數據是關於甚麼的。例如燈泡的壽命﹐傳呼台收到的呼叫次數便不會服從正態分佈。反之﹐若果這個數據的值是受多個因素影響﹐而每個因素的影響都是微弱的﹐則這個數據很可能服從正態分佈。
2 正態分佈的平均數﹐中位數和眾數都是一樣的。我們可以計算樣本這三個數值﹐若果相差很大就可以認為數據不服從正態分佈。當然也可以計算偏度或其它有用的統計量。
3 將數據繪圖。正態分佈的標準圖形如下
圖片參考:
http://blufiles.storage.live.com/y1p45CsR_1vJTOUcPqq9Spl2NM9NzNgta182muUzd2CLGVpBQPi6eMrDQKb1ZwwpXwXICm8ZtkZ440
若果繪出來的圖不像這個樣子﹐則可以斷定數據不服從正態分佈。
4 若果認為數據看起來服從正態分佈﹐則可以進一步用P-P Plot (probability-probability plot or percent plot),Q-Q Plot (quantile-quantile plot) 去檢驗數據。P-P Plot 是以標準化常態機率(Standardized normal probability)畫出來的﹐而Q-Q Plot 是以變數分佈之分位數(quantile)對應常態分佈之分位數所畫出來的。若果數據服從正態分佈﹐則繪出來的應該接近一條直線。對非常態分配﹐P-P Plot 對中間範圍的數據比較敏感,而Q-Q Plot則對近尾端的數據比較敏感。
5 最後可以用 normality test 去檢驗數據。常用的有Anderson-Darling Test﹐Shapiro-Wilks Test﹐Skewness-Kurtosis All Test (一般統計軟件都會有)。若果這三個test都通過﹐則可以認為數據符合正態分佈。
附註: 根據Chan提出的常態分配與樣本數的原則﹐有以下建議:
小樣本(n<30): 永遠不屬常態分配。
中樣本(30<100): 如果正式統計檢定是有意義的,接受其為非常態分配。否則需藉圖表、偏度和峰態等加以重新檢視,以確認是否屬常態分配。
大樣本(n>100): 如果正式統計檢定顯示沒有意義的,接受其為常態分配。否則需藉圖表、偏度和峰態等加以重新檢視,以確認其非屬常態分配。