為什麼要用標準差而不用平均絕對離差?

2014-08-15 6:28 am
為什麼要用標準差而不用平均絕對離差?

平均絕對離差不是比較直觀,就代表每個數平均來講差平均值多少
但是標準差是平方後再開根號得來的,就沒辦法這樣想。
而且既然標準差是平方後再開根號得來的應該沒有平均絕對離差來的準吧

是因為標準差跟平均絕對離差來比不用算絕對值所以比較好算嗎?
如果是這樣那在電腦問世後不是交給電腦算就好了,還要用標準差嗎?

那到底為什麼通常一般都是用標準差呢?

回答 (3)

2014-08-18 6:14 pm
✔ 最佳答案
平均絕對離差(通常稱 "平均差) 與 標準差, 並無何者
較 "準確" 的問題.不過, 平均絕對離差必然小於, 最多是等於標準差.平均絕對離差(平均差)常用者有二式, 一是以平均數為
中心, 二是以中位數為中心, 後者小於前者.對一組資料而言, 標準差也有兩種算法, 其一是所謂
群體標準差, 以資料數 N 為除數; 另一是樣本標準差,
以 N-1 (這時資料數 N 通常改用小寫 n, 所以是 n-1)
為除數.
因此, 綜合起來是: 標準差(樣本) > 標準差(群體)
      ≧ 平均差(平均數為中心) ≧ 平均差(中位數為中心)
為何 標準差 比 平均差 更廣泛被使用? 不是前者好算
後者難算. 以計算而言, 標準差要平方還琅開根號, 所
需計算顯然複雜而煩瑣於平均差. 然而, 標準差比較常
被採用, 據我聽過的說法理由是:(1) 標準差的數學性質較便利.
這有幾種理由, (a)標準差的計算式中, "平方" 與 "開方根" 的運算可
以 "微分". 例如, 可以探討一個觀測值的變動對標
準差造成多大影響. 平均差則有些麻煩, 特別是如
以中位數為中心, 那是更加複雜. (b)標準差的平方, 是為變異數, 即平均平方離差, 沒有
開方根, 具有 "正交分解" 的性質. 例如計算平方和
時未以平均數為中心, 可簡單修正:
E[(X-μ)^2] = E[(X-A)^2] - (A-μ)^2
在統計分析方法之迴歸分析、變異數分析, 都可見到
此性質的一種形式: 平方和的正交分解. (c)在推論統計, 群體是常態分布的情況, 標準差或其平
方, 變異數, 具有一個簡單的分布. 相對而言, 樣本
平均差的抽樣分布就複雜了.
(2) 古典推論統計奠基於 "大樣本". 大樣本之下的一個
基本結果是以 常態分布 為推論基礎. 而常態分布兩
個基本參數, 即平均數與標準差 (或平均數與變異數).
後來小樣本理論逐漸被開發, 但起初也都是基於常態
群體(群體分布是常態分布)的假設. 即使後來所謂
"無母數方法"(非參數化方法)被提出並逐漸得到重視,
但仍擺脫不了 "常態分布" 這東西, 因為無母數方法
仍要考慮大樣本情況, 而在大樣本之下無母數方法相
關的統計量抽樣分布免不了再度向 常態分布 靠攏.
因此, 常態分布在統計學/統計方法中具有相當大的重
要性, 而其基本參數之一的標準差, 當然也是一個重
要的東西.



2014-08-19 04:40:10 補充:
(1)
(c)在推論統計, 群體是常態分布的情況, (其簡單隨機樣本之)
標準差或其平方, (樣本)變異數, 具有一個簡單的分布. 相對
而言, 樣本平均差的抽樣分布就複雜了.
2014-08-15 11:01 am
有兩筆資料

(1) 1, 3, 1, 3 平均數=2

(2) 2, 3, 0, 3 平均數=2

您覺得那一組資料離散程度比較大呢?(您可以畫散佈圖來幫助觀察)



接下來我們算平均絕對離差 還有變異數

(1) 平均絕對離差 = (1+1+1+1)/4 =1 ; 變異數 = (1+1+1+1)/4 = 1

(2) 平均絕對離差 = (0+1+2+1)/4 =1 ; 變異數 = (0+1+4+1)/4 = 1.5



觀察我們會發現 由平均絕對離差 我們會判斷兩組資料離散程度相同,無法分辨兩筆資料的差異,而變異數可藉由平方把變異的情況突顯出來,所以在這種情況下,使用變異數或標準差來描述資料的離散程度會比平均絕對離差來的好。
2014-08-15 8:40 pm
用例子來說明:
假設某產品的某品質特性接近標準常態分佈N(0,1) ,
針對此品質特性,要區分以下2批,看看到底哪一批比較好:
第一批: 1,3,.....
第二批: 0,4,.....

從"絕對離差"的觀點,要先計算絕對值之和:
|1|+|3|= 4
|0|+|4|= 4
這兩批的偏差程度一樣,品質一樣.

從"標準差"的觀點,要先計算平方和(SS):
1^2+3^2 = 10
0^2+4^2 = 16
第一批的偏差較小,品質較好.

2014-08-15 12:49:52 補充:
從"自然公差"的觀點,偏離3個標準差以上列為不良品:
第一批: OK
第二批: 一個不良 (4為不良品)

所以,用"標準差"比較接近真實情況.
(相對於"平均絕對離差"而言)

至於為何會如此?
這是因為"平均絕對離差"沒有考慮到一個很重要的因素:
"發生的機率"

2014-08-15 12:56:03 補充:
觀察常態分佈的曲線走勢,自中心值往兩端,
不是直線的成比例下降,而是越靠近兩端越陡降,
所以從機率的觀點,我們"不能"說:
第一批: 1,3,.....
第二批: 0,4,.....
偏差程度一樣


收錄日期: 2021-05-04 02:01:59
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20140814000010KK08505

檢視 Wayback Machine 備份