"統計檢定的顯著值小於0.05是代表..."
那 "0.05" 只是一個相因成習的結果, 並沒有任何一個科學家主張
一定要用 0.05. 不過, 有些團體可能認為 0.05 是一個適當的水準.
2011-11-20 08:52:01 補充:
樓上 "不拒絕需無假設(null)的機率很小" 這話有問題!
顯著水準或 P 值都不是代表 "不拒絕xx假設的機率".
顯著水準是: 在虛無假說成立之下, 錯誤地拒絕虛無假說的機率的上限.
它本身不是機率, 只是一個上限.
P值雖然可以用機率解釋, 但它也不是 "不拒絕..." 或 "拒絕..." 的機率.
P值有兩種意義:
(1) 以手上的資料, 虛無假說能被拒絕的最小顯著水準.
(2) 在虛無假說成立的某一種情形, 看到像手上的資料或比手上資料
更 "極端" 的情況的機率.
2011-11-20 09:06:30 補充:
就上列 P 值的第一種意義來說, 它是顯著水準的一個界限, 而
顯著水準又是某種界限...
就P值的第2種意義來說, 有兩點需要分說的: 一是所謂 "虛無假
說成立的某一種情形", 另一是所謂 "更極端" 的意義.
在許多檢定問題, 虛無假說並不是 "簡單假說", 也就是它並不能
完全確定群體分布. 例如最簡單的常態群體平均數檢定 H0:μ=μ0,
除非群體變異數已知(這實際上是不可能的, 只存在於教科書的假
設情況), 否則知道μ, 整個群體分布仍不確知.
2011-11-20 09:22:29 補充:
...因此, 所謂 "虛無假說成立的某一種情形", 就是 μ=μ0, 而且標準差
是某一確定值. 好在t檢定所用的t統計量的分布在μ=μ0時與群體標準
差無關, 因此避開了選擇標準差的問題. 一般, P值是
p值 = sup{P(看到如手上資料或更極端資料; θ): θ 在H0中}
"sup" 可以理解為 "max"(maximum), 雖然數學上不大一樣.
其次, 用機率定義P值, 要考慮計算機率的事件是 "看到如手上資料
或更極端資料".
2011-11-20 09:24:13 補充:
... 其一, 就必要性而言, 計算機率不能只考慮單一資料點(一組樣本
資料只是在所定描樣設計下樣本空間的一點), 而必須考慮樣本空間
中的一塊區域. 而 P 值考慮的就是 "如手上資料或更極端". 這就有
了另一問題: 什麼是 "更極端"? 或者說: 所謂 "極端" 是什麼意思?
當虛無假說成立與不成立, 資料的趨向會不同. 例如平均數檢定問題,
虛無假說 H0:μ=μ0 成立時, 樣本平均數會較靠近μ0; 而虛無假說不成
立時, 樣本平均數傾向遠離μ0.
2011-11-20 09:24:34 補充:
... 因此界定了 "更極端" 的方向就是 "樣本平均數與μ0的距離更大",
所以此時 P 值是:
p值 = P(|t統計量|≧(xbar-μ0)/se; μ=μ0)
"更極端" 的定義也有可能不是用單一檢定統計量的大小定義的, 例如
可能用檢定統計量的 p.d.f. 或 p.m.f. 的大小來定義——雖然在許多
"標準" 情況結果一樣, 但也存在與前述檢定統計量大小不一致的情形.
不過, 這樣的問題就不在此深入了.
2011-11-20 09:49:40 補充:
當虛無假說成立與不成立, 資料的趨向會不同. 例如平均數檢定問題,
虛無假說 H0:μ=μ0 成立時, 樣本平均數會較靠近μ0; 而虛無假說
不成立時, 樣本平均數傾向遠離μ0. 因此界定了 "更極端" 的方向就
是 "樣本平均數與μ0的距離更大", 所以此時 P 值是:
p值 = P(|t統計量|≧|xbar-μ0|/se; μ=μ0)
se 是手上樣本估計出來的 Xbar 的標準差(標準誤), xbar 是手上樣
本的樣本平均數.