請問為何統計檢定的顯著值小於0.05是顯著?

2011-11-19 11:21 pm
請問為何統計檢定的顯著值小於0.05是代表

,有顯著關聯or有顯著差異?

請問是哪個科學家定的?

回答 (3)

2011-11-20 6:36 am
✔ 最佳答案
1.顯著值是一種可以接受誤差的程度,每個人或每種問題可以接受的情形均可不同,並不一定要設定0.05,0.01,0.0156,0.0723,...均可。
2.就好像丟一個公正骰子,你喊6,真的出現6點,你覺得機率高不高,1/6有些人覺得很小,有些人兜得還算大,這就像顯著值一樣,每個人感受不同,依各人感受再去設定顯著值,因此會有不同,不一定要用0.05
2011-11-20 10:13 am
P值的方法是費雪( Ronald Aylmer Fisher)發表的

P值正如其他幾位說的並沒有訂多少,一般只是習慣而已 因為不是統一的標準
所以需要註明的的P值是設定在哪個標準,看需要
因為常用,在一些論文或報告上的資料表格 常會以 * ** ***來代替0.05 0.01,0.001表示
一樣都會附注*代表的意思。

2011-11-20 06:59:36 補充:
* ** *** 是表示算出來的結果P值的數值,沒寫清楚,修正一下
如果你訂0.05 算出來結果是0.02就* 算出來0.000023就***

這樣看到有"星星"就知道 顯著(significant)
不拒絕需無假設(null)的機率很小

至於為何用significant這個字,看起來和習慣的認知不太一樣。
這只是字義的演變,當初費雪時代用這個字的意思和現在有點不同。
現在我們會將這個字用在有明顯重要的意思上,但是費雪當時只用在機率很小到可以放棄的意思。
或許是當時研究統計的人這樣用(我查過字典沒看到這種解釋)

2011-11-20 10:39:31 補充:
其實我在寫的時候就很遲疑該怎麼寫,因為我知道版主問的那個0.05只是一個評估的界限標準,不能說是P值。算出來的才是P值。

因為我在寫東西很容易錯誤(天生殘障),常常修補。寫的和想的有差距是常有的事。也不容易一時看出誤寫在哪裡。
以前考試時還發生過很誇張的事,我很完整的寫了一個課本上的答案,但是老師不是出那樣的數字。考卷發下來,一個大X,老師認為我作弊。
我真的不知道為何會寫這樣,更何況我不是會去背課本的人。

關於P值和費雪的事,如果有興趣的話翻一下,
統計學改變了世界,或是統計讓數字說話。我不記得是在哪本看到的。

(我寫多只會再發生錯誤而已就不多寫了)
2011-11-20 4:42 am
"統計檢定的顯著值小於0.05是代表..."

那 "0.05" 只是一個相因成習的結果, 並沒有任何一個科學家主張
一定要用 0.05. 不過, 有些團體可能認為 0.05 是一個適當的水準.

2011-11-20 08:52:01 補充:
樓上 "不拒絕需無假設(null)的機率很小" 這話有問題!


顯著水準或 P 值都不是代表 "不拒絕xx假設的機率".

顯著水準是: 在虛無假說成立之下, 錯誤地拒絕虛無假說的機率的上限.
它本身不是機率, 只是一個上限.

P值雖然可以用機率解釋, 但它也不是 "不拒絕..." 或 "拒絕..." 的機率.
P值有兩種意義:
(1) 以手上的資料, 虛無假說能被拒絕的最小顯著水準.
(2) 在虛無假說成立的某一種情形, 看到像手上的資料或比手上資料
  更 "極端" 的情況的機率.

2011-11-20 09:06:30 補充:
就上列 P 值的第一種意義來說, 它是顯著水準的一個界限, 而
顯著水準又是某種界限...


就P值的第2種意義來說, 有兩點需要分說的: 一是所謂 "虛無假
說成立的某一種情形", 另一是所謂 "更極端" 的意義.

在許多檢定問題, 虛無假說並不是 "簡單假說", 也就是它並不能
完全確定群體分布. 例如最簡單的常態群體平均數檢定 H0:μ=μ0,
除非群體變異數已知(這實際上是不可能的, 只存在於教科書的假
設情況), 否則知道μ, 整個群體分布仍不確知.

2011-11-20 09:22:29 補充:
...因此, 所謂 "虛無假說成立的某一種情形", 就是 μ=μ0, 而且標準差
是某一確定值. 好在t檢定所用的t統計量的分布在μ=μ0時與群體標準
差無關, 因此避開了選擇標準差的問題. 一般, P值是
  p值 = sup{P(看到如手上資料或更極端資料; θ): θ 在H0中}
"sup" 可以理解為 "max"(maximum), 雖然數學上不大一樣.



其次, 用機率定義P值, 要考慮計算機率的事件是 "看到如手上資料
或更極端資料".

2011-11-20 09:24:13 補充:
... 其一, 就必要性而言, 計算機率不能只考慮單一資料點(一組樣本
資料只是在所定描樣設計下樣本空間的一點), 而必須考慮樣本空間
中的一塊區域. 而 P 值考慮的就是 "如手上資料或更極端". 這就有
了另一問題: 什麼是 "更極端"? 或者說: 所謂 "極端" 是什麼意思?

當虛無假說成立與不成立, 資料的趨向會不同. 例如平均數檢定問題,
虛無假說 H0:μ=μ0 成立時, 樣本平均數會較靠近μ0; 而虛無假說不成
立時, 樣本平均數傾向遠離μ0.

2011-11-20 09:24:34 補充:
... 因此界定了 "更極端" 的方向就是 "樣本平均數與μ0的距離更大",
所以此時 P 值是:
  p值 = P(|t統計量|≧(xbar-μ0)/se; μ=μ0)

"更極端" 的定義也有可能不是用單一檢定統計量的大小定義的, 例如
可能用檢定統計量的 p.d.f. 或 p.m.f. 的大小來定義——雖然在許多
"標準" 情況結果一樣, 但也存在與前述檢定統計量大小不一致的情形.
不過, 這樣的問題就不在此深入了.

2011-11-20 09:49:40 補充:
當虛無假說成立與不成立, 資料的趨向會不同. 例如平均數檢定問題,
虛無假說 H0:μ=μ0 成立時, 樣本平均數會較靠近μ0; 而虛無假說
不成立時, 樣本平均數傾向遠離μ0. 因此界定了 "更極端" 的方向就
是 "樣本平均數與μ0的距離更大", 所以此時 P 值是:

  p值 = P(|t統計量|≧|xbar-μ0|/se; μ=μ0)

se 是手上樣本估計出來的 Xbar 的標準差(標準誤), xbar 是手上樣
本的樣本平均數.


收錄日期: 2021-05-04 01:46:38
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20111119000010KK04371

檢視 Wayback Machine 備份