✔ 最佳答案
這是基本的東西, 哪裡需要 "高手"?
假設:
營業車駕駛一年內收到違規告發的次數接近常態分佈.
假設:
營業車駕駛一年內收到違規告發的次數的平均數是 10,
變異數是 9 (標準差是 3).
什麼時候我們會懷疑 群體平均數 不是 10?
那就是; 樣本平均數遠離 10 的時候.
如果 n=36, Xbar=9.2, 這值與 10 的差是 |9.2-10| = 0.8.
這個差距算不算大?
兩個方式去評估:
(1) 找一個界限 d, 當 |Xbar-10| 超過這個 d 就說這個差距大到
有理由相信 "μ=10" 是錯的.
(2) 可以問: 如果 |Xbar-10| = 0.8 算大, 那麼從 N(10,9) 隨機抽
出 n =36 的一組樣本, 會得到 |Xbar-10| ≧ 0.8 的機率是多
少? 如果這個機率小, 當然可以說 |Xbar-10| = 0.8 是大的;
如果機率不小, 那麼說這樣的差距大未免太隨便了!
(1) 的方法是考慮在 μ=10, σ^2 =9 的常態分布之下, Xbar 的抽
樣分布, 然後取尾巴部分有一個小機率之下 Xbar 的分界. 例如
兩邊尾巴各 0.025 (2.5%), 也就是說考慮 95% 的 Xbar 可能的
範圍, 是 10±1.96*σ/√n = 10±1.96*3/√36 = 9.02~10.98. 在這
範圍內的 Xbar 被認為與 μ=10 的差距不大. 所以 Xbar = 9.2 是
合理的; 而 Xbar = 5.8 就不合理了!
(2) 的方法也是考慮群體是 μ=10, σ^2 =9 的常態分布之下,
Xbar 的抽樣分布, 而根據這個抽樣分布計算 "抽到和目前資料
一樣, 或更極端 (Xbar 更遠離 μ=10) 的資料的機率, 稱之為
p-值.
Xbar = 9.2, 則
P[|Xbar-10|/(σ/√n)≧|9.2-10|/(3/√36)]
= P[|Xbar-10|/(σ/√n)≧1.6]
= P[|Z|≧1.6] 其中 Z 是標準常態變量.
查常態機率表再簡單計算得 p-值 = 0.11. 這個數值不算大也
不算小. 一般, 在統計應用上會認為這個 p 值不算小, 因此有
這樣的 Xbar 不會認為 μ=10 值得懷疑.
Xbar = 5.8, 則
P[|Xbar-10|/(σ/√n)≧|5.8-10|/(3/√36)]
= P[|Z|≧8.4] 這機率非常接近 0 了!
由於 p-值實在太低了, 因此不能不懷疑 μ=10 這個假說.
以上計算與你的 "解答" 不同. 以下說明為什麼:
(1) 常態分布的符號寫法通常是 N(μ,σ^2), 雖然也有少數作者在
初級課程可能採 N(μ,σ). 假設群體接近常態分布, μ=10, 那
麼此處是不可能假設 σ=9 的! 因為 "一年內收到違規告發
的次數不能是負值, μ=10 離左邊界限 0 僅略大於一倍標準
差, 這怎麼可能接近常態? 假設 σ=3, 則差可矣! 所以上面
的計算假設 9 是 σ^2 而非 σ.
(2) 我算的是 "雙邊 p 值", 取 "雙尾" 臨界值, 因為要問的是 μ=10
的假說是否有足夠證據去懷疑, 並沒有認定 μ 只能小於 10
不能大於 10. 所以計算 p 值用 P[Xbar≦9.2], P[Xbar≦5.8]
是不對的, 要計算 P[|Xbar-10|≦0.,8] 及 P[|Xabr-10|≦4.20.
2013-06-22 03:19:03 補充:
Excel 操作?
這裡需要 Excel 的不過是計算 z 值 (=(9.2-10)/sqrt(9/36) 之類)
以及由 z 值計算 P[|Z|>|z|) (Excel 用 =2*NORMSDIST(-ABS(z)),
其中 "z" 要以儈存 z 值的儲存格代.)
9.2 5.8
-1.6 -8.4
0.109598583 4.46479E-17
9.2 5.8
=(A1-10)/SQRT(9/36) =(B1-10)/SQRT(9/36)
=2*NORMSDIST(-ABS(A2)) =2*NORMSDIST(-ABS(B2))