z_p 如 z_0.975, z_0.95 等只是一個標示符號,
代表標準常態機率累積機率 p 所對應的 z 值.
也就是說: z_0.975 = 1.96 表示: 標準常態分配
從最左邊 (-∞) 到 1.96 的累積機率是 0.975;
而 -∞ 累積至 z = 1.645 的累積機率大約 0.95.
有的書會用 "右尾機率" 做標識, 因此如果在其
他地方或別的書看到 z_0.05 = 1.645 或 z_0.025
= 1.96 別訝異. 由於一般應用的右尾機率值 α 很
小, 因此 z_α 或 z_(1-α) 的符號並不會產生混淆.
當然一本書 (文集除外, 因那是多人文章彙集)
也不會有時採用 z_α 標識法, 另一時又採用 z_p
標識法.
何時採用右尾、左尾、雙尾檢定? 這很難直接輕
易斷明. 基本上一個假說檢定(hypotheses testing)
首先要決定 "虛無假說"(null hypothesis) 和 "對
立假說"(alternative hypothesis). 至於右尾、左
尾與雙尾之分, 只是根據一雙假說產生的檢定判
斷規則的表現.
虛無假說一個簡單的界定是: 統計人員 (應用統計
做決策的人) 所要推翻、又要保護的假說.
看起來很矛盾? 既要推翻 (證明它不對), 又要保護?
很多初級統計或說明統計概念的書會以刑事判案
做類比: 一個刑事案件, 對於嫌犯, 檢察官要積極找
證據證明他有罪; 但另一方面法律卻要保護每個人,
即使是犯罪嫌疑人, 在無充分證據證明他有罪之前
他是被認為無罪的.
統計假說檢定的虛無假說就是這麼個東西: 你想找
到足夠證據證明它是錯的; 但除非有足夠的證據, 否
則必須認為它是對的.
例如說你想證明一批產品是不合格的, 你隨機抽取
小部分樣品做檢驗. 除非你在這些樣品上找到足夠
證據, 否則你不能空口說白話說這批產品不合格.
"這批產品合格" 就是虛無假說, 與此對立的, "這批
產品不合格" 就是對立假說. 至於涉及統計程序最
後是採用左尾、右尾、或雙尾檢定, 則視最後會根
據什麼方式檢驗、用什麼統計量做檢定而決定.
例如某藥品公司想說其藥品對某疾病有效, 就必須
找到足夠證據證明其藥品有效. "無效" 是虛無假說,
"有效" 是對立假說. 最終可能以 "平均康復時間比
使用安慰劑短" 做判定, 也可能用 "平均康復率較高"
做判定. 前者可能導出一個關於平均數的左尾檢定;
後者可能導致一個關於比例的右尾檢定.
再舉個初學者不會接觸到的實際例子:
某藥品過專利期, 其他藥廠想生產; 或藥廠想生產與
原藥不同形態製劑, 需要先做 "生體相當性檢定", 也
就是新生產的藥劑與原專利藥品在人體內表現相當.
以某種量測結果的平均數為準, 藥廠需要證明的是:
μ1 ≦ μ ≦ μ2, 也就是他生產的新藥平均表現 μ 和原
專利藥平均表現 μ0 相差在規範之內 (μ1 ≦ μ ≦ μ2,
其中 μ1, μ2 是根據 μ0 算得). 藥廠想推翻又不得不
保護的虛無假說是 H0: μ ≦ μ1 或 μ > μ2, 對立假說
就是藥廠必須找證據證明的 H1: μ1 ≦ μ ≦ μ2. 這個
檢定用樣本平均數當檢定統計量做 t 檢定, 其拒絕域
形式是 t1 ≦ t ≦ t2 , 是以中間部分為拒絕域, 既非左
尾、右尾, 也非雙尾.