[數學]統計學問題(急)

2015-05-09 9:44 am
二變量數量資料:相關及迴歸

Q:為何自變數等於平均值時,會有最小的預測區間?

Q:說明如何檢定兩個不同且獨立的母體平均值是否相等(雙尾)?

請勿複製貼上,簡錢明確即可,感謝~

回答 (2)

2015-05-09 1:40 pm
✔ 最佳答案
Q:為何自變數等於平均值時 , 會有最小的預測區間?

  Y^(X=xp) ~ N(α+βxp , (1/n + (xp - x̄)²/Sxx)σ²)

  Y^(X=xp)之 1-α 預測區間(P.I.) =Y^(X=xp) ± tα/2√{[1+1/n + (xp - x̄)²/Sxx]MSE}

  自變數等於平均值時 xp = x̄
   Y^(X=xp)之 1-α 預測區間(P.I.) =Y^(X=xp) ± tα/2√[(1+1/n)MSE]
   此時預測區間(P.I.) 為最小


Q:說明如何檢定兩個不同且獨立的母體平均值是否相等(雙尾)?
 1. 若 σ1²,σ2²已知, 查Z表 :
   H0 : u1=u2
   H1 : u1≠u2
   Z = (x̄-ȳ)/√(σ1²/n1+σ2²/n2)
   如果 Z > Zα/2 , 則 Reject H0

 2.
  (1) σ1²=σ2²=σ² 但未知 , 用SP²取代 , 查tα/2(n1+n2-2)表
    H0 : u1=u2
    H1 : u1≠u2
    T = (x̄-ȳ)/√[SP²(1/n1+1/n2)]
    如果 T > tα/2(n1+n2-2) , 則 Reject H0

  (2) σ1²≠σ2² 未知 ,小樣本
    H0 : u1=u2
    H1 : u1≠u2
    T = (x̄-ȳ)/√(S1²/n1+S2²/n2)
    如果 T > tα/2(n) , 則 Reject H0
    備註 : n = (S1²/n1+S2²/n2)²/[(S1²/n1)²/(n1-1)+(S2²/n2)²/(n2-1)]

  (3) n1≧30 , n2≧30 且母體分配未知(大樣本 , 查Z表)
    H0 : u1=u2
    H1 : u1≠u2
    Z = (x̄-ȳ)/√(S1²/n1+S2²/n2)
    如果 Z > Zα/2 , 則 Reject H0
2015-05-10 12:30 pm
對於 慈信 的回答, 有兩點小意見:

(1) 第2題之 1. 拒絕 H0 條件應是 |z| > z(α/2).

(2) 對於 2 之 (3) 適用條件, 個人認為有商榷必要.
該條件根據, 無非是一項對中央極限定理之謬誤, 以為
" n 在 30 以上, 不論群體是什麼分布, 都可引用中央極限定理."

大謬!

如果群體是對數常態分布之類的極偏的分布, 或峰度極高的分布,
那麼, n > 30 或 n ≧ 30 是遠遠不夠的!

2015-05-10 04:37:49 補充:
事實上, "30" 這個樣本數的界限, 是來自 t 值表一般只到 df = 29 或 30.
而所以這樣, 因為最初建立這數值表的時代, 計算工具遠沒現在方便, 更
兼印刷篇幅限制, 所以當時的統計學前輩在主觀判定自由度30之 t 分布
與標準常態分布相差不大的情況之下, 認為可用標準常態分布近似之.

需注意的是: t 分布的基礎是常態分布. 自由度大時 t 分布近似標準常態,
主要不是中央極限定理, 而是大數法則的結果.


又: df=30 時之 t 的臨界值, 在常用顯著水準時, 與標準常態臨界值有
4-7% 的誤差.

2015-05-10 04:39:25 補充:
在關於 t 推論 (以 t 變量為基礎的統計推論) 有
下列 rule of thumb: (見 Moore, et al., 2003, The
Practice of Business Statistics, p.447)
。 Sample size n<15: Use t procedure if the data
are close to normal. If the data are clearly
non-normal or if outliers are present, do not
use t.

2015-05-10 04:39:45 補充:
。 Sample size n≧15: The t procedure can be used
except in the presence of outliers or strong
skewness.
。 Large samples: The t procedure can be used even
for clearly skewed distributions when the sample
is large, roughly n≧40.

2015-05-10 04:40:37 補充:
這些 practical guidelines, 依其註釋,是根據 1975 與
1979 兩篇論文的計算結果而來(p.N-9)。

2015-05-10 04:40:45 補充:
特別注意 "large samples" 的部分, 有兩點:
(1) "Clearly skewed" 是指像卡方(或gamma)之類, 明顯
有偏斜, 但並不表示高度偏斜且厚尾巴的分布如 log-
normal 或比 log-normal 更偏, 尾巴更厚的也適用.
(2) "Roughly n≧40", 表示 "n≧40" 只不夠是一個粗略
設定的界限. 實際上界限要訂在哪裡, 是與群體分布
及應用時能容忍的誤差有關的.
千萬別擴張解釋, 以為任何群體只要n≧40就可適用"!

2015-05-10 04:48:44 補充:
個人曾就指數分布群體及對數常態群體, 以模擬方式看 t 統計量之
分布. 可發現 n = 100 時, t 統計量之相對次數分布, 相較於 t 分布,
仍有明顯左偏, 尤其是群眾分布是像對數常態分布這種高偏態的分
布時, 其偏斜程度相信沒有人可以閉著眼睛否認掉.


收錄日期: 2021-05-04 01:56:51
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20150509000015KK00310

檢視 Wayback Machine 備份