null hypothesis同confidence概念困惑

✔ 最佳答案

你可以咁諗，係probability同埋statistics的學界入邊，每一個variable都有佢的natural variation，做hypothesis testing的philosophy是要有一定的「證據」先可以推翻一個假設。（一個常用的比喻：法庭判案，要有證據才能判被告有罪。如果證據不足，疑點利益就歸被告。H0:無罪 vs H1:有罪）

所以，個claim應該係alternative。
例如個claim係某中學學生平均身高高過160cm。
那麼就要假設 H0: 平均身高=160cm (或 <=)
vs H1: 平均身高>160cm
要做的就係搵證據，即係多ｄsample，睇下係咪有好多人>160 cm。
如果係，即係證據係in favor of H1。

至於個計算做法你應該明白，你只係想明白背後咁設立的原意。
----------------------------------------------------------------------------------------------------

其實搵confidence interval並不是一定用normal distribution或chi-square distribution的。

我相信你這樣提問，背後是用了一個好常用的assumption。
就係個population 係normal distribution，或者起碼係接近一個normal distribution，又或者有approximation。咁樣，你所講的就正確，係屬於random sampling的課題。

例如個random variable X係normal, X~N(mu,sigma^2)
咁考慮mu的confidence interval，首先要知道mu的estimator是sample mean (bar X) = (X1 + ... + Xn)/n
由於每個 Xi 都是 normal, bar X 也是normal
bar X ~ N(mu, sigma^2/n)
所以你construct mu的confidence interval就用bar X 同埋 normal distribution

而proportion就係用左normal approximation。
我用probability的符號黎解釋, proportion = X/n where X is count and n is total.
X是binomial random variable, X~B(n,p)
如果n大，p接近0.5，那麼可以approximated為X~N(np, np(1-p))
於是 proportion ~ N(p, p(1-p)/n)
所以confidence interval也用normal

至於variance果個就複雜少少。
你仍然要假設random variable X係normal, X~N(mu,sigma^2)
你想找 sigma^2 的confidence interval
首先要知道 sigma^2 的estimator是sample variance S^2 = sum (Xi - barX)^2/(n-1)
（這個是unbiased estimator。）
然後，你要明白的是這個estimator S^2跟chi-sq distribution有關。
正確一點說：
(n-1)S^2/sigma^2 ~ ChiSq(df = n-1)
（如果你想再詳細知道這個proof我可以再解釋，但我相信現階段你大概明白了個原因。）

最後，用最簡短的回答去解你的問題：
「你要留意個estimator係乜野distribution。」
population mean --> 用sample mean, 佢係normal
proportion --> 可以approximated by normal
population variance --> 用sample variance, 跟chi-sq有關

2013-07-25 15:19:22 補充：
我明白你的意思。
但一般來說，做hypothesis testing的原則是：
設立 null as: height = 160
alt as: height =/= 160
看看有否足夠證據推翻"height = 160"

所以如果當真個claim是"height = 160"，這樣你被逼把它放在H0，那麼做testing就只可以說這個claim有否被推翻，但留意一點，沒有被推翻不等於正確。所以在用語上也有一些爭議，我們會說 H0 is not rejected，而盡量不說 H0 is accepted.

所以如果你想用證據（即數據）去證明一些claim，你就要放在H1

null hypothesis同confidence概念困惑

回答 (1)