✔ 最佳答案
你可以咁諗,係probability同埋statistics的學界入邊,每一個variable都有佢的natural variation,做hypothesis testing的philosophy是要有一定的「證據」先可以推翻一個假設。(一個常用的比喻:法庭判案,要有證據才能判被告有罪。如果證據不足,疑點利益就歸被告。H0:無罪 vs H1:有罪)
所以,個claim應該係alternative。
例如個claim係某中學學生平均身高高過160cm。
那麼就要假設 H0: 平均身高=160cm (或 <=)
vs H1: 平均身高>160cm
要做的就係搵證據,即係多dsample,睇下係咪有好多人>160 cm。
如果係,即係證據係in favor of H1。
至於個計算做法你應該明白,你只係想明白背後咁設立的原意。
----------------------------------------------------------------------------------------------------
其實搵confidence interval並不是一定用normal distribution或chi-square distribution的。
我相信你這樣提問,背後是用了一個好常用的assumption。
就係個population 係normal distribution,或者起碼係接近一個normal distribution,又或者有approximation。咁樣,你所講的就正確,係屬於random sampling的課題。
例如個random variable X係normal, X~N(mu,sigma^2)
咁考慮mu的confidence interval,首先要知道mu的estimator是sample mean (bar X) = (X1 + ... + Xn)/n
由於每個 Xi 都是 normal, bar X 也是normal
bar X ~ N(mu, sigma^2/n)
所以你construct mu的confidence interval就用bar X 同埋 normal distribution
而proportion就係用左normal approximation。
我用probability的符號黎解釋, proportion = X/n where X is count and n is total.
X是binomial random variable, X~B(n,p)
如果n大,p接近0.5,那麼可以approximated為X~N(np, np(1-p))
於是 proportion ~ N(p, p(1-p)/n)
所以confidence interval也用normal
至於variance果個就複雜少少。
你仍然要假設random variable X係normal, X~N(mu,sigma^2)
你想找 sigma^2 的confidence interval
首先要知道 sigma^2 的estimator是sample variance S^2 = sum (Xi - barX)^2/(n-1)
(這個是unbiased estimator。)
然後,你要明白的是這個estimator S^2跟chi-sq distribution有關。
正確一點說:
(n-1)S^2/sigma^2 ~ ChiSq(df = n-1)
(如果你想再詳細知道這個proof我可以再解釋,但我相信現階段你大概明白了個原因。)
最後,用最簡短的回答去解你的問題:
「你要留意個estimator係乜野distribution。」
population mean --> 用sample mean, 佢係normal
proportion --> 可以approximated by normal
population variance --> 用sample variance, 跟chi-sq有關
2013-07-25 15:19:22 補充:
我明白你的意思。
但一般來說,做hypothesis testing的原則是:
設立 null as: height = 160
alt as: height =/= 160
看看有否足夠證據推翻"height = 160"
所以如果當真個claim是"height = 160",這樣你被逼把它放在H0,那麼做testing就只可以說這個claim有否被推翻,但留意一點,沒有被推翻不等於正確。所以在用語上也有一些爭議,我們會說 H0 is not rejected,而盡量不說 H0 is accepted.
所以如果你想用證據(即數據)去證明一些claim,你就要放在H1