null hypothesis同confidence概念困惑

2013-07-20 6:10 am
我唔明點解null hypothesis一定要有個等號響入面,
包括等於,大於或等於,小於或等於,

而對立假設alternative就一定冇等號,只有大於或小於。

所以搞到有時個claim係null,有時係alternative,
令我真係無所釋從,求高人解答。
----------------------------------------------------------------------------

第二個問題係,點解搵population mean同proportion
既confidence interval用normal distribution,

而搵population variance/standard deviation既
confidence interval就用chi-sqaure distribution???

究竟係咩一回事?求高人解答,感激不盡!!

回答 (1)

2013-07-24 6:28 am
✔ 最佳答案
你可以咁諗,係probability同埋statistics的學界入邊,每一個variable都有佢的natural variation,做hypothesis testing的philosophy是要有一定的「證據」先可以推翻一個假設。(一個常用的比喻:法庭判案,要有證據才能判被告有罪。如果證據不足,疑點利益就歸被告。H0:無罪 vs H1:有罪)

所以,個claim應該係alternative。
例如個claim係某中學學生平均身高高過160cm。
那麼就要假設 H0: 平均身高=160cm (或 <=)
vs H1: 平均身高>160cm
要做的就係搵證據,即係多dsample,睇下係咪有好多人>160 cm。
如果係,即係證據係in favor of H1。

至於個計算做法你應該明白,你只係想明白背後咁設立的原意。
----------------------------------------------------------------------------------------------------

其實搵confidence interval並不是一定用normal distribution或chi-square distribution的。

我相信你這樣提問,背後是用了一個好常用的assumption。
就係個population 係normal distribution,或者起碼係接近一個normal distribution,又或者有approximation。咁樣,你所講的就正確,係屬於random sampling的課題。

例如個random variable X係normal, X~N(mu,sigma^2)
咁考慮mu的confidence interval,首先要知道mu的estimator是sample mean (bar X) = (X1 + ... + Xn)/n
由於每個 Xi 都是 normal, bar X 也是normal
bar X ~ N(mu, sigma^2/n)
所以你construct mu的confidence interval就用bar X 同埋 normal distribution

而proportion就係用左normal approximation。
我用probability的符號黎解釋, proportion = X/n where X is count and n is total.
X是binomial random variable, X~B(n,p)
如果n大,p接近0.5,那麼可以approximated為X~N(np, np(1-p))
於是 proportion ~ N(p, p(1-p)/n)
所以confidence interval也用normal

至於variance果個就複雜少少。
你仍然要假設random variable X係normal, X~N(mu,sigma^2)
你想找 sigma^2 的confidence interval
首先要知道 sigma^2 的estimator是sample variance S^2 = sum (Xi - barX)^2/(n-1)
(這個是unbiased estimator。)
然後,你要明白的是這個estimator S^2跟chi-sq distribution有關。
正確一點說:
(n-1)S^2/sigma^2 ~ ChiSq(df = n-1)
(如果你想再詳細知道這個proof我可以再解釋,但我相信現階段你大概明白了個原因。)

最後,用最簡短的回答去解你的問題:
「你要留意個estimator係乜野distribution。」
population mean --> 用sample mean, 佢係normal
proportion --> 可以approximated by normal
population variance --> 用sample variance, 跟chi-sq有關

2013-07-25 15:19:22 補充:
我明白你的意思。
但一般來說,做hypothesis testing的原則是:
設立 null as: height = 160
alt as: height =/= 160
看看有否足夠證據推翻"height = 160"

所以如果當真個claim是"height = 160",這樣你被逼把它放在H0,那麼做testing就只可以說這個claim有否被推翻,但留意一點,沒有被推翻不等於正確。所以在用語上也有一些爭議,我們會說 H0 is not rejected,而盡量不說 H0 is accepted.

所以如果你想用證據(即數據)去證明一些claim,你就要放在H1


收錄日期: 2021-04-13 22:09:50
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20130719000051KK00372

檢視 Wayback Machine 備份