大家好,
由於對適合度檢定的觀念不甚清楚,因此想藉由舉例請大家指教來釐清細節。
以下可分為自行模擬之資料及實際資料,欲檢定模擬資料是否符合實際資料的分布。
時段 模擬次數Oi 實際次數Ei (Oi-Ei)^2/Ei
00:00 - 00:59 0 1 1
01:00 - 01:59 0 0* 分母為0
02:00 - 02:59 0 0* 分母為0
03:00 - 03:59 0 1 1
04:00 - 04:59 0 0* 分母為0
05:00 - 05:59 4 6 0.6667
06:00 - 06:59 34 34 0
07:00 - 07:59 28 33 0.7576
08:00 - 08:59 40 44 0.3636
09:00 - 09:59 45 45 0
10:00 - 10:59 31 31 0
11:00 - 11:59 5 6 0.1667
12:00 - 12:59 7 7 0
13:00 - 13:59 3 3 0
14:00 - 14:59 2 4 1
15:00 - 15:59 6 6 0
16:00 - 16:59 1 1 0
17:00 - 17:59 4 5 0.2
18:00 - 18:59 1 1 0
19:00 - 19:59 4 4 0
20:00 - 20:59 0 1 1
21:00 - 21:59 1 1 0
22:00 - 22:59 1 1 0
23:00 - 23:59 0 0* 分母為0
【以下為檢定過程】
H0:模擬資料符合實際資料
H1:模擬資料不符合實際資料
顯著水準:a=0.05
自由度df=24-1=23
臨界值:X^2(0.95,23)=35.127
卡方值:X^2=6.1545(為以上(Oi-Ei)^2/Ei之累加)
由於X^2(0.95,23)>X^2,故不拒絕H0
結論:模擬資料符合實際資料
【以下為我的問題】
1.若檢定資料的期望次數(Ei)若為0(資料中有打" * "的0),會出現分母為0的情況,無法計算其卡方值。請問此情況是否要將該時段忽略掉,還是卡方值以0計算?
2.由翻書所得到的結論,我將模擬資料作為觀察次數(Oi)、實際資料為期望次數(Ei),請問這樣的判斷是否為正確?