適合度檢定問題?

2013-10-22 6:45 pm
大家好,

由於對適合度檢定的觀念不甚清楚,因此想藉由舉例請大家指教來釐清細節。

以下可分為自行模擬之資料及實際資料,欲檢定模擬資料是否符合實際資料的分布。


時段     模擬次數Oi 實際次數Ei (Oi-Ei)^2/Ei
00:00 - 00:59   0     1      1
01:00 - 01:59   0     0*    分母為0
02:00 - 02:59   0     0*    分母為0
03:00 - 03:59   0     1      1
04:00 - 04:59   0     0*    分母為0
05:00 - 05:59   4     6     0.6667
06:00 - 06:59   34    34      0
07:00 - 07:59   28    33     0.7576
08:00 - 08:59   40    44     0.3636
09:00 - 09:59   45    45      0
10:00 - 10:59   31    31      0
11:00 - 11:59   5     6     0.1667
12:00 - 12:59   7     7      0
13:00 - 13:59   3     3      0
14:00 - 14:59   2     4      1
15:00 - 15:59   6     6      0
16:00 - 16:59   1     1      0
17:00 - 17:59   4     5      0.2
18:00 - 18:59   1     1      0
19:00 - 19:59   4     4      0
20:00 - 20:59   0     1      1
21:00 - 21:59   1     1      0
22:00 - 22:59   1     1      0
23:00 - 23:59   0     0*    分母為0


【以下為檢定過程】

H0:模擬資料符合實際資料
H1:模擬資料不符合實際資料

顯著水準:a=0.05

自由度df=24-1=23

臨界值:X^2(0.95,23)=35.127

卡方值:X^2=6.1545(為以上(Oi-Ei)^2/Ei之累加)

由於X^2(0.95,23)>X^2,故不拒絕H0

結論:模擬資料符合實際資料



【以下為我的問題】

1.若檢定資料的期望次數(Ei)若為0(資料中有打" * "的0),會出現分母為0的情況,無法計算其卡方值。請問此情況是否要將該時段忽略掉,還是卡方值以0計算?


2.由翻書所得到的結論,我將模擬資料作為觀察次數(Oi)、實際資料為期望次數(Ei),請問這樣的判斷是否為正確?

回答 (3)

2013-10-22 8:08 pm
✔ 最佳答案
你這個檢定好像應該叫做獨立性檢定,不是適合度檢定.
適合度檢定: 推論觀察數據屬何種分配的檢定,適用於二項、卜氏、常態分配.
獨立性檢定: 推論兩列數據有無關聯的檢定.

Ei<5時,應該併在鄰組,自由度扣掉1,這樣分母也不會有0的狀況.

模擬資料作為觀察次數(Oi)、實際資料為期望次數(Ei),請問這樣的判斷是否為正確?
Ans:不正確
模擬資料(理論資料)是Ei , 實際資料(觀察資料)是Oi,你剛好顛倒了.
2015-02-24 2:13 pm
●九州 娛樂 網站 http://ts777.cc
●●●運彩遊戲、真人遊戲、電子遊戲、對戰遊戲、對戰遊戲●●●

●新舊會員儲值就送500點

● 真人百家樂彩金等你拿

●線上影片直播、正妹圖、討論區免費註冊

歡迎免費體驗交流試玩!

●九州 娛樂 網站 http://ts777.cc
2013-10-25 9:21 pm
以實際資料為 population, 模擬資料當觀測值, 用以檢定模擬結果是否有
代表性, 是可以的.

不過, Ei 有太多偏低的, 甚至有 0 的. 如果這真的是 population, 當 sample
的模擬結果就必須也是 0, 也就是這些 cells 要剔除在計算之外 (包括 d.f.).
而如果要採用卡方檢定, Ei 太低是不行的, 因此應先做類組合併, 最好讓合
併後每一類的 Ei 都在 5 以上.

2013-10-25 12:28:16 補充:
不把實際資料當 population, 而是把它和模擬結果當兩個獨立 samples,
如 Lopez 回答中的, 看成是兩個多項群體分布是否一致的檢定也可以.
不過, 前述 Eij (j 是樣本別, i 是時段(類組)別.) 要在 5 以上的要求仍然
需要遵守. 雖然有前輩學者說在 cells 多時只要每個 cell 的 Eij 都在 1
以上, 並且 Eij 小於 5 的比例不大即可, 但最好還是儘量避免.

2013-10-25 12:47:32 補充:
當做兩群體之獨立樣本時,
Ei1 = (Ni+Mi)*N/(N+M), Ei2 = (Ni+Mi)*M/(N+M),
其中 Ni 是模擬結果, Mi 是實際值, N=ΣNi, M=ΣMi.

χ^2 = Σ {(Ni -Ei1)^2/Ei1 + (Mi-Ei2)^2/Ei2}.

把實際值當群體, 則 Ei = N*(Mi/M),
χ^2 = Σ(Ni-Ei)^2/Ei

兩種統計量的自由度相同, 都是: d.f. = 有效組數 - 1.

2013-10-25 13:21:24 補充:

以實際資料為 population, 模擬資料當觀測值, 用以檢定模擬結果是否有
代表性, 是可以的. 但 Ei 不是直接拿實際資料充數. 令 Ni 是模擬結果,
Mi 是實際值, N=ΣNi, M=ΣMi. 則 Ei = N*(Mi/M).


不過, Ei 有太多偏低的, 甚至有 0 的. 如果這真的是 population, 當 sample
的模擬結果就必須也是 0, 也就是這些 cells 要剔除在計算之外 (包括 d.f.).
而如果要採用卡方檢定, Ei 太低是不行的, 因此應先做類組合併, 最好讓
合併後每一類的 Ei 都在 5 以上.




不把實際資料當 population, 而是把它和模擬結果當兩個獨立 samples,
如 Lopez 回答中的, 看成是兩個多項群體分布是否一致的檢定也可以.
不過, 前述 Eij (j 是樣本別, i 是時段(類組)別.) 要在 5 以上的要求仍然
需要遵守.

當做兩群體之獨立樣本時,

Ei1 = (Ni+Mi)*N/(N+M), Ei2 = (Ni+Mi)*M/(N+M),


χ^2 = Σ {(Ni -Ei1)^2/Ei1 + (Mi-Ei2)^2/Ei2}.

把實際值當群體, 則 χ^2 = Σ(Ni-Ei)^2/Ei.

兩種統計量的自由度相同, 都是: d.f. = 有效組數 - 1.


One-sample testNiMiEiχ^200:00-05:59487.38721.553106:00-06:59343431.39570.216007:00-07:59283330.47230.200608:00-08:59404440.62980.009809:00-09:59454541.55320.285910:00-10:59313128.62550.197011:00-11:59565.54040.052712:00-12:59776.46380.044513:00-14:59576.46380.331515:00-16:59776.46380.044517:00-18:59565.54040.052719:00-23:59676.46380.0333Total2172352173.02=χ^2 statistic11= d.f.0.9904= p-value



NiMiNi+MiTwo-samples testχ^200:00-05:5948125.766.240.53830.497106:00-06:5934346832.6535.350.05620.051907:00-07:5928336129.2931.710.05640.052108:00-08:5940448440.3343.670.00270.002509:00-09:5945459043.2146.790.07430.068610:00-10:5931316229.7732.230.05120.047311:00-11:5956115.285.720.01490.013812:00-12:5977146.727.280.01160.010713:00-14:5957125.766.240.10050.092815:00-16:5977146.727.280.01160.010717:00-18:5956115.285.720.01490.013819:00-23:5967136.246.760.00930.0086Total2172354522172351.81=χ^2 statistic11= d.f.

2013-10-25 13:22:13 補充:
表格格式跑掉了! :(


收錄日期: 2021-05-04 01:53:31
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20131022000016KK01214

檢視 Wayback Machine 備份