請問SPSS複迴歸建模的虛擬變項設立問題

2012-02-15 7:49 pm
請問各位高手
關於SPSS的複迴歸統計模型建立
虛擬變項是只要我有放類別變項進去 就一定要設立
還是如果我並不想看各個類別對y變項的顯著性 就不用設定?

舉例:

我有六個因子當自變項,其中三個是連續,三個是類別
我想要看其中一個連續性自變項對依變項的關係
比如說工作時數對心理壓力的關係

類別變項是年齡(1-4) 性別(0/1) 職位別(1-4)
我目前假設這三項都是干擾因子
則我是否需要對年齡與職位別設定虛擬變項?
這樣最後總共會有幾個變項

或者是我只要直接把這六個變項放進去就好?

又 設立虛擬變項,在迴歸模型建立上的統計目的到底是?
我已知建立虛擬變項是在類別對連續的分析上,把類別資料轉成連續來跑迴歸分析的一個手段這樣

感謝大家

回答 (2)

2012-02-22 7:51 pm
✔ 最佳答案
您好:
以您的例子來看,性別您已是設定0,1,所以可視為虛擬變項,
但職位別有四個組,那您要設成三個虛擬變項,
年齡組這部份較有爭議性,我有遇過有者指導教授視為連續變項,
但也有指導教授視為類別,再轉化為虛擬變項。
如果是前者,您只有一個自變項,如果是後者就變成三個。

千萬不能將六個變項直接丟入分析,這樣一定會造成錯誤,

一般我協助過的經驗,如果會丟入基本資料做迴歸分析,
通常是比較基本資料(如性別)是否有干擾之用?

以上建議提供給您參考,若有疑問,歡迎提出來,大家一同集思廣益!!
謝謝
參考: 解讀統計 活用分析
2012-02-16 7:37 am
"把類別資料轉成連續..." 這是錯誤的說法!
正確地說, 應是 "類別資料的數值化". 以 1 代表屬某類, 0 代表不屬該類.
故 "性別" 已是數值化, 不需重定; 而 "年齡" 本身就是數值的, 除非特殊情
況, 無需重新做其他方式的數值化. "職位別" 是純粹類別變數, 需倏數值化
才能運算, 才能放到迴歸之類的模型中進行分析計算.


收錄日期: 2021-05-04 01:50:18
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20120215000015KK02419

檢視 Wayback Machine 備份