請問統計迴歸上的Dummy Variables?

2008-02-28 12:22 pm
因為之前學的都是基本的統計
可是這學期的統計使用的是原文書
結果又要用報告的方式
是否有大大可以稍微針對Dummy Variables做初步的解說
剩下的方面我會在去找其他書來看
感謝囉
︿︿

回答 (2)

2008-02-28 3:48 pm
✔ 最佳答案
虛擬變數(dummy variable),也就是「0-1」的二元變數(binary variable),應用在統計回歸分析中,例如在解釋性別(自變數)對薪資(因變數)的影響時,令G為性別,而男員工為1,女員工為0。回歸結果所得到的G的係數,就是在其他條件不變下,男性與女性員工之薪資差異。其他的範疇變數(categorical variable)也可以轉變為虛擬變數,如果範疇變數有四個水準,則投入迴歸分析時,必須會有三個虛擬變數。增加虛擬變數一般可以提高判定係數(R平方),但其代價是喪失自由度以及模型的一般性。(http://en.wikipedia.org/wiki/Dummy_variable)

如果虛擬變數是在回歸模型的左邊(即因變數),例如,在研究哪些解釋變數會影響一個人吸煙與否的行為時,被解釋變數呈現「0-1」的二元變數型態:吸煙者為1,不吸煙者為0,因變數並非連續變數,因此普通最小平方法(OLS)的模型便不適用,較適當的是一種稱為logistic回歸模型(http://en.wikipedia.org/wiki/Logistic_regression)。
2008-02-28 6:14 pm
※ 引述《[email protected] (未知的旅人)》之銘言:
> 請問
> qualitative variable
> dummy variable
> 是不是有什麼不同

一個 k 分類的屬質變數, 需要建立 k-1 個虛擬變數來代
表它。例如: 屬質變數 "季節" 分四季: 春/夏/秋/冬,
季 節
虛擬變數 春 夏 秋 冬
X1 1 0 0 0
X2 0 1 0 0
X3 0 0 1 0

※ 引述《[email protected] (未知的旅人)》之銘言:
> ※ 引述《[email protected] (老怪物)》之銘言:
> > 一個 k 分類的屬質變數, 需要建立 k-1 個虛擬變數來代
> > 表它。例如: 屬質變數 "季節" 分四季: 春/夏/秋/冬,
> > 季 節
> > 虛擬變數 春 夏 秋 冬
> > X1 1 0 0 0
> > X2 0 1 0 0
> > X3 0 0 1 0
Effect coding
Z1 1 0 0 -1
Z2 0 1 0 -1
Z3 0 0 1 -1
> 我在 Wooldridge 的 Introductory Econometrics
> 的例 10.6 看到的
> 他設一個屬質變量 取值 1 0 -1
> 所以想問這是不是跟取 0 1 的虛擬變數有什麼差別?


常用的兩種 dummy variable 設定, 一是在迴歸分析中常
有介紹的: dummy variable coding, 如上列 X1, X2, X3;
另一是等價於 ANOVA 常用的限制式 (sum of effect = 0),
稱為 effect coding, 如上列之 Z1, Z2, Z3。

以 X1, X2, X3 為迴歸模型之解釋變數, 則 X1 的係數代
表 "春季" 對 "冬季" 的效應 (差異); X2 的係數則代表
夏季 (對冬季) 的效應, 以此類推。

以 Z1, Z2, Z3 為解釋變數, 則其係數分別等於變異數分
析中春/夏/秋三季 (對平均) 的效應, 而冬季 (對平均)
的效應是三個係數相加後改變正負號 (所以四個 effect
加總等於 0)。



> 可否說一下 在上面的例子 為什麼要有 sum of effect = 0 的限制式呢 ?
> 感激不盡......

以本例四分類屬質變數而言, 本來應是各季有一個效應參
數(對應四個 dummy variables)。但因這麼一來會與常數
項重疊, 因此需加一個限制以方便計算。至於限制條件,
可以是以某一類為比較基準 (相當於設該類對應的 dummy
variable 的係數為 0), 或限制四類所對應的效應和為 0
(如 ANOVA 習慣上所做的)。這些不同限制,基本上沒有優
劣差異。研究者要看的是該變數類別間平均反應的差異,
即效應或係數的差, 不管哪一種限制, 其差都是相同的。

2008-02-28 10:22:35 補充:
telnet://bbs.ncku.edu.tw 的 Statistics 版
版面按 "/" 或 "?" 搜尋 "屬質變數與虛擬變數";
或按 "z" 進精華區:
 8. ◆ 專項統計分析方法
  2. ◆ 線性模型 (含迴歸,ANOVA,ANCOVA...)
   3. ◆ 基本概念相關問題 (模型, 迴歸係數, 虛擬變數)
     第 15~20 篇

2008-02-28 10:22:50 補充:
   3. ◆ 基本概念相關問題 (模型, 迴歸係數, 虛擬變數)
    15. ◇ Re: [問題] 請問變異數分析與迴歸
    16. ◇ Re: 如何檢定冬季的dummy effect?
    17. ◇ Re: [問題] 請問如果我用dummy varible
    18. ◇ Re: [問題] 關於dummy變項
    19. ◇ Re: 三分類變數用三個 dummy variables?
    20. ◇ Re: 類別解釋變項於回歸類模型之編碼方式
參考: telnet://bbs.ncku.edu.tw 的 Statistics 版


收錄日期: 2021-05-04 01:44:13
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20080228000010KK01662

檢視 Wayback Machine 備份