統計學/logistic回歸模型
< 統計學
logistic回歸模型
編輯- 由於因變量Y為二分類變量,不滿足線性回歸分析條件,首先對π進行數據變換:
- logit(π)=ln(π/(1-π))=ln(Odds)
- 這個變換將取值在0~1間的π值轉換為值域在(-∞,+∞)的logit(π)值。
- 然後,建立logit(π)與自變量的線性模型。
- logit(π)=β₀+β₁X₁+...+βpXp [1a]
- 或ln(Odds)=β₀+β₁X₁+...+βpXp [1b]
- 或ln(π/(1-π))=β₀+β₁X₁+...+βpXp [1c]
- 變換式[1c],得
- π/(1-π)=e(β₀+β₁X₁+...+βpXp) [2]
- 求解π,得
- π=e(β₀+β₁X₁+...+βpXp)/(1+e(β₀+β₁X₁+...+βpXp)) [3]
- 或π=1/(1+e-(β₀+β₁X₁+...+βpXp)) [4]
- 可見,在已知某一個體的自變量(X₁,X₂,...Xp)情況下,採用式[3]或式[4],可以得到該個體概率π(Y=1)的預測值。
- 上述公式中,β₀為常數項(截距),β₁,β₂,...,βp為回歸係數。因為式[3]和式[4]的右端在數學上屬於logistic函數,所以式[1a]、式[1b]、式[3]與式[4]均稱為logistic回歸模型。