统计学/logistic回归模型

logistic回归模型 编辑

  • 由于因变量Y为二分类变量,不满足线性回归分析条件,首先对π进行数据变换:
    • logit(π)=ln(π/(1-π))=ln(Odds)
  • 这个变换将取值在0~1间的π值转换为值域在(-∞,+∞)的logit(π)值。
  • 然后,建立logit(π)与自变量的线性模型。
    • logit(π)=β₀+β₁X₁+...+βpXp [1a]
    • 或ln(Odds)=β₀+β₁X₁+...+βpXp [1b]
    • 或ln(π/(1-π))=β₀+β₁X₁+...+βpXp [1c]
  • 变换式[1c],得
    • π/(1-π)=e(β₀+β₁X₁+...+βpXp [2]
  • 求解π,得
    • π=e(β₀+β₁X₁+...+βpXp/(1+e(β₀+β₁X₁+...+βpXp) [3]
    • 或π=1/(1+e-(β₀+β₁X₁+...+βpXp) [4]
  • 可见,在已知某一个体的自变量(X₁,X₂,...Xp)情况下,采用式[3]或式[4],可以得到该个体概率π(Y=1)的预测值。
  • 上述公式中,β₀为常数项(截距),β₁,β₂,...,βp为回归系数。因为式[3]和式[4]的右端在数学上属于logistic函数,所以式[1a]、式[1b]、式[3]与式[4]均称为logistic回归模型。

模型参数的意义 编辑