ロジスティック回帰は、1 つ以上の独立変数とバイナリ結果の間の関係をモデル化するために一般化線形モデル (GLM) で使用される基本的な統計手法です。このトピック クラスターでは、GLM におけるロジスティック回帰の理論、応用、解釈を、その数学的および統計的側面に焦点を当てて調査します。
GLM におけるロジスティック回帰理論
ロジスティック回帰は、バイナリ結果の確率をモデル化するために使用される回帰分析の一種です。GLM では、ロジスティック回帰は、独立変数の線形結合をバイナリ結果の確率に関連付けるリンク関数の概念に基づいています。ロジスティック回帰で一般的に使用されるリンク関数はロジット関数で、線形予測変数を確率スケールに変換します。
ロジスティック回帰の数学的定式化には、独立変数の係数と分散パラメータを推定するための尤度関数の最大化が含まれます。ロジスティック回帰モデルは次のように表されます。
logit(p) = β 0 + β 1 X 1 + β 2 X 2 + … + β p X p
ここで、β 0、β 1、β 2、...、β pは係数、X 1、X 2、...、X pは独立変数、p はバイナリ結果の確率です。次に、ロジスティック関数が線形予測子に適用されて確率が取得されます。
GLM におけるロジスティック回帰の応用
GLM のロジスティック回帰は、ヘルスケア、マーケティング、金融、社会科学など、さまざまな分野で応用されています。ヘルスケアでは、ロジスティック回帰を使用して、危険因子に基づいて病気の発生確率をモデル化し、治療結果を予測します。マーケティングでは、顧客の行動を分析し、製品を購入する可能性を予測するために使用されます。金融では、ロジスティック回帰は信用スコアリングと不正行為の検出に使用されます。
さらに、GLM のロジスティック回帰は、行動、態度、結果を予測するために社会科学で広く使用されています。また、二項対立の結果をモデル化して解釈するために、疫学、環境科学、その他多くの研究分野にも適用されています。
GLM におけるロジスティック回帰の解釈と評価
ロジスティック回帰の係数とオッズ比を解釈することは、バイナリ結果の確率に対する独立変数の影響を理解するために不可欠です。オッズ比は、独立変数が 1 単位増加した場合の結果のオッズの乗算変化を示し、係数は対数オッズの変化を表します。
ロジスティック回帰モデルのパフォーマンスの評価には、適合度、識別能力、およびキャリブレーションの評価が含まれます。Hosmer-Lemeshow 検定、受信機動作特性 (ROC) 曲線、およびキャリブレーション プロットは、ロジスティック回帰におけるモデル評価に一般的に使用されます。