R演習 : ロジスティック回帰分析

単変量ロジスティック回帰分析

データの読み込み

パッケージISLR内のDefaultデータを用いる.説明変数をカード借入金額(balance),結果変数を債務不履行(default)とし,結果変数はダミー変数(0 or 1)にしておく.データ処理を行うために,パッケージdplyrも読み込んでおく.

散布図を描いてみる

トレーニングデータとテストデータ

まずは線形回帰モデルを当てはめてみる

当てはめ後,クロス集計表を作成する.

ロジスティック回帰の実行

まずはRの関数に頼る方法.

最尤推定によるパラメータの推定

ニュートン法で最適化を行う.

Exercise : 上記の方法だと$H$内のdiagを取る部分の行列サイズが大きく,計算に時間がかかってしまう.この点に注意しながら$H$を効率的に計算し,上記のコードを修正せよ.

多変量ロジスティック回帰分析

Spotifyデータの解析をしながら説明する.

ロジスティック回帰の実行.glm関数のoptionにfamily=binomialを指定することで可能.もちろん,最尤推定で直接推定することもできる.

単変量の場合と同様,トレーニングデータで学習し,テストデータの中から曲を推薦してみる.

クロス集計表の作成.