コンフュージョンマトリクスと精度リコールのトレードオフ
コンフュージョンマトリクスと信頼度リコールチャートは、モデルの精度を評価するのに役立ちます。
混同行列
戻りそうな顧客に、余計な砂糖立方体を与えることを考えているとします。しかし、もちろん不必要に製糖キューブを出さないようにしたいので、モデルに少なくとも 30% 還元する可能性が高い顧客にのみ渡します。
新しい客が通り過ぎたら……。
CustomerID | 年齢 | 性別 |
---|---|---|
… | … | … |
324 | 54 | 女性 |
325 | 23 | 女性 |
326 | 62 | 男性 |
327 | 15 | 女性 |
… | … | … |
…回帰モデルを使用して返品する可能性を予測できます…
CustomerID | 年齢 | 性別 | モデル推定返品可能性 |
---|---|---|---|
… | … | … | … |
324 | 54 | 女性 | 34% |
325 | 23 | 女性 | 24% |
326 | 62 | 男性 | 65% |
327 | 15 | 女性 | 7% |
… | … | … | … |
…30% 以上の可能性を持つ顧客を “返品する” として分類し、砂糖キューブを提供することを決定しました:
CustomerID | 年齢 | 性別 | モデル推定返品可能性 | モデル予測 (30% カットオフ) |
---|---|---|---|---|
… | … | … | … | … |
324 | 54 | 女性 | 34% | 戻ります |
325 | 23 | 女性 | 24% | 予定なし |
326 | 62 | 男性 | 65% | 戻ります |
327 | 15 | 女性 | 7% | 予定なし |
… | … | … | … | … |
モデルの正確性をよりよく理解するために、すでにあるデータポイントにモデルを適用して、顧客が最終的に戻ったかどうかをすでに把握することができます。
CustomerID | 年齢 | 性別 | モデル推定返品可能性 | モデル予測 (30% カットオフ) |
返却済 |
---|---|---|---|---|---|
1 | 21 | 男性 | 44% | 戻ります | 返却済 |
2 | 34 | 女性 | 4% | 予定なし | 返却済 |
3 | 13 | 女性 | 65% | 戻ります | そうしませんでした |
4回 | 25 | 女性 | 27% | 予定なし | そうしませんでした |
… | … | … | … | … | … |
…およびデータの精度を評価…
CustomerID | 年齢 | 性別 | モデル推定返品可能性 | モデル予測 (30% カットオフ) |
返却済 | 予測の精度 |
---|---|---|---|---|---|---|
1 | 21 | 男性 | 44% | 戻ります | 返却済 | 正解 |
2 | 34 | 女性 | 4% | 予定なし | 返却済 | 不正解 |
3 | 13 | 女性 | 65% | 戻ります | そうしませんでした | 不正解 |
4回 | 25 | 女性 | 27% | 予定なし | そうしませんでした | 正解 |
… | … | … | … | … | … | … |
… その後、これを次のカテゴリに分類します。
- ; 真陽子: モデルによって「Will return」と分類され、実際は「リターン」していた。
- ; 偽陽性: モデルによって「帰る」と分類されるが、実際は「帰らなかった」と現実に分類される。
- 真陰性:モデルによって「Won’t return」と分類され、実際には「Diddn’t return」と現実に分類されています。
- 偽陰性:モデルによって「戻らない」と分類されましたが、実際には「返却済」でした。
CustomerID | 年齢 | 性別 | モデル推定返品可能性 | モデル予測 (30% カットオフ) |
返却済 | 予測の精度 | 精度タイプ |
---|---|---|---|---|---|---|---|
1 | 21 | 男性 | .44 | 戻ります | 返却済 | 正解 | 真陽性 |
2 | 34 | 女性 | .04 | 予定なし | 返却済 | 不正解 | 偽陰性 |
3 | 13 | 女性 | .65 | 戻ります | そうしませんでした | 不正解 | 偽陽性 |
4回 | 25 | 女性 | .27 | 予定なし | そうしませんでした | 正解 | 真陰性 |
… | … | … | … | … | … | … | … |
最後に、このすべての作業を正確さとリコールにまとめることができます。
精度:
- “Will return” に分類された人のうち、実際に行った割合はどのくらいだったのか。
- 真陽性 / (真陽性 + 偽陽性)
リコール:
- リコール:実際に「返却済」だったもののうち、そのように分類された割合は?
- 真陽性 / (真陽性 + 偽陰性)
より優れたモデルでは、精度とリコールの値が多くなります。
- 94%の精度のモデル(ほぼすべてが「Will return」と認識されている)と97%のリコール(ほぼ全員が「Returned」を同定した)を想像できる。
- 弱いモデルの精度は 95% ですが、50% のリコール (誰かが “Will return” であると特定した場合、それはほとんど正しいですが、実際に “Return” を行った人の半分は “Won’t return” と誤記されます)。
- または、モデルの精度が 60% で、リコールが 60% なのかもしれません。
これらの数値は、実際に予測を行いたくない場合でも、モデルの精度に良い意味を持つ必要があります。
精度 vs. リコール曲線
任意の 1 つのモデル内で、精度またはリコールを強調することもできます。おそらく、砂糖キューブがとても短く、自信が強い人にだけ渡したいと思うので、(30%ではなく)60%が戻りそうな顧客だけに渡すことにします。
本当に誰かが「戻ってくる」と自信があるときだけ製糖キューブを手渡すことになるので、当社の精度が上がります。最終的に「復帰」し、砂糖の立方体を与えるほど自信が持てなかった人が多くなるため、私たちの思い出しは下降します。
精度: 62% —> 80%
リコール: 60% —> 30%
あるいは、砂糖キューブが豊富なと感じている場合は、少なくとも復帰者になる可能性が10%ある人なら誰にでも出せるだろう。
精度: 62% —> 40%
リコール: 60% —> 90%
このチャートを使用すると、精度とリコールの間のトレードオフをトレースできます:
精度とリコールの良い組み合わせを表すポイントをチャート上で選択し、その時点におけるモデルの精度を把握すると便利です。