Skip to main content
Loading...
Skip to article
  • Qualtrics Platform
    Qualtrics Platform
  • Customer Journey Optimizer
    Customer Journey Optimizer
  • XM Discover
    XM Discover
  • Qualtrics Social Connect
    Qualtrics Social Connect

コンフュージョンマトリクスと精度リコールのトレードオフ


Was this helpful?


This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

The feedback you submit here is used only to help improve this page.

That’s great! Thank you for your feedback!

Thank you for your feedback!


コンフュージョンマトリクスと信頼度リコールチャートは、モデルの精度を評価するのに役立ちます。

混同行列

戻りそうな顧客に、余計な砂糖立方体を与えることを考えているとします。しかし、もちろん不必要に製糖キューブを出さないようにしたいので、モデルに少なくとも 30% 還元する可能性が高い顧客にのみ渡します。

新しい客が通り過ぎたら……。

CustomerID 年齢 性別
324 54 女性
325 23 女性
326 62 男性
327 15 女性

 

…回帰モデルを使用して返品する可能性を予測できます…

CustomerID 年齢 性別 モデル推定返品可能性
324 54 女性 34%
325 23 女性 24%
326 62 男性 65%
327 15 女性 7%

 

…30% 以上の可能性を持つ顧客を “返品する” として分類し、砂糖キューブを提供することを決定しました:

CustomerID 年齢 性別 モデル推定返品可能性 モデル予測
(30% カットオフ)
324 54 女性 34% 戻ります
325 23 女性 24% 予定なし
326 62 男性 65% 戻ります
327 15 女性 7% 予定なし

 

モデルの正確性をよりよく理解するために、すでにあるデータポイントにモデルを適用して、顧客が最終的に戻ったかどうかをすでに把握することができます。

CustomerID 年齢 性別 モデル推定返品可能性 モデル予測
(30% カットオフ)
返却済
1 21 男性 44% 戻ります 返却済
2 34 女性 4% 予定なし 返却済
3 13 女性 65% 戻ります そうしませんでした
4回 25 女性 27% 予定なし そうしませんでした

 

…およびデータの精度を評価…

CustomerID 年齢 性別 モデル推定返品可能性 モデル予測
(30% カットオフ)
返却済 予測の精度
1 21 男性 44% 戻ります 返却済 正解
2 34 女性 4% 予定なし 返却済 不正解
3 13 女性 65% 戻ります そうしませんでした 不正解
4回 25 女性 27% 予定なし そうしませんでした 正解

 

… その後、これを次のカテゴリに分類します。

  • ; 真陽子: モデルによって「Will return」と分類され、実際は「リターン」していた。
  • ; 偽陽性: モデルによって「帰る」と分類されるが、実際は「帰らなかった」と現実に分類される。
  • 真陰性:モデルによって「Won’t return」と分類され、実際には「Diddn’t return」と現実に分類されています。
  • 偽陰性:モデルによって「戻らない」と分類されましたが、実際には「返却済」でした。
CustomerID 年齢 性別 モデル推定返品可能性 モデル予測
(30% カットオフ)
返却済 予測の精度 精度タイプ
1 21 男性 .44 戻ります 返却済 正解 真陽性
2 34 女性 .04 予定なし 返却済 不正解 偽陰性
3 13 女性 .65 戻ります そうしませんでした 不正解 偽陽性
4回 25 女性 .27 予定なし そうしませんでした 正解 真陰性

 

最後に、このすべての作業を正確さとリコールにまとめることができます。

精度:

  • “Will return” に分類された人のうち、実際に行った割合はどのくらいだったのか。
  • 真陽性 / (真陽性 + 偽陽性)

リコール:

  • リコール:実際に「返却済」だったもののうち、そのように分類された割合は?
  • 真陽性 / (真陽性 + 偽陰性)

より優れたモデルでは、精度とリコールの値が多くなります。

  • 94%の精度のモデル(ほぼすべてが「Will return」と認識されている)と97%のリコール(ほぼ全員が「Returned」を同定した)を想像できる。
  • 弱いモデルの精度は 95% ですが、50% のリコール (誰かが “Will return” であると特定した場合、それはほとんど正しいですが、実際に “Return” を行った人の半分は “Won’t return” と誤記されます)。
  • または、モデルの精度が 60% で、リコールが 60% なのかもしれません。

これらの数値は、実際に予測を行いたくない場合でも、モデルの精度に良い意味を持つ必要があります。

精度 vs. リコール曲線

任意の 1 つのモデル内で、精度またはリコールを強調することもできます。おそらく、砂糖キューブがとても短く、自信が強い人にだけ渡したいと思うので、(30%ではなく)60%が戻りそうな顧客だけに渡すことにします。

本当に誰かが「戻ってくる」と自信があるときだけ製糖キューブを手渡すことになるので、当社の精度が上がります。最終的に「復帰」し、砂糖の立方体を与えるほど自信が持てなかった人が多くなるため、私たちの思い出しは下降します。

精度:   62%   —>   80%
リコール:        60%   —>   30%

あるいは、砂糖キューブが豊富なと感じている場合は、少なくとも復帰者になる可能性が10%ある人なら誰にでも出せるだろう。

精度:   62%   —>   40%
リコール:        60%   —>   90%

このチャートを使用すると、精度とリコールの間のトレードオフをトレースできます:

リコールと精度のトレードオフグラフ

精度とリコールの良い組み合わせを表すポイントをチャート上で選択し、その時点におけるモデルの精度を把握すると便利です。

FAQ

当サポートサイトの日本語のコンテンツは英語原文より機械翻訳されており、補助的な参照を目的としています。機械翻訳の精度は十分な注意を払っていますが、もし、英語・日本語翻訳が異なる場合は英語版が正となります。英語原文と機械翻訳の間に矛盾があっても、法的拘束力はありません。