zum Hauptinhalt springen
Loading...
Skip to article
  • Qualtrics Platform
    Qualtrics Platform
  • Customer Journey Optimizer
    Customer Journey Optimizer
  • XM Discover
    XM Discover
  • Qualtrics Social Connect
    Qualtrics Social Connect

The Confusion Matrix & Precision-Recall Tradeoff


Was this helpful?


This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

The feedback you submit here is used only to help improve this page.

That’s great! Thank you for your feedback!

Thank you for your feedback!


Die Matrix und das Präzisionsrückrufdiagramm helfen Ihnen dabei, die Genauigkeit Ihres Modells zu beurteilen.

Konfusionsmatrix

Nehmen wir an, Sie überlegen, Kunden, die wahrscheinlich zurückkehren, einen zusätzlichen Zuckerwürfel zu geben. Aber natürlich möchten Sie vermeiden, Zuckerwürfel unnötig auszugeben, also geben Sie sie nur Kunden, die laut Modell mindestens 30 % wahrscheinlich zurückkehren.

Wenn Sie einige neue Kunden spazieren …

CustomerID Alter Geschlecht
 …  …  …
324 54 Weiblich
325 23 Weiblich
326 62 Männlich
327 15 Weiblich
 …  …  …

 

… könnten Sie unser Regressionsmodell verwenden, um vorherzusagen, wie wahrscheinlich es wäre, dass sie zurückkehren…

CustomerID Alter Geschlecht Geschätzte Rücknahmewahrscheinlichkeit des Modells
 …  …  …  …
324 54 Weiblich 34 %
325 23 Weiblich 24 %
326 62 Männlich 65%
327 15 Weiblich 7 %
 …  …  …  …

 

… und entscheiden, Kunden mit einer Wahrscheinlichkeit von mindestens 30 % als “Will return” zu klassifizieren und ihnen Zuckerwürfel zu geben:

CustomerID Alter Geschlecht Geschätzte Rücknahmewahrscheinlichkeit des Modells Modellprognose
(30 % Cut-Off)
 …  …  …  …  …
324 54 Weiblich 34 % Wird zurückgeben
325 23 Weiblich 24 % Won’t
326 62 Männlich 65 % Wird zurückgeben
327 15 Weiblich 7 % Won’t
 …  …  …  …  …

 

Um besser zu verstehen, wie genau unser Modell ist, können Sie das Modell jedoch auf die Datenpunkte übernehmen, die Sie bereits haben, wo Sie bereits wissen, ob der Kunde schließlich zurückgesendet hat…

CustomerID Alter Geschlecht Geschätzte Rücknahmewahrscheinlichkeit des Modells Modellprognose
(30 % Cut-Off)
Zurückgegeben
1 21 Männlich 44 % Wird zurückgeben Zurückgegeben
2 34 Weiblich 4 % Won’t Zurückgegeben
3 13 Weiblich 65 % Wird zurückgeben War nicht
4 25 Weiblich 27 % Won’t War nicht
 …  …  …  …  …  …

 

… und bewerten Sie, wie genau die Daten sind…

CustomerID Alter Geschlecht Geschätzte Rücknahmewahrscheinlichkeit des Modells Modellprognose
(30 % Cut-Off)
Zurückgegeben Prognosegenauigkeit
1 21 Männlich 44 % Wird zurückgeben Zurückgegeben Korrekt
2 34 Weiblich 4 % Won’t Zurückgegeben Fehlerhaft
3 13 Weiblich 65 % Wird zurückgeben War nicht Fehlerhaft
4 25 Weiblich 27 % Won’t War nicht Korrekt
 …  …  …  …  …  …  …

 

… und dann weiter in die folgenden Kategorien unterteilen:

  • Richtig positiv: Klassifiziert vom Modell als “Will return” und hatte tatsächlich “Returned” in der Realität.
  • Falsch positiv: Klassifiziert vom Modell als “Will return”, aber tatsächlich “Didn’t return” in der Realität.
  • Richtig negativ: Klassifiziert vom Modell als “Won’t return” und tatsächlich “Didn’t return” in der Realität.
  • Falsch negativ: Vom Modell als “Won’t return” klassifiziert, aber tatsächlich “Returned” in der Realität.
CustomerID Alter Geschlecht Geschätzte Rücknahmewahrscheinlichkeit des Modells Modellprognose
(30 % Cut-Off)
Zurückgegeben Prognosegenauigkeit Genauigkeitstyp
1 21 Männlich 44 Wird zurückgeben Zurückgegeben Korrekt Richtig positiv
2 34 Weiblich .04 Won’t Zurückgegeben Fehlerhaft Falsch negativ
3 13 Weiblich 65 Wird zurückgeben War nicht Fehlerhaft Falsch positiv
4 25 Weiblich .27 Won’t War nicht Korrekt Richtig negativ
 …  …  …  …  …  …  …  …

 

Schließlich könnten Sie all diese Arbeit in Präzision und Erinnerung zusammenfassen.

Genauigkeit:

  • Von denen, die als “Will return” eingestuft sind, welcher Anteil hat eigentlich getan?
  • Richtig positiv / (Wahr positiv + Falsch positiv)

Rückruf:

  • Erinnern: Von denen, die tatsächlich “zurückgekehrt” waren, welcher Anteil wurde so eingestuft?
  • Richtig positiv / (Wahr positiv + Falsch negativ)

Bessere Modelle haben höhere Werte für Präzision und Rückruf.

  • Sie können sich ein Modell mit 94 % Präzision (fast alle als “Will return” do in der Tat identifiziert) und 97 % Rückruf (fast alle, die “zurückgegeben” wurden als solche identifiziert) vorstellen.
  • Ein schwächeres Modell kann 95 % Präzision haben, aber 50 % erinnern sich (wenn es jemanden als “Will return” identifiziert, ist es weitgehend korrekt, aber es kennzeichnet falsch “Won’t return” die Hälfte derjenigen, die tatsächlich später “Return” getan haben).
  • Oder vielleicht hat das Modell 60% Präzision und 60% Rückruf.

Diese Zahlen sollten Ihnen einen guten Eindruck davon vermitteln, wie genau Ihr Modell ist, auch wenn Sie nie tatsächlich Vorhersagen treffen möchten.

Präzision vs. Rückrufkurve

Innerhalb eines Modells können Sie auch entscheiden, ob Sie die Genauigkeit oder den Rückruf hervorheben möchten. Vielleicht sind Sie sehr kurz mit Zuckerwürfeln und möchten sie nur Leuten ausgeben, die Sie sehr zuversichtlich sind, werden zurückkehren, also entscheiden Sie, sie nur Kunden zu geben, die wahrscheinlich 60 % zurückkehren (statt 30 %).

Unsere Präzision wird steigen, weil du nur dann Zuckerwürfel aushändigst, wenn du wirklich zuversichtlich bist, dass jemand zurückkehrt. Unser Rückruf wird untergehen, weil es viele Leute geben wird, die letztendlich “zurückkehren”, denen Sie nicht zuversichtlich genug waren, einen Zuckerwürfel zu geben.

Präzision: 62% —> 80%
Rückruf:        60% —> 30%

Oder, wenn Sie sich reich an Zuckerwürfeln fühlen, können Sie sie jedem geben, der mindestens 10 % Chance hat, ein Rückkehrer zu sein.

Präzision: 62% —> 40%
Rückruf:        60% —> 90%

Sie können diesen Kompromiss zwischen Präzision und Rückruf mit diesem Diagramm verfolgen:

Graph des Kompromisses zwischen Recall und Precision

Es kann hilfreich sein, einen Punkt im Diagramm auszuwählen, der eine schöne Mischung aus Präzision und Rückruf darstellt, und dann ein Gefühl dafür zu bekommen, wie genau das Modell an diesem Punkt ist.

FAQs

Viele Seiten dieses Portals wurden mithilfe maschineller Übersetzung aus dem Englischen übersetzt. Obwohl wir bei Qualtrics die bestmögliche maschinelle Übersetzung ausgewählt haben, um ein möglichst gutes Ergebnis zu bieten, ist maschinelle Übersetzung nie perfekt. Der englische Originaltext gilt als offizielle Version. Abweichungen zwischen dem englischen Originaltext und den maschinellen Übersetzungen sind nicht rechtlich bindend.