Qualtrics Platform
Customer Journey Optimizer
XM Discover
Qualtrics Social Connect

The Confusion Matrix & Precision-Recall Tradeoff

Die Matrix und das Präzisionsrückrufdiagramm helfen Ihnen dabei, die Genauigkeit Ihres Modells zu beurteilen.

Konfusionsmatrix

Nehmen wir an, Sie überlegen, Kunden, die wahrscheinlich zurückkehren, einen zusätzlichen Zuckerwürfel zu geben. Aber natürlich möchten Sie vermeiden, Zuckerwürfel unnötig auszugeben, also geben Sie sie nur Kunden, die laut Modell mindestens 30 % wahrscheinlich zurückkehren.

Wenn Sie einige neue Kunden spazieren …

CustomerID	Alter	Geschlecht
…	…	…
324	54	Weiblich
325	23	Weiblich
326	62	Männlich
327	15	Weiblich
…	…	…

… könnten Sie unser Regressionsmodell verwenden, um vorherzusagen, wie wahrscheinlich es wäre, dass sie zurückkehren…

CustomerID	Alter	Geschlecht	Geschätzte Rücknahmewahrscheinlichkeit des Modells
…	…	…	…
324	54	Weiblich	34 %
325	23	Weiblich	24 %
326	62	Männlich	65%
327	15	Weiblich	7 %
…	…	…	…

… und entscheiden, Kunden mit einer Wahrscheinlichkeit von mindestens 30 % als “Will return” zu klassifizieren und ihnen Zuckerwürfel zu geben:

CustomerID	Alter	Geschlecht	Geschätzte Rücknahmewahrscheinlichkeit des Modells	Modellprognose (30 % Cut-Off)
…	…	…	…	…
324	54	Weiblich	34 %	Wird zurückgeben
325	23	Weiblich	24 %	Won’t
326	62	Männlich	65 %	Wird zurückgeben
327	15	Weiblich	7 %	Won’t
…	…	…	…	…

Um besser zu verstehen, wie genau unser Modell ist, können Sie das Modell jedoch auf die Datenpunkte übernehmen, die Sie bereits haben, wo Sie bereits wissen, ob der Kunde schließlich zurückgesendet hat…

CustomerID	Alter	Geschlecht	Geschätzte Rücknahmewahrscheinlichkeit des Modells	Modellprognose (30 % Cut-Off)	Zurückgegeben
1	21	Männlich	44 %	Wird zurückgeben	Zurückgegeben
2	34	Weiblich	4 %	Won’t	Zurückgegeben
3	13	Weiblich	65 %	Wird zurückgeben	War nicht
4	25	Weiblich	27 %	Won’t	War nicht
…	…	…	…	…	…

… und bewerten Sie, wie genau die Daten sind…

CustomerID	Alter	Geschlecht	Geschätzte Rücknahmewahrscheinlichkeit des Modells	Modellprognose (30 % Cut-Off)	Zurückgegeben	Prognosegenauigkeit
1	21	Männlich	44 %	Wird zurückgeben	Zurückgegeben	Korrekt
2	34	Weiblich	4 %	Won’t	Zurückgegeben	Fehlerhaft
3	13	Weiblich	65 %	Wird zurückgeben	War nicht	Fehlerhaft
4	25	Weiblich	27 %	Won’t	War nicht	Korrekt
…	…	…	…	…	…	…

… und dann weiter in die folgenden Kategorien unterteilen:

Richtig positiv: Klassifiziert vom Modell als “Will return” und hatte tatsächlich “Returned” in der Realität.
Falsch positiv: Klassifiziert vom Modell als “Will return”, aber tatsächlich “Didn’t return” in der Realität.
Richtig negativ: Klassifiziert vom Modell als “Won’t return” und tatsächlich “Didn’t return” in der Realität.
Falsch negativ: Vom Modell als “Won’t return” klassifiziert, aber tatsächlich “Returned” in der Realität.

CustomerID	Alter	Geschlecht	Geschätzte Rücknahmewahrscheinlichkeit des Modells	Modellprognose (30 % Cut-Off)	Zurückgegeben	Prognosegenauigkeit	Genauigkeitstyp
1	21	Männlich	44	Wird zurückgeben	Zurückgegeben	Korrekt	Richtig positiv
2	34	Weiblich	.04	Won’t	Zurückgegeben	Fehlerhaft	Falsch negativ
3	13	Weiblich	65	Wird zurückgeben	War nicht	Fehlerhaft	Falsch positiv
4	25	Weiblich	.27	Won’t	War nicht	Korrekt	Richtig negativ
…	…	…	…	…	…	…	…

Schließlich könnten Sie all diese Arbeit in Präzision und Erinnerung zusammenfassen.

Genauigkeit:

Von denen, die als “Will return” eingestuft sind, welcher Anteil hat eigentlich getan?
Richtig positiv / (Wahr positiv + Falsch positiv)

Rückruf:

Erinnern: Von denen, die tatsächlich “zurückgekehrt” waren, welcher Anteil wurde so eingestuft?
Richtig positiv / (Wahr positiv + Falsch negativ)

Bessere Modelle haben höhere Werte für Präzision und Rückruf.

Sie können sich ein Modell mit 94 % Präzision (fast alle als “Will return” do in der Tat identifiziert) und 97 % Rückruf (fast alle, die “zurückgegeben” wurden als solche identifiziert) vorstellen.
Ein schwächeres Modell kann 95 % Präzision haben, aber 50 % erinnern sich (wenn es jemanden als “Will return” identifiziert, ist es weitgehend korrekt, aber es kennzeichnet falsch “Won’t return” die Hälfte derjenigen, die tatsächlich später “Return” getan haben).
Oder vielleicht hat das Modell 60% Präzision und 60% Rückruf.

Diese Zahlen sollten Ihnen einen guten Eindruck davon vermitteln, wie genau Ihr Modell ist, auch wenn Sie nie tatsächlich Vorhersagen treffen möchten.

Präzision vs. Rückrufkurve

Innerhalb eines Modells können Sie auch entscheiden, ob Sie die Genauigkeit oder den Rückruf hervorheben möchten. Vielleicht sind Sie sehr kurz mit Zuckerwürfeln und möchten sie nur Leuten ausgeben, die Sie sehr zuversichtlich sind, werden zurückkehren, also entscheiden Sie, sie nur Kunden zu geben, die wahrscheinlich 60 % zurückkehren (statt 30 %).

Unsere Präzision wird steigen, weil du nur dann Zuckerwürfel aushändigst, wenn du wirklich zuversichtlich bist, dass jemand zurückkehrt. Unser Rückruf wird untergehen, weil es viele Leute geben wird, die letztendlich “zurückkehren”, denen Sie nicht zuversichtlich genug waren, einen Zuckerwürfel zu geben.

Präzision: 62% —> 80%
Rückruf: 60% —> 30%

Oder, wenn Sie sich reich an Zuckerwürfeln fühlen, können Sie sie jedem geben, der mindestens 10 % Chance hat, ein Rückkehrer zu sein.

Präzision: 62% —> 40%
Rückruf: 60% —> 90%

Sie können diesen Kompromiss zwischen Präzision und Rückruf mit diesem Diagramm verfolgen:

Es kann hilfreich sein, einen Punkt im Diagramm auszuwählen, der eine schöne Mischung aus Präzision und Rückruf darstellt, und dann ein Gefühl dafür zu bekommen, wie genau das Modell an diesem Punkt ist.

FAQs

Viele Seiten dieses Portals wurden mithilfe maschineller Übersetzung aus dem Englischen übersetzt. Obwohl wir bei Qualtrics die bestmögliche maschinelle Übersetzung ausgewählt haben, um ein möglichst gutes Ergebnis zu bieten, ist maschinelle Übersetzung nie perfekt. Der englische Originaltext gilt als offizielle Version. Abweichungen zwischen dem englischen Originaltext und den maschinellen Übersetzungen sind nicht rechtlich bindend.

The Confusion Matrix & Precision-Recall Tradeoff

Konfusionsmatrix

Präzision vs. Rückrufkurve

FAQs

Related Articles

Support

Unternehmen

Ressourcen