Predict iQ
Über Predict iQ
Wenn Kunden ein Unternehmen verlassen, werden wir oft außer Acht gelassen. Wenn wir nur gewusst hätten, dass dieser Kunde gefährdet war, hätten wir ihn vielleicht erreichen können, bevor er sein Vertrauen in uns völlig verlor. Wenn es nur eine Möglichkeit gäbe, die Wahrscheinlichkeit vorherzusagen, dass ein Kunde abwandern (das Unternehmen verlässt).
Predict iQ lernt aus den Antworten der Umfrageteilnehmer und eingebetteten Daten, um vorherzusagen, ob der Umfrageteilnehmer letztendlich abwandern wird. Wenn dann neue Umfrageantworten eingehen, kann Predict iQ vorhersagen, wie wahrscheinlich es ist, dass diese Umfrageteilnehmer in Zukunft abwandern. Um vorherzusagen, ob ein Kunde abwandern wird, verwendet Predict iQ neuronale Netzwerke (eine Teilmenge davon werden Deep Learning genannt) und Regression, um Kandidatenmodelle zu erstellen. Es versucht Variationen dieser verschiedenen Modelle für jedes Datenset und wählt dann das Modell aus, das am besten zu den Daten passt.
Vorbereiten Ihrer Daten
Bevor Sie ein Vorhersagemodell für die Abwanderung anlegen, sollten Sie sicherstellen, dass Ihre Daten bereit sind.
Predict iQ funktioniert am besten, wenn mindestens 500 Befragte abwandern. Doch ab 5.000 gescheiterten Befragten werden Sie die besten Ergebnisse erzielen.
Abwanderungsvariable einrichten
- Navigieren Sie in der Umfrage, in der Sie die Abwanderung vorhersagen möchten, zum Umfragenverlauf.
- Klicken Sie auf Neues Element hier hinzufügen.
- Wählen Sie Eingebettete Daten.
- Sie werden aufgefordert, einen Feldnamen einzugeben. Sie können einen beliebigen Feldnamen eingeben. Hier haben wir uns für die unkomplizierte Abwanderung entschieden.
- Klicken Sie auf Übernehmen.
- Sie können diesen Prozess auch für andere Daten wiederholen, die Sie einbringen möchten, insbesondere für operative Daten, die für die Prognose der Abwanderung nützlich sein könnten (z. B. Beschäftigungsdauer oder Anzahl der Käufe).
Aufzeichnungsdaten
Sobald Sie eine Abwanderungsvariable haben, können Sie historische Daten in Ihre Umfrage importieren, einschließlich einer Spalte für Abwanderung, in der Sie mit Ja oder Nein angeben, ob der Kunde abwandert.
Anlegen eines Vorhersagemodells für die Abwanderung
Sobald Ihre Abwanderungsvariable eingerichtet ist und Sie über genügend Daten verfügen, können Sie Predict iQ öffnen.
- Klicken Sie in Ihrer Umfrage auf Daten & Analyse.
- Wählen Sie Predict iQ.
- Wählen Sie Vorhersagemodell für Abwanderung anlegen.
- Wählen Sie die Variable aus, die Sie im vorherigen Abschnitt angelegt haben. In diesem Beispiel heißt sie Churn.
Tipp: Prognostiziert iQ nur Ergebnisse, die zwei mögliche Auswahlmöglichkeiten haben, z. B. Ja/Nein oder Wahr/Falsch. Numerische Ergebnisse (z.B. eine Skala von 1 bis 7) oder kategorische Ergebnisse mit mehr als zwei Werten (z.B. Ja/Möglicherweise/Nein) werden nicht vorhergesagt. - Wählen Sie den Wert aus, der angibt, dass der Kunde abgewandert ist.
Beispiel: Da in diesem Beispiel unsere Variable Churn heißt, hat jemand mit Churn gleich Ja abgewandert. Angenommen, Sie haben Ihre Variable stattdessen „Bleiben bei unserem Unternehmen“ genannt. Dann würde Nein darauf hinweisen, dass die Person sich nicht bei der Firma aufgehalten hat und abgewandert ist.
- Wählen Sie Variablen aus, die entweder aus dem Modell ausgeschlossen oder in das Modell eingeschlossen werden sollen. Klicken Sie auf Ausschließen/Einschließen, um zwischen den beiden zu wechseln.
- Ausschließen: Wenn Ihre historischen Daten beispielsweise eine variable Messgröße für den Abwanderungsgrund enthalten, möchten Sie diese möglicherweise aus der Analyse ausschließen, da sie für neue Umfrageteilnehmer nicht verfügbar ist, wenn die Prognose erstellt wird.
- Einschließen: Wählen Sie Variablen aus, die in das Modell aufgenommen werden sollen; alle anderen werden ignoriert.
- Klicken Sie auf Erstellen.
Sobald Ihr Prognosemodell vollständig ist, wird die Seite Predict iQ durch Informationen zum soeben angelegten Verlustprognosemodell ersetzt.
Wie ist Ihre Datensatzaufteilung für das Modelltraining?
Beim Trainieren Ihres Modells wird Ihr Datenset in Trainings-, Validierungs- und Testdaten aufgeteilt. 80 % Ihrer Daten werden für das Training verwendet. 10 % Ihrer Daten werden für die Validierung und 10 % Ihrer Daten für Tests verwendet.
Variableninformationen
Der Abschnitt Vorhersagemodellergebnisse und -konfiguration enthält den Namen Ihrer eingebetteten Datenvariable Abwanderung und den Wert, der angibt, dass ein Kunde wahrscheinlich abwandern wird. In diesem Abschnitt werden auch Ihre ausgeschlossenen Variablen aufgeführt.
Vorhersagetreiber
Die Prognosetreiber sind die Variablen, die analysiert wurden, um Ihr Vorhersagemodell zu erstellen, sortiert nach ihrer Wichtigkeit bei der Abwanderungsprognose. Dies schließt alle Variablen ein, die nicht von der Analyse ausgeschlossen wurden. Im Beispiel unten steuern NPS-Werte und Zuverlässigkeitsbewertungen die Abwanderungsprognose.
Klicken Sie auf Andere Treiber anzeigen, um die Liste zu erweitern.
Tipp: Um dieses Diagramm zu erstellen, wird jede Variable in einer einfachen logistischen Regression gegen die Abwanderungsvariable ausgeführt. Der höchste R-Quadratwert wird auf 1 gesetzt, und die Werte der anderen Variablen werden entsprechend skaliert. Beispiel: Wenn das höchste R-Quadrat 0,5 beträgt, wird die Balkenlänge jeder Variablen R-Quadrat * 2 sein, wobei die Balkenlänge 1 beträgt.
Das Diagramm ist daher ein Indikator für die relative Stärke der Variablen bei der Vorhersage der Abwanderung und ist nicht multivariat. Eine Bewertung der Auswirkungen jeder Variablen auf die Ergebnisse eines Deep-Learning-Algorithmus-basierten Modells ist ein Bereich der aktiven akademischen Forschung, in dem zu diesem Zeitpunkt keine Best Practices akzeptiert werden.
Vorhersagemetriken
Prognostizieren Sie 10 % der Daten, bevor Sie das Modell erstellen. Nachdem das Modell angelegt wurde, legt es Prognosen für diese 10 % an. Anschließend vergleicht es seine Vorhersagen mit dem, was tatsächlich passiert ist, ob diese Kunden tatsächlich abgewandert sind. Diese Ergebnisse werden verwendet, um die unten aufgeführten Genauigkeitskennzahlen zu beeinflussen. Beachten Sie, dass dies zwar eine effektive Best-Practice-Methode zur Schätzung der Genauigkeit des Modells ist, aber keine Garantie für die zukünftige Genauigkeit des Modells darstellt.
- Genauigkeit: Der Anteil der Vorhersagen des Modells, der genau sein wird.
- Präzision: Der Anteil der Kunden, deren Abwanderung prognostiziert wird.
- Rückruf: Der Anteil derjenigen, die tatsächlich abwanderten, dass das Modell, das im Voraus vorausgesagt wurde, dies tun würde.
Predict iQ berechnet den optimalen Schwellenwert durch Maximierung des F1-Scores. Ihr Modell wird standardmäßig auf den optimalen Schwellenwert gesetzt. Sie können diesen jedoch anpassen; siehe Schwellenwert konfigurieren unten.
Klicken Sie auf Erweiterte Ausgabe unter der Tabelle Prognosekennzahlen, um die Tabellen Verwechslungsmatrix und Erweiterte Vorhersagemetriken anzuzeigen.
Präzision und Rückruf
Präzision und Rückruf sind die wichtigsten Vorhersagekennzahlen. Sie stehen in einer umgekehrten Beziehung zueinander. Daher müssen Sie oft über den Kompromiss nachdenken, zwischen dem Wissen, welche Kunden abwandern werden, und dem Wissen, dass Sie alle oder die meisten der Kunden identifiziert haben, die wahrscheinlich abwandern werden.
Schwellenwert konfigurieren
Klicken Sie auf Schwellenwert konfigurieren, um einen Schwellenwert festzulegen, ab dem ein Kunde als Abwanderungswahrscheinlichkeit gekennzeichnet werden soll. Dieser Schwellenwertprozentsatz ist die individuelle Abwanderungswahrscheinlichkeit.
Klicken Sie auf den Punkt im Diagramm, und ziehen Sie ihn, um den Schwellenwert anzupassen, oder geben Sie einen Schwellenwert in Prozent ein, und beobachten Sie, wie sich das Diagramm ändert. Wenn Sie fertig sind, klicken Sie auf Schwellenwert festlegen, um Ihre Änderungen zu speichern. Sie können Änderungen auch verwerfen, indem Sie unten rechts auf Abbrechen oder oben rechts auf X klicken.
Wenn Sie den Schwellenwert anpassen, wird die Genauigkeit entlang der Y-Achse und der Rückruf entlang der X-Achse angepasst. Diese Metriken stehen in einem umgekehrten Zusammenhang. Je genauer Ihre Messungen sind, desto niedriger ist der Rückruf und umgekehrt.
Konfusionsmatrix
Wenn Predict iQ ein Vorhersagemodell erstellt, werden 10 % der Daten „ausgelagert“ (oder beiseite gelegt). Um die Genauigkeit des generierten Modells zu prüfen, werden die Daten aus dem neuen Modell für das 10 %-Holdout ausgeführt. Dies dient als Vergleich dessen, was vorhergesagt wird und was “tatsächlich passiert ist”.
“Ja” in diesem Diagramm wird durch den Wert ersetzt, den Sie in Schritt 5 der Einrichtung angegeben haben.
- Ist nicht Ja / Prognostiziert Nicht Ja: Der Prozentsatz der Kunden, die vom Modell prognostiziert wurden, würden nicht abwandern, die tatsächlich nicht abgewandert haben.
- Tatsächlich Ja / Prognostiziert nicht Ja: Der Prozentsatz der Kunden, die vom Modell prognostiziert wurden, würden nicht abwandern, die umgekehrt abgewandert haben.
- Tatsächlich Nicht Ja / Prognostiziert Ja: Der Prozentsatz der Kunden, die laut Modell abwandern würden, die umgekehrt nicht abwanderten.
- Tatsächlich Ja / Prognostiziert Ja: Der Prozentsatz der Kunden, die laut Modell abwandern würden, die tatsächlich abgewandert haben.
Zahlen sind grün, um anzuzeigen, dass diese Zahlen so hoch wie möglich sein sollen, da sie korrekte Annahmen widerspiegeln. Zahlen sind rot, um anzuzeigen, dass diese Zahlen niedrig sein sollen, da sie falsche Annahmen widerspiegeln.
Sie können die Matrix so anpassen, dass entweder Prozent oder Anzahl angezeigt wird. Diese Anzahl umfasst die 10 % Ihrer zurückgehaltenen Daten, nicht den vollständigen Datensatz.
Erweiterte Vorhersagemetriken
Diese Tabelle zeigt zusätzliche Vorhersagemetriken an.
- Präzision: Der Anteil der Kunden, deren Abwanderung prognostiziert wird.
- Rückruf: Der Anteil derjenigen, die tatsächlich abwanderten, dass das Modell, das im Voraus vorausgesagt wurde, dies tun würde.
- Genauigkeit: Der Anteil der Vorhersagen des Modells, der genau sein wird.
- F1-Score: Der F1-Score wird verwendet, um einen Schwellenwert auszuwählen, der die Genauigkeit mit dem Rückruf ausgleicht. Ein höherer F1-Wert ist in der Regel besser, obwohl die richtige Stelle zum Festlegen des Schwellenwerts durch Ihre Geschäftsziele bestimmt werden sollte.
- Bereich unter Präzisions-Recall-Kurve: Die Precision-Recall-Kurve ist die Kurve, die Sie im Diagramm beobachten, wenn Sie auf Schwellenwert konfigurieren klicken. Die Gesamtfläche unter der Kurve ist ein Maß für die Gesamtgenauigkeit des Modells (unabhängig davon, wo Sie den Schwellenwert festlegen). Eine Fläche unter der Kurve von 50 % entspricht der Zufallswahrscheinlichkeit; 100 % ist perfekt genau.
Vorhersagen machen
Batch-Prognose (CSV)
Neben der Analyse der Antworten, die Sie in Ihrer Umfrage erfasst haben, können Sie auch eine bestimmte Datendatei hochladen, die von Predict iQ bewertet werden soll.
Um eine Vorlage für die Datei abzurufen, klicken Sie auf Batch-Vorhersagevorlage für dieses Modell.
Wenn Sie die Bearbeitung Ihrer Datei in Excel abgeschlossen haben und bereit sind, sie erneut hochzuladen, klicken Sie auf Datei auswählen, um die Datei auszuwählen. Wählen Sie dann Prognosen erstellen, um die Analyse zu starten.
Stream-Prognosen
Stream-Prognosen werden aktualisiert, wenn Daten in die Umfrage eingehen. In diesem Abschnitt können Sie entscheiden, wann diese Prognoseaktualisierungen stattfinden.
Erstellen Sie eine Prognose, wenn ein neuer Umfrageteilnehmer diese Umfrage abschließt: Diese Einstellung ermöglicht Echtzeitprognosen. Ihre Daten enthalten zwei weitere Spalten: Abwanderungswahrscheinlichkeit, Abwanderungswahrscheinlichkeit im Dezimalformat und Abwanderungsprognose, eine Ja/Nein-Variable. Die Abwanderungsprognose basiert auf dem konfigurierten Schwellenwert.
Modelle verwalten
Links auf der Seite wird ein Menü angezeigt, in dem Sie blättern und Vorhersagemodelle auswählen können, die Sie in der Vergangenheit angelegt haben.
- Suchen Sie nach dem Modellnamen.
- Sortieren Sie Ihre Modellliste. Klicken Sie auf die Dropdown-Liste, um auszuwählen, wonach Sie sortieren möchten, und verwenden Sie den Pfeil neben der Dropdown-Liste, um anzupassen, ob Sie in absteigender oder aufsteigender Reihenfolge sortieren möchten.
- Wählen Sie das Modell aus, das Sie anzeigen möchten.
- Legen Sie ein neues Prognosemodell an.
- Nachdem Sie ein Modell auf der linken Seite ausgewählt haben, können Sie oben auf der Seite auf seinen Namen klicken, um den Namen zu bearbeiten.
Abwanderungsdaten
Im Abschnitt Daten der Registerkarte Daten & Analyse können Sie Ihre Daten als praktische Tabellenkalkulation exportieren. Nachdem Ihr Prognosemodell geladen wurde, stehen Ihnen auf dieser Seite zusätzliche Spalten für Abwanderungsdaten zur Verfügung.
- Abwanderungswahrscheinlichkeit: Die Abwanderungswahrscheinlichkeit im Dezimalformat. Wird angezeigt, wenn die Stream-Prognose aktiviert wurde und auf dem festgelegten Schwellenwert basiert. Wenn die Spalte Abwanderungswahrscheinlichkeit nicht angezeigt wird, können Sie auch nach einer Datenspalte mit dem Namen „[ausgewähltes Abwanderungsfeld]_PROBABILITY_PREDICT_IQ“ suchen.
- Abwanderungsprognose: Eine Ja/Nein-Variable, die die Abwanderung basierend auf dem festgelegten Schwellenwert bestätigt oder ablehnt. Wird angezeigt, wenn die Stream-Prognose aktiviert wurde. Wenn die Spalte Abwanderungsprognose nicht angezeigt wird, können Sie auch nach einer Datenspalte mit dem Namen „[ausgewähltes Abwanderungsfeld]_CLASS_PREDICT_IQ“ suchen.
Spaltennamen enthalten auch das Datum, an dem das Modell im Format MMTTJJJJ trainiert wurde. Beispiel: Der 14. Januar 2022 wird im Spaltennamen als 01142022 dargestellt.
Beachten Sie, dass Abwanderungswahrscheinlichkeiten und -prognosen nur auf neue Umfrageergebnisse angewendet werden. Zuvor vorhandene Reaktionen enthalten keine Abwanderungswahrscheinlichkeiten und Prognosen.
Automatische Datenbereinigung
Beim Trainieren des Modells ignoriert Predict iQ automatisch bestimmte Variablentypen, die für Prognosen nicht nützlich sind, während andere Variablen automatisch transformiert werden.
Variablen mit hoher Kardinalität
Wenn eine Variable mehr als 50 eindeutige Werte hat oder mehr als 20 % der aufgezeichneten Werte eindeutig sind, wird sie beim Modelltraining ignoriert. Variablen mit zu vielen eindeutigen Werten sind keine guten Funktionsspalten für Prognosen.
Fehlende Werte für numerische Spalten
Bei numerischen Variablen, die im Modell enthalten sind, werden fehlende Werte immer auf 0 (Null) angerechnet.
One-Hot-Kodierung von Categoricals
Kategorische Variablen werden eins-heiß kodiert, wenn die Variable nicht umkodiert ist oder die Variable keine Ordinalbeziehung für ihre Kategorien hat.
Tipp: Predict iQ übernimmt dieselben Variableneinstellungen wie in Stats iQ.
Invariantenvariablen
Variablen, deren aufgezeichnete Werte keine Varianz aufweisen, werden für das Modelltraining ignoriert. Das bedeutet, dass eine Variable, die nur einen einzigen eindeutigen Wert hat, nicht Teil des Modells ist. Variablen, die für die Vorhersage nützlich sind, sorgen für ein ausgewogenes Verhältnis zwischen zu wenigen eindeutigen Werten und zu vielen eindeutigen Werten. Siehe „Variablen mit hoher Kardinalität“ oben.
Wenn invariante Variablen während der Datenbereinigung ausgeschlossen werden, werden sie im Abschnitt Vorhersagemodellergebnisse und -konfiguration aufgeführt.
Projekte, in denen Sie Predict iQ verwenden können
Predict iQ ist nicht in jeder Lizenz enthalten. Wenn Sie jedoch über diese Funktion verfügen, kann sie in einigen verschiedenen Arten von Projekten aufgerufen werden:
Predict iQ kann auch in Engagement- und Lifecycle-Projekten auftreten, aber basierend auf der Art der Daten, die normalerweise von diesen Projekttypen gesammelt werden, wäre der Datensatz nicht unbedingt am besten für Predict iQ.
Während Predict iQ in Conjoin und MaxDiff angezeigt wird, empfehlen wir, sie nicht zusammen zu verwenden. Conjoint- und MaxDiff-spezifische Inhalte sind nicht mit Predict iQ kompatibel, sodass Sie nur demografische Daten analysieren können.
Andere Projektarten werden nicht unterstützt.