Predict iQ
Informazioni su Predict iQ
Quando i clienti lasciano un’azienda, spesso veniamo colti alla sprovvista. Se solo avessimo saputo che questo cliente era a rischio, forse avremmo potuto contattarlo prima che perdessero completamente la loro fiducia in noi. Se solo ci fosse un modo per prevedere la probabilità che un cliente abbandonasse (lasciare l’azienda).
Predict iQ apprende dalle risposte al sondaggio degli intervistati e dai dati incorporati per prevedere se l’intervistato alla fine abbandonerà. Quando arriveranno nuove risposte al sondaggio, Predict iQ può prevedere la probabilità che gli intervistati perdano in futuro. Per prevedere se un cliente abbandonerà, Predict iQ utilizza le reti neurali (un sottoinsieme dei quali è chiamato Deep Learning) e la regressione per creare modelli di candidati. Prova le variazioni di questi diversi modelli per ogni insieme di dati e quindi sceglie il modello che meglio si adatta ai dati.
Preparazione dei dati
Prima di creare un modello di previsione di abbandono, è necessario assicurarsi che i dati siano pronti.
Predict iQ funziona meglio quando hai almeno 500 intervistati che hanno abbandonato. Tuttavia, 5.000 o più intervistati in perdita ti daranno i risultati migliori.
Configurazione di una variabile di abbandono
- Nel sondaggio in cui vuoi prevedere la perdita, vai al flusso del sondaggio.
- Fai clic su Aggiungi un nuovo elemento qui.
- Seleziona Dati incorporati.
- Verrà richiesto di inserire un nome campo. È possibile inserire il nome campo desiderato. Qui, abbiamo scelto la Chiesa.
- Fai clic su Applica.
- Potresti anche voler ripetere lo stesso processo per altri dati che vorresti inserire, in particolare i dati operativi che potrebbero essere utili per prevedere l’abbandono (ad esempio, la permanenza in carica o il numero di acquisti).
Acquisizione dati
Una volta che hai una variabile di abbandono, puoi importare dati storici nel tuo sondaggio, inclusa una colonna per Abbandono in cui indichi con Sì o No se il cliente ha perso.
Creazione di un modello di previsione dell’abbandono
Una volta configurata la variabile di abbandono e disponi di un numero sufficiente di dati, sei pronto ad aprire Predict iQ.
- All’interno del sondaggio, fai clic su Dati & Analisi.
- Seleziona Predict iQ.
- Fare clic su Crea modello predittivo di abbandono.
- Selezionare la variabile inserita nella sezione precedente. In questo esempio, si chiama Churn.
Consiglio Q: Predict iQ prevede solo i risultati che hanno 2 possibili scelte, come Sì/No o True/False. Non prevede risultati numerici (ad esempio, una scala 1-7) o risultati categorici con più di 2 valori (ad esempio, Sì/Forse/No). - Selezionare il valore che indica che il cliente ha perso.
Esempio: Poiché in questo esempio la nostra variabile si chiama Abbandono, qualcuno con la perdita uguale a Sì ha abbandonato. Ma diciamo che invece hai chiamato la tua variabile Rimanere con la nostra azienda. Poi No indicherebbe che la persona non stava soggiornando con l’azienda, e ha abbandonato.
- Selezionare le variabili da escludere dal modello o includerle nel modello. Fare clic su Escludi/Includi per passare da 2 a 2.
- Escludi: ad esempio, se hai una variabile che misura “Motivo della perdita” nei tuoi dati storici, potresti voler escluderla dall’analisi, in quanto non sarà disponibile per i nuovi intervistati quando viene effettuata la previsione.
- Includi: seleziona variabili da includere nel modello; tutte le altre verranno ignorate.
- Fare clic su Crea.
Una volta completato il modello di previsione, la pagina Predict iQ verrà sostituita con le informazioni sul modello di previsione di abbandono appena creato.
Come viene eseguita la suddivisione dell’insieme di dati per l’addestramento del modello?
Nel processo di addestramento del modello, l’insieme di dati è suddiviso in dati di addestramento, convalida e test. Per l’addestramento viene utilizzato l‘80% dei dati. Per la convalida viene utilizzato il 10% dei dati, mentre per il test viene utilizzato il 10%.
Informazioni variabile
La sezione dei risultati e della configurazione del modello di previsione fornisce il nome della variabile di dati integrati Abbandono e il valore che indica che un cliente potrebbe perdere. Questa sezione elenca anche le variabili escluse.
Fattori di previsione
I driver di previsione sono le variabili che sono state analizzate per creare il modello di previsione, ordinate in base alla loro importanza nella previsione dell’abbandono. Sono incluse eventuali variabili che non sono state escluse dall’analisi. Nell’esempio seguente, i punteggi NPS e le valutazioni di affidabilità guidano la previsione dell’abbandono.
Fare clic su Mostra altri driver per espandere l’elenco.
Qtip: per creare questo grafico, ogni variabile viene eseguita in una regressione logistica semplice rispetto alla variabile di perdita. Il valore R quadro più alto è impostato su 1 e i valori delle altre variabili vengono scalati di conseguenza. Ad esempio, se l’R quadrato più alto è 0,5, la lunghezza della barra di ogni variabile sarà R quadro * 2, dove la lunghezza della barra è 1.
Il grafico è quindi un indicatore della forza relativa delle variabili nel prevedere l’abbandono, e non è di natura multivariata. Una valutazione dell’impatto di ogni variabile sull’output di un modello basato su algoritmi di apprendimento profondo è un’area di ricerca accademica attiva, senza nessuna best practice accettata a questo punto.
Metriche di previsione
Predict iQ “tiene fuori” (mette da parte) il 10% dei dati prima di creare il modello. Dopo la creazione del modello, crea previsioni per quel 10%. Poi confronta le sue previsioni con ciò che è realmente successo, se quei clienti hanno effettivamente abbandonato. Tali risultati sono utilizzati per potenziare le seguenti metriche di precisione. Si noti che questo è un metodo di best practice efficace per stimare l’accuratezza del modello, ma non è una garanzia dell’accuratezza futura del modello.
- Accuratezza: la proporzione delle previsioni del modello che saranno accurate.
- Precisione: la percentuale di clienti che si prevede abbandonerà e che abbandoneranno effettivamente.
- Richiamo: la percentuale di coloro che hanno effettivamente sfornato che il modello prevedeva in anticipo lo avrebbe fatto.
Predict iQ calcolerà il valore di soglia ottimale massimizzando il punteggio F1. Il modello verrà impostato sulla soglia ottimale per impostazione predefinita, ma è possibile adattarlo; vedere Configura soglia di seguito.
Fare clic su Output avanzato sotto la tabella Metriche predittive per visualizzare le tabelle Matrice di confusione e Metriche di previsione avanzate.
Precisione e richiamo
Precisione e richiamo sono le metriche di previsione più importanti. Hanno una relazione inversa, e quindi spesso dovete pensare al compromesso tra sapere esattamente quali clienti abbandoneranno e sapere che avete identificato tutti o la maggior parte dei clienti che rischiano di perdere.
Configura soglia
Fare clic su Configura soglia per impostare una soglia per la probabilità di abbandono di un cliente. Questa percentuale di soglia è la probabilità individuale di perdita.
Fare clic e trascinare il punto nel grafico per adattare la soglia o digitare una soglia % e osservare come cambia il grafico. Al termine, fare clic su Imposta soglia per salvare le modifiche. È anche possibile annullare le modifiche facendo clic su Annulla in basso a destra o sulla X in alto a destra.
Regolando la soglia si adatta la precisione lungo l’asse y e il richiamo lungo l’asse x. Queste metriche hanno una relazione inversa. Più le tue misure sono precise, più basso è il richiamo e viceversa.
Matrice di confusione
Quando Predict iQ costruisce un modello predittivo, “trattiene” (o mette da parte) il 10% dei dati. Per verificare l’accuratezza del modello generato, i dati del nuovo modello vengono eseguiti a fronte dell’holdout del 10%. Questo serve come paragone di ciò che è previsto e di ciò che “realmente è successo”.
“Sì” in questo grafico verrà sostituito con qualsiasi valore target indicato nel passaggio 5 della configurazione.
- Effettivo Non Sì / Previsto non Sì: la percentuale di clienti che il modello previsto non perderebbe, che in realtà non hanno abbandonato.
- Effettivo Sì / Previsto non Sì: la percentuale di clienti in cui il modello previsto non diminuirebbe, che viceversa si è arrestata.
- Effettivo non Sì / Previsto Sì: la percentuale di clienti che il modello previsto avrebbe perso, che al contrario non si sono arresi.
- Effettivo Sì / Previsto Sì: la percentuale di clienti che il modello previsto avrebbe perso, chi ha effettivamente abbandonato.
I numeri sono verdi per indicare che si desidera che siano il più alti possibile, poiché riflettono ipotesi corrette. I numeri sono rossi per indicare che si desidera che questi numeri siano bassi, poiché riflettono ipotesi errate.
È possibile regolare la matrice in modo che visualizzi Percentuale o Conteggio. Questo conteggio include il 10% dei dati trattenuti, non l’intero insieme di dati.
Metriche di previsione avanzate
Questa tabella visualizza metriche di previsione supplementari.
- Precisione: la percentuale di clienti che si prevede abbandonerà e che abbandoneranno effettivamente.
- Richiamo: la percentuale di coloro che hanno effettivamente sfornato che il modello prevedeva in anticipo lo avrebbe fatto.
- Accuratezza: la proporzione delle previsioni del modello che saranno accurate.
- Punteggio F1: il punteggio F1 viene utilizzato per selezionare una soglia che equilibra la precisione con il richiamo. Un punteggio F1 più alto è generalmente migliore, anche se la posizione corretta per impostare la soglia dovrebbe essere determinata dai propri obiettivi aziendali.
- Area sotto Precision-Recall Curve: La curva Precision-Recall è la curva osservata sul grafico quando si fa clic su Configura soglia. L’area totale sotto la curva è una misura dell’accuratezza complessiva del modello (indipendentemente dal punto in cui si imposta la soglia). Un’area sotto la curva del 50% è uguale alla casualità casuale; il 100% è perfettamente preciso.
Effettua previsioni
Previsione lotto (CSV)
Oltre ad analizzare le risposte raccolte nel tuo sondaggio, puoi anche caricare un file di dati specifico che desideri che Predict iQ valuti.
Per ottenere un modello per il file, fare clic su Schema di previsione lotto per questo modello.
Una volta terminata la modifica del file in Excel e si è pronti per ricaricarlo, fare clic su Scegli file per selezionare il file. Quindi fare clic su Esegui previsioni per avviare l’analisi.
Previsioni flusso
Le previsioni dei flussi si aggiornano man mano che i dati arrivano nel sondaggio. In questa sezione è possibile decidere quando vengono eseguiti questi aggiornamenti della previsione.
Crea una previsione ogni volta che un nuovo intervistato completa il sondaggio: questa impostazione consente previsioni in tempo reale. Nei dati saranno presenti altre 2 colonne: Probabilità di abbandono, la probabilità di abbandono in formato decimale e Previsione di abbandono, una variabile Sì/No. La previsione dell’abbandono si basa sulla soglia configurata.
Gestione di modelli
Lungo la sinistra della pagina, verrà visualizzato un menu in cui è possibile scorrere e selezionare i modelli di previsione creati in passato.
- Ricerca per nome modello.
- Ordinare l’elenco di modelli. Fare clic sull’elenco a discesa per scegliere in base a che cosa ordinare e utilizzare la freccia accanto all’elenco a discesa per adattare l’ordinamento in ordine decrescente o crescente.
- Selezionare il modello da visualizzare.
- Creare un nuovo modello predittivo.
- Una volta selezionato un modello da sinistra, è possibile fare clic sul suo nome nella parte superiore della pagina per modificarlo.
Dati abbandono
Nella sezione Dati della scheda Dati e analisi, è possibile esportare i dati come comodo foglio di calcolo. Una volta caricato il modello di previsione, in questa pagina saranno presenti colonne aggiuntive per i dati dell’abbandono.
- Probabilità di abbandono: la probabilità di perdita in formato decimale. Viene visualizzato quando la previsione del flusso è stata attivata e si basa sulla soglia impostata. Se non si visualizza la colonna Probabilità di abbandono, è anche possibile cercare una colonna di dati denominata “[campo di abbandono selezionato]_PROBABILITY_PREDICT_IQ”.
- Previsione di abbandono: una variabile Sì/No che conferma o nega la perdita in base alla soglia impostata. Appare quando la previsione del flusso è stata abilitata. Se non si visualizza la colonna Previsione dell’abbandono, è anche possibile cercare una colonna di dati denominata “[campo di abbandono selezionato]_CLASS_PREDICT_IQ”.
I nomi delle colonne includeranno anche la data in cui il modello è stato formato in formato MMDDYYYY. Ad esempio, 14 gennaio 2022 sarebbe rappresentato nel nome della colonna come 01142022.
Si noti che le probabilità di abbandono e le previsioni vengono applicate solo ai nuovi risultati del sondaggio. Alle risposte esistenti in precedenza non saranno aggiunte probabilità di abbandono e previsioni.
Pulizia dati automatica
Durante l’addestramento del modello, Predict iQ ignorerà automaticamente determinati tipi di variabili che non saranno utili per le previsioni, trasformando automaticamente altre variabili.
Variabili cardinalità elevata
Se una variabile ha più di 50 valori univoci o più del 20% dei valori registrati sono univoci, verrà ignorata durante l’addestramento del modello. Le variabili con troppi valori univoci non sono buone colonne di funzionalità per le previsioni.
Valori mancanti per colonne numeriche
Per le variabili numeriche incluse nel modello, i valori mancanti vengono sempre imputati come 0 (zero).
Codifica unica ad alta temperatura delle categorie
Le variabili categoriali saranno codificate una volta a caldo se la variabile non viene ricodificata o se la variabile non ha una relazione ordinale per le sue categorie.
Qtip: Predict iQ riporta le stesse impostazioni delle variabili utilizzate in Stats iQ.
Variabili invarianti
Qualsiasi variabile senza scostamento nei valori registrati verrà ignorata per l’addestramento del modello. Ciò significa che se si dispone di una variabile che ha un solo valore univoco, non farà parte del modello. Le variabili utili per la previsione troveranno un buon equilibrio tra avere troppi pochi valori univoci e troppi valori univoci. Vedere “Variabili cardinalità elevata” sopra.
Se durante la pulizia dei dati vengono escluse variabili invarianti, queste verranno elencate nella sezione dei risultati e della configurazione del modello di previsione.
Progetti in cui è possibile utilizzare Predict iQ
Predict iQ non è incluso in ogni licenza. Tuttavia, se si dispone di questa funzionalità, è possibile accedervi in alcuni tipi diversi di progetti:
Predict iQ può comparire anche nei progetti Engagement and Lifecycle, ma in base alla natura dei dati generalmente raccolti da queste tipologie di progetto, il set di dati non sarebbe necessariamente il migliore per Predict iQ.
Mentre Predict iQ appare in analisi congiunta e MaxDiff, non è consigliabile usarli insieme. I contenuti specifici di Analisi congiunta e MaxDiffs non sono compatibili con Predict iQ, quindi puoi solo analizzare i dati demografici.
Non sono supportati altri tipi di progetto.