Modello di articolo
Sull’utilizzo degli outlier
Gli outlier sono strumenti per l’esplorazione delle cause principali che identificano rapidamente le parole uniche o insolite di un dato punto di dati.
Come funzionano gli outlier
Gli outlier confrontano la prevalenza di una parola, di una parola associata o di un hashtag all’interno di un punto di dati selezionato rispetto alla prevalenza nel widget nel suo complesso, e quindi classificano queste parole in base alle maggiori disparità. Le parole che sono molto più rare o molto più popolari del previsto sono classificate più in alto.
Gli outlier mostrano parole, parole associate e hashtag che soddisfano uno dei seguenti criteri:
- Si verificano con una frequenza insolita per il punto dati selezionato, rispetto al resto del set di dati.
- Si verificano con una frequenza insolitamente bassa per il punto dati selezionato, rispetto al resto del set di dati.
Consiglio Q: in altre parole, gli outlier possono avere volumi individuali molto bassi, perché quei termini hanno volumi insolitamente bassi per il punto dati rispetto ad altri punti dati.
Gli outlier rappresentano un’alternativa alla ricerca delle “10 parole più importanti” per qualsiasi punto di dati in Studio, che può essere utile da sola. Tuttavia, le “prime 10 parole” sono spesso i primi 10 valori per tutti i punti dati e non differenziano necessariamente ciò che accade dietro un particolare punto dati a cui si è interessati.
Prevalenza Variazione metrica
La variazione di prevalenza indica la maggiore o minore frequenza di un outlier rispetto ai dati complessivi del widget.
Quando si esegue il drill su un outlier, XM DISCOVER valuta le interazioni per l’elemento che è stato perforato (definito “primo piano”) e le confronta con le interazioni del widget nel suo complesso (definito “sfondo”). Presenta quindi i valori che presentano la maggiore disparità di prevalenza, ovvero i valori più insoliti per quanto riguarda il tasso di prevalenza. La metrica Prevalence Change mostra esattamente l’entità di questa disparità, per dare un’idea più precisa di quanto estremo possa essere un outlier.
La variazione di prevalenza è calcolata con la seguente formula:
Variazione di prevalenza = percentuale di prevalenza in primo piano – percentuale di prevalenza in secondo piano
Si noti che questo valore può essere negativo se una parola è insolitamente poco comune nel gruppo forato rispetto al gruppo in secondo piano.
Quando usare gli outlier
Ecco quando l’uso dei valori anomali può essere vantaggioso:
- Indagare su punti di dati insoliti (come un picco o un avvallamento su un grafico di tendenza, un’area enorme su una torta o una heatmap, o un colore particolare su un word cloud) per scoprire cosa li sta determinando.
- Utilizzo dei driver. I driver non restituiscono parole, parole associate o hashtag come indicatori di un risultato. Con gli outlier, si seleziona un punto di dati e si ricavano le correlazioni.
- Cercare i termini di tendenza per scoprire nuovi argomenti potenziali.
Come considerare gli outlier
- Aprire un dashboard in modalità di visualizzazione.
Consiglio Q: i valori anomali sono disponibili solo in modalità di visualizzazione.
- Fare clic sul punto di dati che si desidera analizzare.
- Fare clic su Outliers.
Verrà generata una tabella che mostra le parole, le parole associate e gli hashtag associati al punto dati. Sono tutti ordinati per grado, con la più alta disparità di prevalenza in cima.