Comprensione delle statistiche
Informazioni sulle statistiche
Benvenuto/a nelle Statistiche di Qualtrics. Questa è una panoramica delle statistiche di base che possono essere utili per te mentre crei e analizzi i progetti in Qualtrics. Tratteremo alcuni concetti statistici di base, li applicheremo alla piattaforma e discuteremo alcune ulteriori opzioni al di fuori di Qualtrics.
Dati quantitativi e categorici
Esistono 2 tipi di dati: quantitativi e categorici.
I dati quantitativi sono valutati su scala numerica. Esempi di dati quantitativi includono età, altezza o reddito.
I dati categorici vengono valutati su una scala nominale. Esempi di dati categorici includono genere, stato civile o occupazione. La maggior parte dei dati raccolti in un sondaggio è categorica, dove si ottiene un conteggio del numero di intervistati che rientrano in una categoria.
Misure del centro
Esistono 3 misure di centro utilizzate per i dati quantitativi: media, mediana e modalità.
La media, o media, è la migliore misura di centro quando i dati sono approssimativamente distribuiti normalmente o sembrano una curva a campana. La media si trova sommando tutte le osservazioni e dividendo per il numero totale di osservazioni.
Il valore mediano, o medio, è una buona misura del centro quando i dati sembrano essere distorti. Se si allineano tutte le osservazioni in ordine, la mediana è il valore medio.
La modalità è il valore che ricorre più di frequente nei dati. Non è comunemente usato né come media né come mediana.
Misure dello spread
Esistono alcune statistiche utili per misurare la distribuzione dei dati: deviazione standard, varianza e intervallo.
Una deviazione standard è la distanza media delle osservazioni dalla loro media. Come la media, una deviazione standard dovrebbe essere utilizzata con dati approssimativamente distribuiti normalmente.
La varianza è semplicemente la deviazione standard quadrata.
L’intervallo è la differenza tra il valore maggiore e il valore minore.
Statistiche nelle visualizzazioni
Una visualizzazione della tabella delle statistiche in Qualtrics mostra il valore minimo, il valore massimo, la media, la varianza, lo scostamento standard e il numero totale di risposte.
Dal momento che un valore è codificato per ogni opzione di risposta in ogni domanda, Qualtrics troverà nelle statistiche se i dati sono quantitativi o categorici. Sta a voi decidere se queste statistiche hanno senso nel contesto del vostro studio.
Ad esempio, è possibile chiedere ai partecipanti quale sia il loro colore preferito: rosso, giallo, blu o verde, codificato rispettivamente come 1, 2, 3 e 4. Qualtrics ti darà un significato, ma non ha senso avere un colore preferito medio.
Se gli intervistati valutano i film su una scala da 1 a 5 stelle, una media sarebbe utile. Significativi come 2,98 stelle o 4,32 stelle rendono i film facili da confrontare.
Qualtrics offre una varietà di diagrammi, grafici e tabelle. Un grafico a barre mostra la frequenza delle risposte in ogni categoria di scelta di risposta.
Un grafico a torta mostra queste frequenze come percentuale della torta.
Sia i grafici a barre che i grafici a torta semplificano il confronto delle frequenze tra le categorie.
Un grafico lineare è un grafico a dispersione bidimensionale per le osservazioni ordinate. E’ un buon modo per vedere le tendenze nel tempo.
Un grafico a indicatore confronta una metrica scelta (ad esempio media, somma) con una scala. A seconda di dove ricade la metrica, la scala cambia colore. I grafici a indicatore sono utili per confrontare rapidamente le prestazioni previste di un valore con le prestazioni effettive.
Tabulazioni a campi incrociati
Un modo per analizzare i dati categorici è attraverso un tabella incrociata, chiamata anche una tabella di contingenza o una tabella bidirezionale. Un campo incrociato registra il numero di rispondenti che presentano le caratteristiche specifiche descritte nelle celle della tabella.
In questo esempio, è possibile visualizzare il numero di ogni tipo di articolo acquistato settimanalmente, mensilmente e annualmente (ad esempio, 11 cappotti vengono acquistati mensilmente).
Un campo incrociato è costituito da colonne e righe, o banner e stub, rispettivamente, in cui ogni banner e stub estrae i dati di frequenza di una domanda. Qualtrics ti consentirà solo di selezionare le domande compatibili per una tabella a campi incrociati (ad esempio, le domande a immissione di testo aperte non sono compatibili con una tabulazione a campi incrociati). Se selezioni più banner o stub, puoi selezionare il banner o la matrice che desideri visualizzare facendo clic su di essi nell’editor a campi incrociati. Se si aggiunge un drill down multilivello alla tabella a campi incrociati, 1 variabile verrà visualizzata come sottocategoria di un’altra.
Statistica test Chi quadrato
I test statistici del test chi-quadrato per la relazione significativa tra uno stub e uno striscione.
Se includi più stub e banner nella tua tabella a campi incrociati, Qualtrics produrrà anche valori chi-quadrato multipli, 1 per ogni combinazione di banner e stub.
È utile sapere come viene calcolata una statistica chi-quadrato. Innanzitutto, è necessario trovare il conteggio previsto per ogni cella o il conteggio che si prevede si baserà sulla riga totale, sul totale della colonna e sul totale della tabella. Per trovare un conteggio previsto, calcolare il totale della riga moltiplicato per il totale della colonna e dividere il risultato per il totale della tabella.
Una volta ottenuto il conteggio previsto, eseguire il seguente calcolo:
La statistica del test chi-quadrato si trova sottraendo il valore osservato al valore previsto, azzerando questa differenza e dividendola per il valore previsto per ogni cella. Questi singoli componenti del test chi-quadrato vengono poi sommati e il risultato è la statistica del test chi-quadrato. Il valore chi-quadrato viene quindi utilizzato per determinare se la relazione tra le variabili è statisticamente significativa.
Valore P
Le statistiche del test chi-quadrato, insieme al livello di confidenza, vengono utilizzate per trovare un valore p. Un valore p determina se l’associazione tra le 2 variabili è statisticamente significativa. Un valore p basso significa che la relazione della tabella osservata si verificherebbe con probabilità molto bassa, quindi esiste una relazione significativa tra le 2 variabili. Un valore p basso è generalmente considerato una cifra inferiore a 0,05.
Il nostro valore p è .28, che non è significativo. Pertanto, non esiste alcuna relazione tra la frequenza della visita e il tipo di articolo acquistato.
Analisi supplementari
Ulteriori analisi per dati quantitativi, quali correlazione e regressione, possono essere portate su Excel o su un pacchetto software statistico.
Correlazione
Il coefficiente di correlazione, r, descrive la forza e la direzione di una relazione approssimativamente lineare tra 2 variabili quantitative. Il valore di r è sempre compreso tra -1 e 1, dove i valori più vicini a -1 e 1 rappresentano una forte correlazione e i valori vicini allo zero sono deboli. Il segno più o meno indica la direzione positiva o negativa della relazione. I valori di correlazione tra -.3 e .3 sono considerati piuttosto bassi, mentre i valori di correlazione tra .7 e 1 o -.7 e -1 sono considerati elevati.
Un punto chiave da ricordare è che la correlazione non è la stessa causale. Solo perché 2 variabili sono altamente correlate non significa che 1 di queste variabili fa sì che le altre 1 si verifichino.
Regressione
L’analisi di regressione può essere utilizzata per fare previsioni per 1 variabile in base a 1 o più variabili predittive. Consultare le seguenti pagine per ulteriore assistenza sulle regressioni: