Modello di articolo
Informazioni sulle statistiche
Benvenuti alle Statistiche di QUALTRrics. Questa è una panoramica delle statistiche di base che possono essere utili per creare e analizzare progetti in QUALTRrics. Tratteremo alcuni concetti statistici di base, li applicheremo alla piattaforma e discuteremo altre opzioni al di fuori di QUALTRrics.
Dati quantitativi e categorici
Esistono due tipi di dati: quantitativi e categorici.
I dati quantitativi sono valutati su una scala numerica. Esempi di dati quantitativi sono l’età, l’altezza o il reddito.
I dati categoriali sono valutati su una scala nominale. Esempi di dati categorici sono il sesso, lo stato civile o l’occupazione. La maggior parte dei dati raccolti in un sondaggio è di tipo categorico: si ottiene un conteggio del numero di intervistati che rientrano in una categoria.
Misure del centro
Esistono tre misure di centro utilizzate per i dati quantitativi: media, mediana e modalità.
La media è la migliore misura del centro quando i dati sono distribuiti in modo approssimativamente normale o assomigliano a una curva a campana. La media si ottiene sommando tutte le osservazioni e divisore per il numero totale di osservazioni.
La mediana, o valore centrale, è una buona misura del centro quando i dati appaiono distorti. Se si mettono in fila tutte le osservazioni in ordine, la mediana è il valore centrale.
La modalità è il valore che ricorre più frequentemente nei dati. Non è comunemente utilizzato come la media o la mediana.
Misure di diffusione
Esistono alcune statistiche utili per misurare la diffusione dei dati: deviazione standard, varianza e intervallo.
La deviazione standard è la distanza media delle osservazioni dalla loro media. Come la media, la deviazione standard dovrebbe essere utilizzata con dati a distribuzione approssimativamente normale.
La varianza è semplicemente la deviazione standard al quadrato.
L’intervallo è la differenza tra il valore più grande e quello più piccolo.
Statistiche nelle visualizzazioni
La visualizzazione di una Tabella statistiche in Qualtrics mostra il valore minimo, il valore massimo, la media, la varianza, la deviazione standard e il numero totale di risposte.
Poiché per ogni opzione di risposta in ogni domanda viene codificato un valore, Qualtrics troverà queste statistiche sia che i dati siano quantitativi che categorici. Spetta a voi decidere se queste statistiche hanno senso nel contesto del vostro studio.
Per esempio, si potrebbe chiedere ai rispondenti quale sia il loro colore preferito: rosso, giallo, blu o verde, codificati rispettivamente come 1, 2, 3 e 4. Qualtrics vi darà una media, ma non ha senso avere un colore preferito medio.
Se gli intervistati dovessero valutare i film su una scala da 1 a 5 stelle, sarebbe utile una media. I termini come 2,98 stelle o 4,32 stelle rendono i film facili da confrontare.
Qualtrics offre una varietà di grafici, diagrammi e tabelle. Un Grafico a barre mostra la frequenza delle risposte in ciascuna categoria di scelta.
Un Grafico a torta mostra queste frequenze come percentuale della torta.
Sia i Grafici a barre che i Grafici a torta consentono di confrontare facilmente le frequenze tra le categorie.
Un Grafico a linee è un grafico a dispersione bidimensionale per osservazioni ordinate. È un buon modo per vedere le tendenze nel tempo.
Un Grafico a quadrante confronta una metrica scelta (ad esempio, media, somma) con una scala. A seconda della posizione della metrica, la scala cambia colore. I Grafici a quadrante sono utili per confrontare rapidamente le prestazioni previste di un valore con quelle effettive.
Tabulazioni incrociate
1 modo per analizzare i dati categoriali è attraverso un tabulazione incrociata, chiamata anche tabella di contingenza o tabella a due vie. Una scheda trasversale registra il numero di intervistati che presentano le caratteristiche specifiche descritte nelle celle della tabella.
In questo esempio, è possibile vedere il numero di articoli acquistati settimanalmente, mensilmente e annualmente (ad esempio, 11 cappotti acquistati mensilmente).
Una scheda trasversale è composta da colonne e righe, o rispettivamente banner e stub, dove ogni banner e stub raccoglie i dati di frequenza di una domanda. QUALTRICS consente di selezionare solo le domande compatibili con la tabulazione incrociata (ad esempio, le domande a risposta aperta non sono compatibili con la tabulazione incrociata). Se si selezionano più banner o stub, è possibile selezionare quale banner o stub si desidera visualizzare facendo clic su di essi nell’editor delle schede trasversali. Se si aggiunge un menu a tendina multilivello alla tabulazione incrociata, una variabile apparirà come sottocategoria di un’altra.
Statistica del test chi-quadro
La statistica del test chi-quadro verifica la relazione significativa tra uno stub e un banner.
Se si includono più stub e banner nella scheda incrociata, QUALTRrics produrrà anche più valori del chi-quadro, 1 per ogni combinazione di banner e stub.
È utile sapere come viene calcolato un test statistico chi-quadro. Per prima cosa, è necessario trovare il conteggio previsto per ogni cella, ovvero il conteggio che ci si aspetta dalla cella in base al totale delle righe, al totale delle colonne e al totale della tabella. Per trovare un conteggio previsto, prendere il totale delle righe per il totale delle colonne e dividere il risultato per il totale della tabella.
Una volta ottenuto il conteggio previsto, eseguire il seguente calcolo:
La statistica del test chi-quadro si ottiene prendendo il valore osservato meno il valore atteso, elevando al quadrato questa differenza e divisore per il valore atteso per ogni cella. Questi singoli componenti del test chi-quadro vengono poi sommati e il risultato è la statistica del test chi-quadro. Il valore del chi-quadro viene quindi utilizzato per determinare se la relazione tra le variabili è statisticamente significativa.
Valore P
Le statistiche del test chi-quadro, insieme al livello di confidenza, sono utilizzate per trovare un valore p. Il valore p determina se l’associazione tra le due variabili è statisticamente significativa. Un valore p basso significa che la relazione osservata nella tabella si verificherebbe con una probabilità molto bassa, quindi c’è una relazione significativa tra le due variabili. Un valore p basso è generalmente considerato una cifra inferiore a .05.
Il nostro p-value è .28, che non è significativo. Pertanto, non vi è alcuna relazione tra la frequenza di visita e il tipo di articolo acquistato.
Analisi aggiuntive
Ulteriori analisi per i dati quantitativi, come la correlazione e la regressione, possono essere effettuate con Excel o con un pacchetto software statistico.
Correlazione
Il coefficiente di correlazione, r, descrive la forza e la direzione di una relazione approssimativamente lineare tra 2 variabili quantitative. Il valore di r è sempre compreso tra -1 e 1, dove i valori più vicini a -1 e 1 rappresentano una correlazione forte e i valori vicini a zero sono deboli. Il segno più o meno indica la direzione positiva o negativa della relazione. I valori di correlazione tra -.3 e .3 sono considerati piuttosto bassi, mentre i valori di correlazione tra .7 e 1 o -.7 e -1 sono considerati alti.
Un punto chiave da ricordare è che la correlazione non equivale alla causalità. Il fatto che 2 variabili siano altamente correlate non significa che 1 di queste variabili provochi il verificarsi dell’altra.
Regressione
L’analisi di regressione può essere utilizzata per fare previsioni su 1 variabile in base a 1 o più variabili predittive. Per ulteriori informazioni sulle regressioni, consultare le pagine seguenti:
- Guida di facile consultazione alla regressione lineare
- Guida di facile consultazione alla regressione logistica