Modello di articolo
Informazioni sugli script R precomposti
R è un linguaggio di programmazione statistica ampiamente utilizzato per un’analisi flessibile e potente. Quando utilizzi il codice R in Stats iQ, puoi scegliere tra più script di analisi per rendere l’utilizzo di R più semplice ed efficiente.
Selezione di uno script per il codice R
- Seleziona le variabili che desideri analizzare. Per ulteriori informazioni, vedere Selezione delle variabili Dataframe per il codice R.
- Fare clic su Avanzate.
- Fare clic su Codice R.
- Selezionare uno script. Per ulteriori informazioni sulle opzioni per le analisi, vedere le sezioni sottostanti.
- Fare clic su Successivo.
- Confermare le variabili selezionate. Se desideri modificare una variabile, fai clic sull’elenco a discesa e selezionane una nuova.
- Modifica il nome delle tue variabili, se vuoi. Per ulteriori informazioni, vedere Naming Dataframe Variables for R Code.
Consiglio Q: È possibile apportare modifiche alle variabili selezionate direttamente da questa finestra. Per modificare la ricodifica valori, fai clic su Modifica. Per eliminare la variabile, fare clic sull’icona ( – ). Per aggiungere una nuova variabile, fare clic su Aggiungi variabile in basso a sinistra.
- Quando hai finito di modificare le variabili del dataframe, fai clic su Crea scheda codice.
Navigazione degli script di codici R precomposti
Lo script verrà incollato nella sezione del codice della scheda Codice R. Questo codice conterrà consigli insieme ai comandi per la generazione dell’analisi selezionata. Per eseguire l’analisi, fare clic su Esegui tutto. I risultati verranno visualizzati nella casella di output a destra.
È possibile modificare le variabili del dataframe o aggiungere un filtro all’analisi facendo clic sulle opzioni in alto a destra. Fai clic sul menu a tre punti per aggiungere note alla tua scheda codice, copiare l’analisi o aprire la scheda a schermo intero.
TAGLIE
Le scorciatoie da tastiera possono essere utilizzate per navigare in modo più efficiente nella scheda Codice R. Fare clic su Tasti di scelta rapida per un elenco di azioni possibili.
PACCHETTI
La codifica R in Stats iQ viene preinstallata con centinaia dei pacchetti R più popolari utilizzati per l’analisi. Fare clic sul tab Pacchetti nella metà destra della scheda per visualizzare l’elenco dei pacchetti disponibili. Per ulteriori informazioni sull’utilizzo dei pacchetti, vedere Codifica R in Stats iQ.
Affidabilità scala
L’affidabilità della scala valuta la misura in cui gli elementi di una scala a più posizioni possono misurare in modo affidabile un costrutto. In altre parole, se la stessa cosa viene misurata utilizzando la stessa serie di domande, ci saranno risultati attendibilmente simili? Se sì, c’è fiducia che eventuali cambiamenti che vediamo in futuro siano dovuti a cambiamenti nella popolazione intervistata o interventi che sono stati fatti per migliorare il punteggio.
INTERPRETAZIONE DELLE MISURE DI AFFIDABILITÀ
Le misure di affidabilità di scala scendono tra 0 e 1 e sono essenzialmente una correlazione aggregata tra tutti gli elementi della scala.
L’alfa di Cronbach, una misura di affidabilità ampiamente utilizzata, spesso sottovaluta l’affidabilità a causa di alcune ipotesi. L’omega di McDonald’s, alternativa consigliata, evita questi difetti. Usiamo l’omega di McDonald’s per impostazione predefinita, ma l’alfa di Cronbach è ancora ampiamente accettata.
Non esiste un unico modo corretto per interpretare il numero risultante, ma la nostra regola di pollice preferita per entrambi gli omega è descritta di seguito:
Meno di 0,65 | Inaccettabile |
0,65 | Accettabile |
0.8 | Ottimo |
Se la scala attendibile non è accettabile, sono disponibili alcune opzioni per correggere l’insieme di dati:
- Rimuovere eventuali elementi che stanno abbassando l’omega o l’alfa.
- È possibile che ci siano due costrutti distinti che vengono misurati. Se è così, separare le variabili in due gruppi e eseguire questa analisi su ciascuno di essi porterebbe a punteggi di affidabilità superiori a quelli dell’analisi iniziale. È possibile esplorarlo rivedendo la matrice di correlazione nell’output o utilizzando lo script Analisi fattori esplorativa per vedere quali raggruppamenti naturalmente non rientrano nei dati.
- In definitiva, potrebbe essere necessario modificare ed eseguire nuovamente l’indagine. Gli elementi che hanno una bassa correlazione con gli altri potrebbero dover essere chiariti o rielaborati, oppure potrebbe essere necessario aggiungerne altri.
Risultati molto elevati (es. 0,95) possono anche indicare un problema con la scala, di solito si potrebbe avere ancora una scala che è molto affidabile senza avere così tanti articoli. In questo caso, si consiglia di rimuovere le posizioni meno utili dalla scala e di rieseguire l’analisi.
INTERPRETAZIONE DELLE STATISTICHE A LIVELLO DI POSIZIONE
Lo script esegue prima un indicatore di affidabilità complessivo, quindi esegue un’iterazione per ogni variabile. L’obiettivo dell’analisi dell’affidabilità per elemento è capire quali elementi sono più utili per la costruzione della scala. Stats iQ produrrà una tabella simile a questa:
Complessivo McDonald’s Omega: 0.71
N | Media | Correlazione totale posizione | McDonald’s Omega se rimosso | |
A1 | 2784 | 4.59 | 0.31 | 0.72 |
A2 | 2773 | 4.80 | 0.56 | 0.69 |
A3 | 2774 | 4.60 | 0,59 | 0.61 |
… | … | … | … | … |
- L’obiettivo generale è quello di avere un McDonald’s Omega più alto con un numero inferiore di oggetti. Quindi, se un ricercatore stesse creando una nuova scala, probabilmente vorrebbe rimuovere A1, dal momento che l’omega è in realtà più alto senza di esso.
- Il resto degli elementi che diminuirebbero l’affidabilità se rimossi sono a carico del ricercatore per determinare. Ad esempio, se un ricercatore si preoccupa della stanchezza del sondaggio, potrebbe consentire una diminuzione maggiore dell’affidabilità quando decide di rimuovere una variabile.
- La Correlazione articolo-totale è la correlazione tra tale voce e la media di tutte le altre. La bassa correlazione Item-Total suggerisce che la variabile non è sufficientemente rappresentativa del costrutto sottostante. La regola più comune è quella di essere sospettosi di qualsiasi cosa con una Correlazione Item-Total di 0,3 o inferiore, soprattutto se si hanno molti elementi, che gonfiano artificialmente la metrica di affidabilità.
Se si sceglie di rimuovere un elemento, è necessario eseguire nuovamente tutte le altre statistiche prima di decidere se rimuovere un altro elemento. In Stats iQ, ciò significa semplicemente rimuovere la variabile dall’intera scheda, il resto avverrà automaticamente.
MATRICE DI CORRELAZIONE INTERITEM
La matrice di correlazione interitem mostra la correlazione tra ogni variabile nell’analisi e l’altra variabile. Ad esempio, se una variabile è molto correlata con un’altra (ad esempio 0,9), tali domande potrebbero essere ridondanti e rimuoverle avrà solo un piccolo impatto sulla tua affidabilità.
La Correlazione media tra posizioni è la media dei numeri nella matrice. Numeri più alti suggeriscono che alcuni elementi potrebbero essere ridondanti e potrebbero essere rimossi. Generalmente, le variabili dovrebbero scendere nell’intervallo compreso tra 0,2 e 0,4.
ALTRE RISORSE
- L’analisi di affidabilità in Stats iQ è eseguita dalla funzione compRelSem() dal pacchetto semTools R. Una varietà di impostazioni avanzate sono descritte nella documentazione. Non è necessario utilizzare o comprendere queste impostazioni per eseguire un’analisi di affidabilità.
- La matrice di correlazione viene eseguita dalla funzione corrplot() del pacchetto R corrplot. Una varietà di impostazioni e personalizzazioni avanzate sono descritte nella documentazione e in questo percorso guidato.
Affidabilità tra valutatori
L’affidabilità tra rater (IRR) viene utilizzata per valutare in che misura due o più rater concordano nella loro valutazione. Ad esempio, tre diversi codificatori potrebbero valutare un commento di testo come avente un sentiment positivo, neutro o negativo; il TRI descrive quanto sono d’accordo tra loro.
MISURE DI AFFIDABILITÀ INTERRATERE
Il TIR viene valutato utilizzando metriche leggermente diverse in base alla struttura dei dati. Ad esempio, un’analisi dell’interaffidabilità di due rater utilizzerà una metrica leggermente diversa da quella dell’interaffidabilità di 3 rater.
Stats iQ selezionerà automaticamente la metrica appropriata per i tuoi dati.
RISULTATI DI INTERPRETAZIONE
La metrica Kappa o ICC è l’output principale, compreso tra 0 e 1, e indica quanto siano ben correlati i rater. Per l’interpretazione della Kappa suggeriamo le seguenti gamme:
Da 0,75 a 1 | Eccellente |
Da 0,6 a 0,75 | Buono |
Da 0,4 a 0,6 | Discreto |
0,4 o inferiore | Scarso |
ALTRE RISORSE
- Questa analisi di affidabilità viene eseguita dalle funzioni del pacchetto IRR. Una varietà di impostazioni avanzate sono descritte nella documentazione. Non è necessario utilizzare o comprendere queste impostazioni per eseguire questa analisi.
Analisi dei fattori esplorativi
L’analisi dei fattori esplorativi (EFA) è una tecnica statistica che aiuta a ridurre un gran numero di variabili in un insieme più piccolo e gestibile di “fattori” riepilogativi. Ciò semplifica notevolmente l’interpretazione, la comunicazione e l’esecuzione di ulteriori analisi (ad esempio, l’analisi di regressione). L’EFA in genere segue questa serie di passaggi:
- Diagnostica: eseguire e interpretare una serie di diagnostiche che determinano se i dati sono adatti per l’analisi dei fattori. Le variabili devono essere sufficientemente correlate tra loro per formare raggruppamenti significativi, ma non così altamente correlate da essere essenzialmente ridondanti.
- Selezione dei fattori: determinare il numero di fattori presenti nei dati. I fattori sono raggruppamenti di variabili simili insieme. Per impostazione predefinita, lo script R utilizzerà un criterio che viene calcolato ed eseguito automaticamente.
- Fattori di denominazione: Dopo l’esecuzione dell’AAE rimarranno diversi fattori che meglio rappresentano i temi chiave nei dati. È utile etichettare questi fattori con nomi leggibili dall’uomo che ne catturano il significato.
- Indicatori associati; metriche: l’analisi del fattore viene eseguita con il numero di fattori della fase precedente. Il risultato è un insieme di raggruppamenti di variabili insieme ad una descrizione statistica del factoring.
Il risultato è un insieme di fattori denominati e dei relativi elementi dell’indagine sui componenti. Questi fattori possono servire da quadro concettuale per ulteriori analisi, o possono essere riapplicati ai dati.
DIAGNOSTICA
Lo script esegue prima una serie di diagnostiche per garantire che i dati siano adatti a EFA:
- Dimensione del campione: Generalmente, viene suggerito un rapporto 10:1 di risposte agli articoli. Ad esempio, se hai 10 domande dovresti avere almeno 100 partecipanti.
- Test of Sphericity di Bartlett: Questo test valuta se gli elementi sono abbastanza correlati da essere utilmente raggruppati in fattori. Se questo fallisce, ci sono probabilmente diversi elementi che non sono abbastanza correlati con gli altri. Potresti prendere in considerazione l’idea di eliminare elementi dalla tua analisi che non sono correlati ad altri, o di aggiungere altri elementi correlati al sondaggio.
- Determinante: il determinante valuta se gli elementi sono troppo altamente correlati per essere utilmente raggruppati in fattori. Se questa diagnostica fallisce, è probabile che vi siano elementi troppo simili tra loro da separare in fattori. Considera la possibilità di modificare gli elementi del sondaggio in modo più distinto.
- Misura Kaiser-Meyer-Olkin (KMO): questa misura controlla se gli elementi del sondaggio hanno abbastanza in comune per raggrupparli in fattori significativi. Superare questa diagnostica significa che le risposte del sondaggio hanno molto in comune e possono essere raggruppate bene. In caso contrario, gli elementi non vengono raggruppati in categorie. Se questa diagnostica fallisce, potresti voler rivedere le voci del sondaggio per acquisire temi più simili e prendere in considerazione la possibilità di rimuovere elementi che non mostrano una chiara relazione con gli altri.
FATTORI DI SCELTA
Il punto di EFA è quello di ridurre molte variabili in un numero relativamente piccolo che sono utili per l’analisi, quindi potrebbe essere necessario eseguire l’analisi del fattore più volte con un numero diverso di fattori per trovare un raggruppamento che funziona per voi. Lo script EFA suggerirà il numero di fattori utilizzando i loro autovalori.
Lo script EFA eseguirà l’output di uno scree plot, che mostra gli autovalori delle variabili in ordine decrescente. È possibile esaminare il grafico per vedere quanti fattori si verificano prima del “gomito” nel grafico, dopodiché aggiungere più fattori è meno utile.
NOTIFICARE I TUOI FATTORI
Dopo aver eseguito EFA, ogni variabile viene attribuita a un fattore. È utile dare a ogni fattore un nome che ti dia una stenografia per parlarne, il che rende i tuoi risultati più accessibili. L’obiettivo qui è quello di semplificare i dati complessi in alcuni temi comprensibili.
Ecco alcune linee guida per denominare i tuoi fattori:
- Sii descrittivo: cerca di catturare il tema comune che riassume le variabili del gruppo.
- Mantieni la semplicità: i nomi dei tuoi fattori dovrebbero essere facili da capire e comunicare. Evitare il gergo tecnico o frasi eccessivamente complesse.
- Considera il tuo pubblico: i nomi dei fattori dovrebbero avere senso per le persone che utilizzeranno la tua analisi. Ad esempio, la “pulizia” sarebbe significativa sia per i gestori che per gli ospiti dell’hotel.
- Consistenza: se il tuo sondaggio o il set di dati si estende su diversi domini o soggetti, assicurati che i nomi dei tuoi fattori siano coerenti.
MISURE ASSOCIATE; METRICS
La tabella dei caricamenti dei fattori è uno degli output chiave di EFA. Il caricamento del fattore per una determinata coppia di fattori variabili è la correlazione tra tale variabile e il fattore. Se una variabile ha un caricamento ad alto fattore per un determinato fattore, significa che la domanda è fortemente connessa a quel fattore.
L’univocità è la porzione della varianza univoca per la variabile specifica e non condivisa con altre variabili. I valori di univocità vanno da 0 a 1 con valori superiori che indicano che la variabile è univoca e non si adatta bene ad alcuno dei fattori. .
Generalmente, si consiglia di rimuovere le variabili se i loro caricamenti di fattori sono superiori a 0.3 o se la loro unicità è superiore a 0,7.
UTILIZZARE I VOSTRI RISULTATI
L’analisi dei fattori è un processo iterativo, quindi potrebbe essere necessario eseguirla più volte con un numero diverso di fattori per trovare un raggruppamento che funzioni per l’utente. Per la maggior parte dei ricercatori, il punto chiave è trovare raggruppamenti di fattori che possono fornire nuove informazioni sui loro dati, ma è possibile utilizzare questi fattori come nuove variabili nell’analisi successiva, come la regressione o l’analisi dei cluster. Ad esempio, è possibile creare una nuova variabile per ogni fattore che prende il valore medio di tutte le variabili raggruppate in esso.
Matrice di correlazione
La matrice di correlazione è una tabella che mostra la correlazione tra ogni coppia di variabili fornite. Questa tabella utilizza la r di Pearson per impostazione predefinita per misurare la correlazione, ma è possibile modificarla in rho di Spearman, se lo si desidera.
È possibile modificare i parametri della funzione corrplot() per modificare la tabella e renderla più leggibile. Per ulteriori informazioni, è possibile visualizzare la documentazione e la procedura guidata R ufficiale.