Scripts R précomposés
À propos des scripts R précomposés
R est un langage de programmation statistique largement utilisé pour des analyses souples et puissantes. Lorsque vous utilisez le codage R dans Stats iQ, vous pouvez sélectionner plusieurs scripts d’analyse pour rendre l’utilisation de R plus facile et plus efficace.
Sélection d’un script pour le code R
- Sélectionnez les variables que vous souhaitez analyser. Pour plus d’informations, voir Sélection de variables de cadre de données pour le code R.
- Cliquez sur Avancé.
- Cliquez sur Code R.
- Sélectionnez un script. Pour plus d’informations sur les options d’analyse, voir les sections ci-dessous.
- Cliquez sur Suivant.
- Confirmez les variables que vous avez sélectionnées. Si vous souhaitez modifier une variable, cliquez sur la liste déroulante et sélectionnez-en une nouvelle.
- Modifiez le nom de vos variables, si vous le souhaitez. Pour plus d’informations, voir Nommer les variables de cadre de données pour le code R.
Astuce Qualtrics : vous pouvez modifier les variables que vous avez sélectionnées directement depuis cette fenêtre. Pour modifier les valeurs recodées, cliquez sur Modifier. Pour supprimer la variable, cliquez sur l’icône ( – ). Si vous souhaitez ajouter une nouvelle variable, cliquez sur Ajouter une variable en bas à gauche.
- Lorsque vous avez terminé de modifier vos variables de cadre de données, cliquez sur Créer une carte de code.
Navigation dans les scripts de code R précomposés
Votre script sera collé dans la section de code de la carte Code R. Ce code contiendra des conseils ainsi que les commandes de génération de l’analyse que vous avez sélectionnée. Pour exécuter votre analyse, cliquez sur Exécuter tout. Les résultats s’afficheront dans la zone d’édition à droite.
Vous pouvez modifier vos variables de cadre de données ou ajouter un filtre à l’analyse en cliquant sur les options en haut à droite. Cliquez sur le menu à trois points pour ajouter des notes à votre carte de code, copier l’analyse ou ouvrir la carte en plein écran.
SHORTCUTS
Les raccourcis clavier peuvent être utilisés pour naviguer plus efficacement dans la carte Code R. Cliquez sur Raccourcis pour obtenir la liste des actions possibles.
PACKAGES
Le codage R dans Stats iQ est pré-installé avec des centaines des packages R les plus populaires utilisés pour l’analyse. Cliquez sur l’onglet Packages dans la moitié droite de la carte pour afficher la liste des packages disponibles. Pour plus d’informations sur l’utilisation des packages, voir Codage R dans Stats iQ.
Fiabilité des échelles
La fiabilité de l’échelle évalue dans quelle mesure les éléments d’une échelle multi-éléments peuvent mesurer une construction de manière fiable. En d’autres termes, si la même chose est mesurée à l’aide du même ensemble de questions, y aura-t-il des résultats fiables similaires ? Si c’est le cas, il est certain que tout changement que nous constatons à l’avenir est dû à des changements dans la population visée par l’enquête ou à des interventions qui ont été faites pour améliorer le score.
MESURES DE FIABILITÉ D’INTERPRÉTATION
Les mesures de fiabilité d’échelle se situent entre 0 et 1 et sont essentiellement une corrélation agrégée entre tous les éléments de l’échelle.
L’alpha de Cronbach, une mesure de fiabilité largement utilisée, sous-estime souvent la fiabilité en raison de certaines hypothèses. L’oméga de McDonald’s, alternative recommandée, évite ces failles. Nous utilisons l’oméga de McDonald’s par défaut, mais l’alpha de Cronbach est toujours largement accepté.
Il n’y a pas une seule façon correcte d’interpréter le nombre résultant, mais notre règle de base préférée pour les deux oméga est décrite ci-dessous:
Moins de 0,65 | Inacceptable |
0,65 | Acceptable |
0,8 | Très bien |
Si votre échelle fiable n’est pas acceptable, il existe quelques options pour corriger votre ensemble de données :
- Supprimez tous les éléments qui abaissent l’oméga ou l’alpha.
- Il est possible que deux constructions distinctes soient mesurées. Si c’est le cas, la séparation des variables en deux groupes et l’exécution de cette analyse sur chacun entraîneraient des scores de fiabilité supérieurs à ceux de l’analyse initiale. Vous pouvez explorer cela en examinant la matrice de corrélation dans la sortie ou en utilisant le script Analyse des facteurs exploratoires pour voir quels regroupements tombent naturellement hors des données.
- Enfin, il peut être nécessaire de modifier et d’exécuter à nouveau l’enquête. Il peut être nécessaire de clarifier ou de retravailler les éléments présentant une faible corrélation avec les autres, ou d’ajouter d’autres éléments.
Des résultats très élevés (par exemple, 0,95) peuvent également indiquer un problème avec l’échelle, généralement que vous pouvez toujours avoir une échelle qui est très fiable sans avoir autant d’éléments. Dans ce cas, nous vous recommandons de supprimer les postes les moins utiles de l’échelle et de réexécuter l’analyse.
STATISTIQUES DU NIVEAU D’ÉLÉMENT D’INTERPRÉTATION
Le script exécute d’abord une mesure de fiabilité globale, puis exécute une itération pour chaque variable. L’objectif de l’analyse de fiabilité par article est de comprendre quels éléments sont les plus utiles à la construction de l’échelle. Stats iQ affichera un tableau qui ressemble à ceci :
Globalement McDonald’s Omega : 0.71
N | Moyenne | Corrélation totale-poste | McDonald’s Omega s’il est retiré | |
A1 | 2784 | 4.59 | 0.31 | 0.72 |
A2 | 2773 | 4.80 | 0.56 | 0.69 |
A3 | 2774 | 4.60 | 0,59 | 0.61 |
… | … | … | … | … |
- L’objectif général est d’avoir un McDonald’s Omega plus élevé avec un nombre d’articles inférieur. Donc, si un chercheur créait une nouvelle échelle, il voudrait probablement supprimer A1, puisque l’oméga est en fait plus élevé sans elle.
- Le reste des éléments qui diminueraient la fiabilité s’ils étaient retirés sont à la discrétion du chercheur. Par exemple, si un chercheur est préoccupé par la lassitude de l’enquête, il peut permettre une diminution plus importante de la fiabilité lorsqu’il décide de supprimer une variable.
- La corrélation Item-Total est la corrélation entre cet élément et la moyenne de tous les autres. Une corrélation faible entre l’élément et le total suggère que la variable n’est pas assez représentative de la construction sous-jacente. La règle la plus courante est de se méfier de tout ce qui a une corrélation Item-Total égale ou inférieure à 0,3, surtout si vous avez beaucoup d’articles, ce qui gonfle artificiellement la métrique de fiabilité.
Si vous choisissez de supprimer un élément, vous devez exécuter à nouveau toutes les autres statistiques avant de décider de supprimer un autre élément. Dans Stats iQ, cela signifie simplement supprimer la variable de l’ensemble de la carte. Le reste se produira automatiquement.
MATRICE DE CORRELATION INTER-POSTE
La Matrice de corrélation inter-éléments affiche la corrélation entre chaque variable de l’analyse et l’autre variable. Par exemple, si une variable est très fortement corrélée à une autre (p. ex., 0,9), ces questions peuvent être redondantes et leur suppression n’aura qu’un faible impact sur votre fiabilité.
La Corrélation inter-éléments moyenne est la moyenne des nombres dans la matrice. Des chiffres plus élevés suggèrent que certains éléments peuvent être redondants et être supprimés. En règle générale, les variables doivent être comprises entre 0,2 et 0,4.
PLUS DE RESSOURCES
- L’analyse de fiabilité dans Stats iQ est exécutée par la fonction compRelSem() du package semTools R. Différentes options avancées sont décrites dans la documentation. Il n’est pas nécessaire d’utiliser ou de comprendre ces paramètres pour exécuter une analyse de fiabilité.
- La matrice de corrélation est exécutée par la fonction corrplot() du paquet corrplot R. Divers paramètres et personnalisations avancés sont décrits dans la documentation et dans cette présentation.
Fiabilité inter-évaluateurs
La fiabilité inter-évaluateurs (TRI) est utilisée pour évaluer dans quelle mesure deux évaluateurs ou plus sont d’accord dans leur évaluation. Par exemple, trois codeurs différents peuvent évaluer un commentaire textuel comme ayant un sentiment positif, neutre ou négatif ; le TRI décrit dans quelle mesure ils étaient d’accord les uns avec les autres.
MESURES DE RESPONSABILITÉ INTERRATER
Le TRI est évalué à l’aide de métriques légèrement différentes en fonction de la structure des données. Par exemple, une analyse de l’inter-fiabilité de deux évaluateurs utilisera une métrique légèrement différente de celle de l’inter-fiabilité de 3 raters.
Stats iQ sélectionnera automatiquement la mesure appropriée pour vos données.
RÉSULTATS D’INTERPRÉTATION
La métrique Kappa ou ICC est le produit principal, entre 0 et 1, et indique à quel point les évaluateurs sont bien corrélés. Nous vous suggérons les gammes ci-dessous pour interpréter le Kappa:
0,75 à 1 | Excellente |
0,6 à 0,75 | Bonne |
0,4 à 0,6 | Plutôt bien |
0,4 ou moins | Mauvaise |
PLUS DE RESSOURCES
- Cette analyse de fiabilité est exécutée par les fonctions du paquet IRR R. Différentes options avancées sont décrites dans la documentation. Il n’est pas nécessaire d’utiliser ou de comprendre ces options pour exécuter cette analyse.
Analyse des facteurs exploratoires
L’analyse exploratoire des facteurs (EPT) est une technique statistique qui vous aide à réduire un grand nombre de variables en un ensemble plus petit et plus gérable de « facteurs » sommaires. Cela les rend beaucoup plus faciles à interpréter, à communiquer et à exécuter des analyses supplémentaires (p. ex., analyse de régression). L’AAE suit généralement cet ensemble d’étapes :
- Diagnostics : exécutez et interprétez un ensemble de diagnostics qui déterminent si les données sont appropriées pour l’analyse des facteurs. Les variables doivent être suffisamment corrélées les unes avec les autres pour former des regroupements significatifs, mais pas si fortement corrélées qu’elles sont essentiellement redondantes.
- Choix des facteurs : Déterminez le nombre de facteurs présents dans les données. Les facteurs sont les regroupements de variables similaires ensemble. Par défaut, le script R utilisera un critère calculé et exécuté automatiquement.
- Facteurs d’appellation : Après avoir géré l’EPT, vous aurez plusieurs facteurs qui représentent le mieux les thèmes clés des données. Il est utile d’étiqueter ces facteurs avec des noms lisibles par l’homme qui saisissent leur signification.
- Mesures associées & métriques : l’analyse des facteurs est exécutée avec le nombre de facteurs de l’étape précédente. Le résultat est un ensemble de regroupements de variables avec une description statistique du calcul au prorata temporis.
Le résultat est un ensemble de facteurs nommés et de leurs éléments d’enquête de composants. Ces facteurs peuvent servir de cadre conceptuel pour d’autres analyses ou être appliqués aux données.
DIAGNOSTIQUES
Le script exécute d’abord une série de diagnostics pour s’assurer que les données sont adaptées à l’EPT :
- Taille de l’échantillon : En général, un rapport de 10:1 des réponses aux éléments est suggéré. Par exemple, si vous avez 10 questions, vous devez avoir au moins 100 répondants.
- Test de Sphéricité de Bartlett: Ce test évalue si les éléments sont suffisamment corrélés pour être utilement regroupés en facteurs. Si cela échoue, il y a probablement plusieurs éléments qui ne sont pas assez corrélés avec les autres. Vous pouvez envisager de supprimer de votre analyse des éléments qui ne sont pas en corrélation avec d’autres ou d’ajouter d’autres éléments liés à l’enquête.
- Déterminant : Le déterminant évalue si les éléments sont trop fortement corrélés pour être utilement regroupés en facteurs. Si ce diagnostic échoue, il y a probablement des éléments qui sont trop similaires les uns aux autres pour se séparer en facteurs. Pensez à modifier les éléments de l’enquête pour les distinguer davantage.
- Mesure Kaiser-Meyer-Olkin (KMO) : cette mesure vérifie si les éléments de votre enquête ont suffisamment en commun pour les regrouper en facteurs significatifs. La réussite de ce diagnostic signifie que les réponses de votre enquête ont beaucoup en commun et peuvent être regroupées correctement. Sinon, les éléments ne sont pas regroupés en catégories. Si ce diagnostic échoue, il se peut que vous souhaitiez réviser les éléments de votre enquête pour recueillir plus de thèmes similaires et envisager de supprimer des éléments qui ne présentent pas de relation claire avec les autres.
FACTEURS DE CHOISIR
Le but du CFC est de réduire de nombreuses variables en un nombre relativement petit qui sont utiles pour l’analyse, donc vous devrez peut-être exécuter l’analyse des facteurs plusieurs fois avec différents nombres de facteurs pour trouver un regroupement qui fonctionne pour vous. L’écriture de l’EPT suggérera le nombre de facteurs en utilisant leurs valeurs propres.
Le script EFA affichera un diagramme d’écran, qui affiche les valeurs propres des variables dans l’ordre décroissant. Vous pouvez examiner le graphique pour voir combien de facteurs apparaissent avant le « coude » dans le diagramme, après quoi l’ajout de facteurs supplémentaires est moins utile.
INAMINER VOS FACTEURS
Après l’exécution d’EFA, chaque variable est affectée à un facteur. Il est utile de donner à chaque facteur un nom qui vous donne un raccourci pour en parler, ce qui rend vos résultats plus accessibles. L’objectif ici est de simplifier vos données complexes en quelques thèmes compréhensibles.
Voici quelques instructions pour nommer vos facteurs :
- Être descriptif : essayez de capturer le thème commun qui résume les variables du groupe.
- Gardez cela simple : vos noms de facteurs doivent être faciles à comprendre et à communiquer. Évitez le jargon technique ou les phrases trop complexes.
- Considérez votre public : les noms des facteurs devraient avoir du sens pour les personnes qui utiliseront votre analyse. Par exemple, « Propreté » serait significatif à la fois pour les chefs d’hôtel et les clients de l’hôtel.
- Cohérence : si votre enquête ou votre ensemble de données couvre différents domaines ou sujets, assurez-vous que les noms de vos facteurs sont cohérents.
MESURES ASSOCIÉES & METRICS
Le tableau des charges de facteurs est l’un des principaux résultats de l’EPT. Le chargement de facteur pour une paire de facteurs variables donnée est la corrélation entre cette variable et le facteur. Si une variable a une charge de facteur élevée pour un facteur donné, cela signifie que la question est fortement liée à ce facteur.
L’unicité est la partie de l’écart qui est unique à la variable spécifique et qui n’est pas partagée avec d’autres variables. Les valeurs d’unicité vont de 0 à 1 avec des valeurs plus élevées indiquant que la variable est unique et ne correspond à aucun des facteurs.
En général, il est recommandé de supprimer les variables si leurs charges de facteurs sont supérieures à 0,3 ou si leur unicité est supérieure à 0,7.
UTILISER VOS RÉSULTATS
L’analyse des facteurs est un processus itératif, vous pouvez donc avoir besoin de l’exécuter plusieurs fois avec différents nombres de facteurs pour trouver un regroupement qui fonctionne pour vous. Pour la plupart des chercheurs, l’essentiel est de trouver des regroupements de facteurs qui peuvent fournir une nouvelle visibilité sur leurs données, mais vous pouvez utiliser ces facteurs comme de nouvelles variables dans l’analyse ultérieure, comme la régression ou l’analyse de cluster. Par exemple, vous pouvez créer une variable pour chaque facteur qui prend la valeur moyenne de toutes les variables qui y sont regroupées.
Matrice de corrélation
La matrice de corrélation est un tableau qui montre la corrélation entre chaque paire de variables fournie. Ce tableau utilise le r de Pearson par défaut pour mesurer la corrélation, mais vous pouvez la modifier en rho de Spearman si vous le souhaitez.
Vous pouvez modifier les paramètres de la fonction corrplot() pour modifier la table et la rendre plus lisible. Pour plus d’informations, vous pouvez consulter la présentation et la documentation officielles de R.