Compréhension des statistiques
À propos des statistiques
Bienvenue dans Qualtrics Statistics. Il s’agit d’un aperçu des statistiques de base qui peuvent vous être utiles lorsque vous créez et analysez des projets dans Qualtrics. Nous allons aborder certains concepts statistiques de base, les appliquer à la plateforme et discuter d’autres options en dehors de Qualtrics.
Données quantitatives et catégoriques
Il existe 2 types de données : quantitatives et catégoriques.
Les données quantitatives sont évaluées sur une échelle numérique. L’âge, la hauteur ou le revenu sont des exemples de données quantitatives.
Les données catégoriques sont évaluées à une échelle nominale. Le sexe, la situation de famille ou la profession sont des exemples de données catégoriques. La plupart des données collectées dans une enquête sont catégoriques, où le nombre de répondants appartenant à une catégorie est obtenu.
Mesures du centre
Il existe 3 mesures de centre utilisées pour les données quantitatives : moyenne, médiane et mode.
La moyenne, ou moyenne, est la meilleure mesure du centre lorsque les données sont à peu près normalement distribuées ou ressemblent à une courbe en cloche. La moyenne se trouve en additionnant toutes les observations et en divisant par le nombre total d’observations.
La valeur médiane, ou moyenne, est une bonne mesure du centre lorsque les données semblent être faussées. Si vous alignez l’ensemble de votre observation dans l’ordre, la médiane est la valeur moyenne.
Le mode est la valeur qui apparaît le plus fréquemment dans vos données. Il n’est pas aussi couramment utilisé que la moyenne ou la médiane.
Mesures d’écart
Il existe quelques statistiques utiles pour mesurer la propagation de vos données : écart type, variance et plage.
Un écart-type est la distance moyenne des observations par rapport à leur moyenne. Comme la moyenne, un écart-type doit être utilisé avec des données à peu près normalement distribuées.
L’écart est simplement l’écart type au carré.
La plage est la différence entre la plus grande et la plus petite valeur.
Statistiques dans les visualisations
Une visualisation de tableau de statistiques dans Qualtrics affiche la valeur minimale, la valeur maximale, la moyenne, la variance, l’écart type et le nombre total de réponses.
Étant donné qu’une valeur est codée pour chaque option de réponse dans chaque question, Qualtrics trouvera ces statistiques pour déterminer si les données sont quantitatives ou catégoriques. C’est à vous de décider si ces statistiques ont du sens dans le cadre de votre étude.
Par exemple, vous pouvez demander aux répondants quelle est leur couleur préférée : rouge, jaune, bleu ou vert, codé en 1, 2, 3 et 4 respectivement. Qualtrics vous donnera un sens, mais il n’est pas logique d’avoir une couleur préférée moyenne.
Si vous aviez des répondants qui évaluaient les films sur une échelle de 1 à 5 étoiles, une moyenne serait utile. Des moyens comme 2,98 étoiles ou 4,32 étoiles rendent les films faciles à comparer.
Qualtrics propose divers diagrammes, graphiques et tableaux. Un graphique à barres affiche la fréquence des réponses dans chaque catégorie de choix de réponse.
Un diagramme à secteurs affiche ces fréquences sous forme de pourcentage du diagramme.
Les diagrammes à barres et les diagrammes à secteurs facilitent la comparaison des fréquences entre les catégories.
Un diagramme à courbes est un nuage de points bidimensionnel pour les observations ordonnées. C’est un bon moyen de voir les tendances au fil du temps.
Un graphique de type jauge compare une mesure choisie (p. ex., moyenne, somme) à une échelle. En fonction de l’emplacement de la métrique, l’échelle change de couleur. Les graphiques de type jauge sont utiles pour comparer rapidement les performances attendues d’une valeur avec ses performances réelles.
Tableaux croisés
1 façon d’analyser des données catégoriques consiste à tableau croisé, également appelée table des aléas ou table bidirectionnelle. Un tableau croisé enregistre le nombre de répondants présentant les caractéristiques spécifiques décrites dans les cellules du tableau.
Dans cet exemple, vous pouvez voir le nombre de chaque type d’article qui a été acheté chaque semaine, chaque mois et chaque année (par exemple, 11 manteaux sont achetés mensuellement).
Un tableau croisé se compose de colonnes et de lignes, ou de bannières et souches, respectivement, où chaque bannière et chaque souche extrait des données de fréquence d’une question. Qualtrics vous permettra uniquement de sélectionner des questions compatibles avec un tableau croisé (p. ex., les questions ouvertes ne sont pas compatibles avec un tableau croisé). Si vous sélectionnez plusieurs bannières ou souches, vous pouvez sélectionner celle que vous souhaitez afficher en cliquant dessus dans l’éditeur de tableaux croisés. Si vous ajoutez une analyse descendante multiniveau à votre tableau croisé, 1 variable apparaîtra comme sous-catégorie d’une autre.
Statistiques de test Khi carré
La statistique du test chi-square teste une relation significative entre une souche et une bannière.
Si vous incluez plusieurs souches et bannières dans votre tableau croisé, Qualtrics produira également plusieurs valeurs de chi-carré, 1 pour chaque combinaison de bannière et souche.
Il est avantageux de savoir comment une statistique de test chi-carré est calculée. Tout d’abord, vous devez trouver le nombre attendu pour chaque cellule ou le nombre attendu pour la cellule en fonction du total de la ligne, du total de la colonne et du total de la table. Pour trouver un nombre attendu, prenez le total de la ligne multiplié par le total de la colonne et divisez le résultat par le total de la table.
  ;
Une fois que vous avez le comptage attendu, effectuez le calcul suivant :
La statistique de test chi-square est obtenue en prenant la valeur observée moins la valeur attendue, en quadrant cette différence, et en la divisant par la valeur attendue pour chaque cellule. Ces composants de test carrés de chi-carré sont ensuite additionnés et le résultat est la statistique de test chi-square. La valeur chi-carré est ensuite utilisée pour déterminer si la relation entre vos variables est statistiquement significative.
Valeur P
Les statistiques du test chi-square, ainsi que le niveau de confiance, sont utilisées pour trouver une valeur p. Une valeur P détermine si l’association entre les 2 variables est statistiquement significative. Une faible valeur p signifie que la relation de table observée se produirait avec une très faible probabilité, il existe donc une relation significative entre les 2 variables. Une faible valeur de p est généralement considérée comme un chiffre inférieur à 0,05.
Notre valeur de p est de 0,28, ce qui n’est pas significatif. Par conséquent, il n’existe aucune relation entre la fréquence des visites et le type d’article acheté.
Analyses supplémentaires
Une analyse plus approfondie des données quantitatives, telles que la corrélation et la régression, peut être menée vers Excel ou un logiciel statistique.
Corrélation
Le coefficient de corrélation, r, décrit la force et la direction d’une relation approximativement linéaire entre 2 variables quantitatives. La valeur de r est toujours comprise entre -1 et 1, où les valeurs les plus proches de -1 et 1 représentent une forte corrélation et les valeurs proches de zéro sont faibles. Le signe plus ou moins indique le sens positif ou négatif de la relation. Les valeurs de corrélation entre -.3 et .3 sont considérées comme plutôt faibles, tandis que les valeurs de corrélation entre 0,7 et 1 ou -.7 et -1 sont considérées comme élevées.
Un point clé à retenir est que la corrélation n’est pas la même que le lien de causalité. Ce n’est pas parce que 2 variables sont fortement corrélées que 1 de ces variables provoque l’apparition de l’autre.
Régression
L’analyse de régression peut être utilisée pour effectuer des prédictions pour une variable basée sur une ou plusieurs variables prédictrices. Consultez les pages suivantes pour obtenir de l’aide sur les régressions :