Qu’est-ce que l’analyse de la variance ?
L’analyse de la variance, également appelée ANOVA (correspondant à Analysis Of Variance en anglais) a été développée au début du XXè siècle par Ronald Fisher, un statisticien britannique. C’est un modèle statistique qui sert à démontrer l’existence de similitudes ou différences sur des aspects précis dans une population étudiée.
Dans l’ANOVA, on étudie une variable quantitative à laquelle on attribue une ou deux variables qualitatives : les variables catégorielles.
Ces variables catégorielles sont appelées « facteurs » ou « facteurs de variabilité ». Si l’analyse de la variance se concentre sur un unique facteur on l’appelle alors analyse à un facteur ou One-way ANOVA. Si plusieurs facteurs entrent dans le test analytique, on parle alors d’analyse à deux facteurs, multifactorielle ou MANOVA pour Multivariate Analysis Of Variance.
L’ANOVA sert concrètement à mettre en lumière l’existence d’une interaction entre ces facteurs de variabilité et la variable quantitative principale étudiée, généralement une population divisée en 2 ou 3 groupes.
Pourquoi et comment utiliser l’analyse de la variance ?
Tout comme pour l’analyse factorielle et l’analyse du tableau de contingence, vous pouvez utiliser l’analyse de variance en tant que spécialiste du marketing, lorsque vous souhaitez tester une hypothèse statistique particulière. Cette méthode analytique ANOVA permet de comparer la variance de groupes d’individus afin d’étudier une éventuelle influence de facteurs.
Vous utilisez alors l’ANOVA pour vous aider à comprendre comment vos différents groupes répondent lors du test statistique. S’il existe un résultat statistiquement significatif, c’est-à-dire que les moyennes des différents groupes sont égales sur les facteurs étudiés, cela signifie que les deux groupes de population sont similaires.
Comme d’autres types de tests statistiques, l’ANOVA compare les moyennes de différents groupes et démontre l’existence de différences statistiques entre les moyennes. Cette méthode statistique fait partie des tests omnibus. Cela signifie qu’elle permet d’identifier une différence mais ne dit pas quels groupes spécifiques sont statistiquement différents les uns des autres.
Il est important de se rappeler que la principale question de recherche ANOVA est de savoir si les moyennes de l’échantillon étudié proviennent de populations différentes.
Exemples concrets d’utilisation de l’analyse de la variance
Analyser le trafic de son site avec ANOVA
L’ANOVA peut vous aider à savoir s’il existe ou non des différences significatives entre les moyennes de vos variables qualitatives ou facteurs. Si vous souhaitez mieux comprendre les visiteurs de votre site web et analyser les clics sur une page de destination vous pouvez donc sélectionner les facteurs suivants : âge, sexe, revenu.
Vous voudrez peut-être utiliser l’analyse de la variance pour vous aider à répondre à des questions comme celles-ci :
L’âge, le sexe ou le revenu ont-ils un effet sur le fait qu’un internaute clique sur une page de destination ?
Lorsque vous comprenez en quoi la moyenne de chaque facteur est différente des autres, vous pouvez commencer à comprendre laquelle d’entre elles a un lien avec votre variable principale (clics sur la page d’accueil) et commencer à découvrir ce qui motive ce comportement.
Identifier des différences de NPS au sein d’une même structure
L’emplacement, le statut d’emploi ou l’éducation ont-ils un effet sur le score NPS?
L’ANOVA à un facteur peut vous aider à savoir s’il existe ou non des différences significatives entre les groupes de vos variables indépendantes (comme les États-Unis vs le Canada vs le Mexique lors du test d’une variable de localisation). Vous voudrez peut-être ensuite tester plusieurs variables indépendantes (telles que l’emplacement, le statut d’emploi ou l’éducation).
Lorsque vous comprenez en quoi les groupes au sein de la variable indépendante diffèrent (comme les États-Unis vs le Canada vs le Mexique, et non l’emplacement, le statut d’emploi ou l’éducation), vous pouvez commencer à comprendre lequel d’entre eux a un lien avec votre variable dépendante (score NPS).
“Tous vos établissements ont-ils le même score NPS moyen?”
Il faut cependant avoir en tête que l’ANOVA vous indiquera seulement que les scores NPS moyens de tous les secteurs géographiques sont identiques ou ne sont pas identiques, il ne vous indique pas quelle zone a un score NPS moyen significativement plus élevé ou plus bas.
Comment effectuer un test ANOVA ?
L’analyse de la variance avec Qualtrics
Stats iQ et ANOVA
Stats iQ de Qualtrics peut vous aider à exécuter simplement un test de variance. Lorsque les utilisateurs sélectionnent une variable catégorielle comprenant 3 groupes ou plus et un facteur de variabilité, Stats iQ exécute deux types de test : le test F de Welch à un facteur et le test Games-Howell.
Le test One-way ANOVA de Welch étudie la relation et l’interaction de variance entre les deux variables et le test de Games-Howell qui se fait par paire teste chaque possibilité de paires pour voir si un groupe a tendance à avoir des valeurs plus élevées que l’autre.
Pour utiliser Stats iQ et réaliser le test analytique ANOVA, procédez comme suit :
– Cliquez sur une variable avec plus de 3 groupes et une variable factorielle numérique
– Cliquez sur « Associer »
– Vous obtenez une ANOVA et un rapport facile à comprendre
Analyses croisées Qualtrics et ANOVA
Vous pouvez également effectuer ce test analytique grâce à la fonction de tabulation croisée (CrossTabs) de notre plateforme qui sert à l’analyse par tableau de contingence.
Pour cela, il faut tout d’abord vous assurer que votre variable en colonne comporte plus de 3 groupes et que vos facteurs (en ligne) soient présentés sous forme numérique.
Il vous suffit ensuite de cliquer sur « Test statistique global des moyennes » pour visualiser une valeur p ANOVA.
Les différentes méthodes de test ANOVA
Le test F ANOVA de Welch
Il est recommandé, pour utiliser Stats iQ, de réaliser un test F de Welch non ordinal si plusieurs hypothèses concernant les données correspondent aux critères suivants :
– La taille de l’échantillon de population est supérieure à 10 fois le nombre de groupes dans le calcul (les groupes possédant une seule valeur sont exclus) et, par conséquent, le théorème central limite satisfait aux exigences de données normalement distribuées.
– il y a peu ou pas de valeurs aberrantes (valeur étant éloignée des autres observations effectuées sur le même phénomène) dans les variables catégorielles
Contrairement au test F classique plus connu pour analyser des variances égales, le test F de Welch ne suppose pas que les variances des groupes comparés sont égales.
L’hypothèse de variances égales conduit à des résultats moins précis lorsque les variances ne sont finalement pas égales et ses résultats sont très similaires lorsque les variances sont véritablement égales.
ANOVA à échelle ordinale
Lorsque les hypothèses ne sont pas respectées, l’ANOVA non ordinale ne peut être valide.
Dans ce cas, Stats iQ recommande l’utilisation de l’analyse de la variance ordinale également appelée Ranked ANOVA en anglais. Stats iQ transforme les données en classement (remplacement des valeurs par leur ordre de classement) puis exécute la méthode analytique de la variance sur ces données transformées.
L’ANOVA ordinale est résistante aux valeurs aberrantes et aux données non distribuées normalement. La transformation des valeurs en rangs ou classements est une méthode qui a fait ses preuves pour protéger la violation des hypothèses (méthode non-paramétrique) et est le plus souvent observée dans la différence entre la corrélation de Pearson et Spearman.
En effet, la transformation en échelle ordinale suivie du test F de Welch est similaire au test de Kruskal-Wallis utilisé pour tester si des échantillons trouvent leur origine dans la même distribution. Ce test de Kruskal-Wallis est d’ailleurs également appelé ANOVA unidirectionnelle sur rangs ou à un facteur contrôlé sur rangs.
Test par paires de Games-Howell
Stats iQ éxecute des tests Games-Howell quel que soit le résultat du test de variance (selon Zimmerman, 2010). L’outil affiche les tests par paires Games-Howell en rangs ou non en fonction des mêmes critères que ceux utilisés pour l’ANOVA à échelle ordinale ou non.
Le Games-Howell est un test T pour les variances inégales qui explique la probabilité de trouver des résultats statistiquement significatifs par hasard lors de l’exécution de nombreux tests par paires.
Contrairement au test b de Tukey communément utilisé dans les analyses post-hoc, celui de Games-Howell ne suppose pas que les variances des groupes comparés sont égales.
Tout comme pour le test F de Welch, l’hypothèse de variances égales conduit à des résultats moins précis lorsque les variances ne sont en fait pas égales. Ses résultats sont semblables lorsque les variances sont réellement égales (Howell, 2012).
Notez que tandis que le test par paires non classé teste l’égalité des moyennes des deux groupes, le test par paires ordinal ne teste pas explicitement les différences entre les moyennes ou les médianes des groupes. Il teste plutôt une tendance générale d’un groupe à avoir des valeurs plus élevées que l’autre.
Les limites de l’analyse de la variance
Bien que l’ANOVA vous aide à analyser la différence de moyenne entre deux variables indépendantes, elle ne vous dira pas quels groupes statistiques sont différents les uns des autres. Si votre test renvoie une statistique f significative (valeur obtenue lors de l’exécution du test), vous devrez sans doute effectuer un test complémentaire ad-hoc pour vous dire exactement quels groupes ont une différence.
Informations supplémentaires pour utiliser les analyses de variance
La taille de l’échantillon à étudier
Avec des échantillons de plus petite taille, les données peuvent encore être inspectées pour déterminer si elles sont normalement distribuées. Si tel est le cas, les résultats du test T non classé sont toujours valides même pour les petits échantillons.
En pratique, cette évaluation peut être difficile à réaliser. C’est pourquoi Stats iQ recommande des tests T ordinaux par défaut pour les petits échantillons.
Avec des échantillons de population de plus grande taille, les valeurs aberrantes sont moins susceptibles d’impacter négativement les résultats. Stats iQ utilise l’ « outside fence » de Tukey pour définir les valeurs aberrantes.
Analyse de l’echelle de Likert
Des variables telles que « Plus haut niveau de scolarité atteint » ou « Ordre final au marathon sont sans ambiguïté ordinale. Bien que les échelles de Likert (échelle de 1 à 7 reflétant la satisfaction) soient techniquement ordinales, il est courant en sciences sociales de les traiter comme si elles étaient continues (c’est-à-dire non ordinales avec un test t).
Simplifiez votre analyse statistique avec Qualtrics
Qualtrics aide vos équipes à réaliser des études statistiques marketing en simplifiant les analyses qu’il s’agisse de l’ANOVA ou tout autre test statistique comme :
– l’analyse conjointe
– l’analyse factorielle
– l’analyse croisée
Grâce à notre plateforme et nos outils experts comme Stats iQ, vous testez vos hypothèses rapidement, supprimez les risques d’erreurs et obtenez des résultats clairs et facilement compréhensibles par l’ensemble de vos équipes.
Ainsi, vous disposez de données fiables pour nourrir vos études de marché et déployez des stratégies marketing viables et pertinentes.
Commencez avec notre logiciel d'enquête gratuit