Plantilla de artículo
Acerca de las estadísticas
Bienvenido a Qualtrics Statistics. Esta es una descripción general de las estadísticas básicas que pueden resultarle útiles al crear y analizar proyectos en Qualtrics. Cubriremos algunos conceptos estadísticos básicos, los aplicar a la plataforma y analizaremos algunas opciones adicionales fuera de Qualtrics.
Datos cuantitativos y categóricos
Hay dos tipos de datos: cuantitativos y categóricos.
Los datos cuantitativos se evalúan en una escala numérica. Los ejemplos de datos cuantitativos incluyen la edad, la altura o los ingresos.
Los datos categóricos se evalúan en una escala nominal. Los ejemplos de datos categóricos incluyen género, estado civil u ocupación. La mayoría de los datos recopilados en una encuesta son categóricos, donde se obtiene un recuento del número de encuestados que caen en una categoría.
Medidas del centro
Hay tres medidas de centro utilizadas para datos cuantitativos: media, mediana y moda.
La media, o promedio, es la mejor medida de centro cuando los datos tienen una distribución aproximadamente normal o parecen una curva de campana. La media se obtiene sumando todas las observaciones y dividiéndola por el número total de observaciones.
La mediana, o valor medio, es una buena medida de centralidad cuando los datos parecen estar sesgados. Si alineas todas tus observaciones en orden, la mediana es el valor medio.
La moda es el valor que aparece con mayor frecuencia en sus datos. No se utiliza tan comúnmente como la media o la mediana.
Medidas de propagación
Hay algunas estadísticas útiles para medir la dispersión de sus datos: desviación estándar, varianza y rango.
Una desviación estándar es la distancia promedio de las observaciones respecto de su media. Al igual que la media, se debe utilizar una desviación estándar con datos distribuidos de forma aproximadamente normal.
La varianza es simplemente la desviación estándar al cuadrado.
El rango es la diferencia entre el valor más grande y el más pequeño.
Estadísticas en visualizaciones
Una visualización de tabla de estadísticas en Qualtrics muestra el valor mínimo, el valor máximo, la media, la varianza, la desviación estándar y el número total de respuestas.
Dado que se codifica un valor para cada opción de respuesta en cada pregunta, Qualtrics encontrará estas estadísticas independientemente de que los datos sean cuantitativos o categóricos. Depende de usted decidir si estas estadísticas tienen sentido en el contexto de su estudio.
Por ejemplo, podría preguntar a los encuestados cuál es su color favorito: rojo, amarillo, azul o verde, codificados como 1, 2, 3 y 4 respectivamente. Qualtrics te dará una media, pero no tiene sentido tener un color favorito promedio.
Si los encuestados calificaran las películas en una escala de 1 a 5 estrellas, sería útil tener una media. Medias como 2,98 estrellas o 4,32 estrellas hacen que sea más fácil comparar películas.
Qualtrics ofrece una variedad de gráficos, cuadros y tablas. Un gráfico de barras muestra la frecuencia de respuestas en cada categoría de opción de respuesta.
Un gráfico circular muestra estas frecuencias como un porcentaje del gráfico circular.
Tanto los gráficos de barras como los gráficos circulares hacen que comparar las frecuencias entre categorías sea muy fácil.
Un gráfico de líneas es un gráfico de dispersión bidimensional para observaciones ordenadas. Es una buena manera de ver las tendencias a lo largo del tiempo.
Un gráfico de calibración compara una métrica elegida (por ejemplo, promedio, suma) con una escala. Dependiendo de donde caiga la métrica, la escala cambia de color. Los gráficos de calibración son útiles para comparar rápidamente el rendimiento esperado de un valor con su rendimiento real.
Tabulaciones cruzadas
Una forma de analizar datos categóricos es a través de una tabulación cruzada, también llamada tabla de contingencia o tabla de dos vías. Una tabla cruzada registra el número de encuestados que tienen las características específicas descritas en las celdas de la tabla.
En este ejemplo, puede ver la cantidad de cada tipo de artículo que se compró semanalmente, mensualmente y anualmente (por ejemplo, se compran 11 abrigos mensualmente).
Una tabla cruzada consta de columnas y filas, o banners y stubs, respectivamente, donde cada banner y stub extrae datos de frecuencia de una pregunta. Qualtrics solo le permitirá seleccionar preguntas que sean compatibles con una tabulación cruzada (por ejemplo, las preguntas de entrada de texto abiertas no son compatibles con una tabulación cruzada). Si selecciona varios banners o stubs, puede seleccionar cuál banner o stub desea ver haciendo clic en ellos en el editor de tablas cruzadas. Si agrega un desglose de varios niveles a su tabulación cruzada, una variable aparecerá como una subcategoría de otra.
Estadística de prueba de chi-cuadrado
La estadística de prueba de chi-cuadrado prueba la relación significativa entre un stub y un banner.
Si incluye varios stubs y banners en su tabla cruzada, Qualtrics también producirá múltiples valores de chi-cuadrado, 1 para cada combinación de banner y stub.
Es beneficioso saber cómo se calcula una estadística de prueba de chi-cuadrado. Primero, debe encontrar el recuento esperado para cada celda, o el recuento que esperaría que tenga la celda según el total de filas, el total de columnas y el total de la tabla. Para encontrar un recuento esperado, tome el total de la fila por el total de la columna y divida el resultado por el total de la tabla.
Una vez que tenga el recuento esperado, realice el siguiente cálculo:
La estadística de prueba de chi-cuadrado se obtiene tomando el valor observado menos el valor esperado, elevando al cuadrado esta diferencia y dividiéndola por el valor esperado para cada celda. Luego, estos componentes individuales de la prueba de chi-cuadrado se suman y el resultado es la estadística de prueba de chi-cuadrado. Luego se utiliza el valor de chi-cuadrado para determinar si la relación entre las variables es estadísticamente significativa.
Valor P
Las estadísticas de la prueba de chi-cuadrado, junto con el nivel de confianza, se utilizan para encontrar un valor p. Un valor p determina si la asociación entre las dos variables es estadísticamente significativa. Un valor p bajo significa que la relación de tabla observada ocurriría con una probabilidad muy baja, por lo que hay una relación significativa entre las dos variables. Generalmente se considera que un valor p bajo es una cifra inferior a 0,05.
Nuestro valor p es 0,28, lo cual no es significativo. Por lo tanto, no existe relación entre la frecuencia de visita y el tipo de artículo comprado.
Análisis adicionales
Los análisis adicionales de datos cuantitativos, como correlación y regresión, se pueden realizar en Excel o en un paquete de software estadístico.
Correlación
El coeficiente de correlación, r, describe la fuerza y la dirección de una relación aproximadamente lineal entre dos variables cuantitativas. El valor de r siempre se encuentra entre -1 y 1, donde los valores más cercanos a -1 y 1 representan una correlación fuerte y los valores cercanos a cero son débiles. El signo más o menos indica la dirección positiva o negativa de la relación. Los valores de correlación entre -0,3 y 0,3 se consideran bastante bajos, mientras que los valores de correlación entre 0,7 y 1 o -0,7 y -1 se consideran altos.
Un punto clave a recordar es que correlación no es lo mismo que causalidad. El hecho de que dos variables estén altamente correlacionadas no significa que una de ellas provoque la otra.
Regresión
El análisis de regresión se puede utilizar para realizar predicciones para una variable basándose en una o más variables predictoras. Consulte las siguientes páginas para obtener más ayuda sobre regresiones: