Comprensión de las estadísticas
Acerca de las estadísticas
Bienvenido a Qualtrics Statistics. Este es un resumen de las estadísticas básicas que puede resultarle útil a la hora de crear y analizar proyectos en Qualtrics. Trataremos algunos conceptos estadísticos básicos, los aplicaremos a la plataforma y analizaremos otras opciones fuera de Qualtrics.
Datos cuantitativos y categóricos
Hay 2 tipos de datos: cuantitativos y categóricos.
Los datos cuantitativos se evalúan en una escala numérica. Algunos ejemplos de datos cuantitativos son la edad, la altura o los ingresos.
Los datos categóricos se evalúan en una escala nominal. Ejemplos de datos categóricos incluyen género, estado civil u ocupación. La mayoría de los datos recopilados en una encuesta son categóricos, donde se obtiene un recuento del número de encuestados que caen en una categoría.
Medidas de centro
Hay 3 medidas de centro utilizadas para los datos cuantitativos: media, mediana y modo.
La media, o promedio, es la mejor medida de centro cuando los datos se distribuyen aproximadamente de forma normal o parecen una curva de campana. La media se encuentra sumando todas las observaciones y dividiendo por el número total de observaciones.
La mediana, o valor medio, es una buena medida del centro cuando los datos parecen estar sesgados. Si alinea toda su observación en orden, la mediana es el valor medio.
El modo es el valor que aparece con más frecuencia en los datos. No se utiliza tan comúnmente como la media ni la mediana.
Medidas de diferencial
Hay algunas estadísticas útiles para medir la propagación de sus datos: desviación estándar, desviación y rango.
Una desviación estándar es la distancia media de las observaciones desde su media. Al igual que la media, se debe utilizar una desviación estándar con datos distribuidos aproximadamente de forma normal.
La varianza es simplemente la desviación estándar al cuadrado.
El rango es la diferencia entre el valor más grande y el menor.
Estadísticas en visualizaciones
Una visualización de Tabla de estadísticas en Qualtrics muestra el valor mínimo, el valor máximo, la media, la desviación, la desviación estándar y el número total de respuestas.
Dado que se codifica un valor para cada opción de respuesta de cada pregunta, Qualtrics encontrará estas estadísticas tanto si los datos son cuantitativos como categóricos. Depende de ti decidir si estas estadísticas tienen sentido en el contexto de tu estudio.
Por ejemplo, puede preguntar a los encuestados cuál es su color favorito: rojo, amarillo, azul o verde, codificado como 1, 2, 3 y 4 respectivamente. Qualtrics le dará una media, pero no tiene sentido tener un color favorito promedio.
Si sus encuestados califican películas en una escala de 1 a 5 estrellas, una media sería útil. Significa como 2,98 estrellas o 4,32 estrellas hacen que las películas sean fáciles de comparar.
Qualtrics ofrece una variedad de diagramas, gráficos y tablas. Un gráfico de barras muestra la frecuencia de las respuestas en cada categoría de opción de respuesta.
Un gráfico circular muestra estas frecuencias como porcentaje del gráfico circular.
Tanto los gráficos de barras como los gráficos circulares hacen que comparar las frecuencias entre categorías sea muy fácil.
Un gráfico de líneas es un diagrama de dispersión bidimensional para observaciones ordenadas. Es una buena manera de ver las tendencias a lo largo del tiempo.
Un gráfico de indicadores compara una métrica seleccionada (por ejemplo, promedio, suma) con una escala. En función de dónde caiga la métrica, la escala cambia de color. Los gráficos de indicadores son útiles para comparar rápidamente el rendimiento esperado de un valor con su rendimiento real.
Tabulaciones cruzadas
1 forma de analizar datos categóricos es a través de una tabulación cruzada, también llamada tabla de contingencia o tabla de 2 vías. Una pestaña cruzada registra el número de encuestados que tienen las características específicas descritas en las celdas de la tabla.
En este ejemplo, puede ver el número de cada tipo de posición que se ha comprado semanal, mensual y anualmente (por ejemplo, se compran 11 abrigos mensualmente).
Una tabla de referencias cruzadas consta de columnas y filas, o banners y stubs, respectivamente, donde cada banner y stub extrae datos de frecuencia de una pregunta. Qualtrics solo le permitirá seleccionar preguntas que sean compatibles con una tabulación cruzada (por ejemplo, las preguntas con entrada de texto abierta no son compatibles con una tabulación cruzada). Si selecciona varios banners o stubs, puede seleccionar qué banner o stub desea ver haciendo clic en ellos en el editor de pestañas cruzadas. Si añade un desglose de varios niveles a su tabla de referencias cruzadas, aparecerá 1 variable como subcategoría de otra.
Estadística de test de Chi cuadrado
Las pruebas estadísticas de prueba de chi-cuadrado para una relación significativa entre un stub y un banner.
Si incluye varias stubs y banners en su tabla de referencias cruzadas, Qualtrics también producirá varios valores de chi cuadrado, 1 para cada combinación de banner y stub.
Es beneficioso saber cómo se calcula una estadística de prueba de chi-cuadrado. Primero, debe encontrar el recuento esperado para cada celda, o el recuento que esperaría que tuviera la celda según el total de filas, el total de columnas y el total de tablas. Para encontrar un recuento esperado, tome el total de la fila veces el total de la columna y divida el resultado por el total de la tabla.
Una vez que tenga el recuento previsto, realice el siguiente cálculo:
La estadística de prueba de chi-cuadrado se encuentra tomando el valor observado menos el valor esperado, cuadrando esta diferencia y dividiéndola por el valor esperado para cada celda. Estos componentes de prueba de chi-cuadrado individuales se suman y el resultado es la estadística de prueba chi-cuadrado. El valor de chi-cuadrado se utiliza para determinar si la relación entre sus variables es estadísticamente significativa.
Valor de p
Las estadísticas de prueba de chi-cuadrado, junto con el nivel de confianza, se utilizan para encontrar un valor p. Un valor p determina si la asociación entre las dos variables tiene importancia estadística. Un valor p bajo significa que la relación de tabla observada ocurriría con una probabilidad muy baja, por lo que existe una relación significativa entre las 2 variables. Por lo general, se considera que un valor p bajo es una cifra inferior a 0,05.
Nuestro valor p es 0,28, lo cual no es significativo. Por lo tanto, no hay relación entre la frecuencia de visita y el tipo de artículo comprado.
Análisis adicionales
Un análisis adicional de los datos cuantitativos, como la correlación y la regresión, se puede llevar a Excel o a un paquete de software estadístico.
Correlación
El coeficiente de correlación, r, describe la fuerza y la dirección de una relación aproximadamente lineal entre 2 variables cuantitativas. El valor de r siempre se encuentra dentro de -1 y 1, donde los valores más cercanos a -1 y 1 representan una correlación fuerte y los valores cercanos a cero son débiles. El signo más o menos indica la dirección positiva o negativa de la relación. Los valores de correlación entre -.3 y .3 se consideran bastante bajos, mientras que los valores de correlación entre 0,7 y 1 o -.7 y -1 se consideran altos.
Un punto clave para recordar es que la correlación no es lo mismo que la causalidad. El hecho de que 2 variables estén muy correlacionadas no significa que 1 de estas variables haga que ocurra el otro 1.
Regresión
El análisis de regresión se puede utilizar para realizar predicciones para 1 variable basada en 1 o más variables de predictor. Consulte las siguientes páginas para obtener más ayuda sobre las regresiones: