Relacionar datos
Acerca de la relación de datos
Relacionar explora las relaciones entre variables. Al seleccionar 2 variables y, a continuación, Relacionar, Stats iQ elegirá la prueba estadística adecuada en función de la estructura de los datos, ejecutará esa prueba y traducirá los resultados en una explicación simple y clara.
Al seleccionar 3 o más variables, Stats iQ relacionará cada variable con la 1 variable que tenga la clave junto a ella y, a continuación, colocará las relaciones más sólidas en la parte superior. Puede seleccionar docenas de variables a la vez, de modo que pueda examinar muchas relaciones rápidamente.
La variable clave
La primera variable seleccionada en el panel de variables será la variable clave. La variable clave sirve para dos funciones:
- Si se seleccionan más de 2 variables (como se ha descrito anteriormente), cada variable no clave se relacionará con la 1 variable clave (por ejemplo, si selecciona diez variables, la 1 variable clave estará relacionada con cada una de las otras 9, lo que dará como resultado 9 tarjetas relacionadas separadas).
- La variable clave es la variable “salida” por defecto. Por ejemplo, si selecciona “Edad” y “Ubicación”, es posible que la “Edad” (entrada) afecte a “Ubicación” (salida), pero no tendría sentido que “Ubicación” afectara a “Edad”; en este caso, pondría la clave por “Ubicación”. (En muchos análisis, esta distinción no importa, pero las variables de entrada y salida siempre se pueden intercambiar después de crear la tarjeta.) Si desea que la variable clave sea la variable de entrada en lugar de la variable de salida, seleccione las flechas pequeñas en la parte derecha del botón Relacionar.
Variables de números y números de relación
Cuando relaciona 2 variables numéricas (incluidas las categorías recodificadas), Stats iQ normalmente ejecutará una correlación y creará un diagrama de dispersión para mostrar visualmente la relación entre las dos variables.
Si las variables tienen muchos puntos superpuestos en el diagrama de dispersión, Stats iQ mostrará un diagrama de dispersión “agrupado” donde los rectángulos más oscuros indican una mayor agrupación en clústeres de resultados. Stats iQ muestra una línea de mejor ajuste cuando los datos indican que la línea será útil (específicamente, cuando los datos no tienen valores atípicos que puedan desprenderse de la línea).
Para ver los detalles estadísticos de cualquier resultado de análisis “relacionado”, haga clic en Mostrar resultados de prueba estadística. Al relacionar 2 variables numéricas, Stats iQ calcula un valor p y (para el tamaño del efecto) una r de Pearson o una rho de Spearman. Para obtener más detalles sobre cómo Stats iQ elige la prueba estadística, visite la página Supuestos de prueba estadísticos y detalles técnicos.
Es posible que esté menos interesado en si las variables están correlacionadas y más interesadas en qué variable es más alta de media. Si las 2 variables están en escalas similares, Stats iQ proporcionará una opción en la parte superior para cambiar de Correlación a Diferencia emparejada, lo que le permitirá comparar promedios.
Variables de categorías y números de relación
Cuando relaciona una variable numérica y una variable de categoría, Stats iQ ejecuta una prueba estadística y crea una tabla que muestra el recuento, el promedio, la mediana y la distribución de cada categoría de la variable numérica.
Por ejemplo, es posible que desee determinar si los huéspedes en un hotel con niños o huéspedes sin niños están más satisfechos de media. En este caso, la variable “Niños presentes” es categórica, y “Satisfacción” es numérica.
El resultado de esta prueba estadística se puede ver haciendo clic en Mostrar resultados de prueba estadística en la tarjeta. Cuando la variable de categorías solo tiene 2
categorías, Stats iQ realiza una prueba t o una prueba t clasificada. Cuando tiene más, Stats iQ ejecuta un ANOVA o un ANOVA clasificado, así como una prueba posterior a Games-Howell. Para obtener más detalles sobre cómo Stats iQ elige la prueba estadística, visite la página Supuestos de prueba estadísticos y detalles técnicos.
Relacionar categorías y variables de categorías
Cuando relaciona una variable de categoría y una variable de categoría, Stats iQ ejecuta una prueba estadística y crea una tabla de referencias cruzadas.
Cada columna en la tabla de referencias cruzadas suma el 100%. En el siguiente ejemplo, el 69% de los encuestados en “USA” fueron “Returning” y el 31% fueron “New”. Puede seleccionar Fila % para que la suma de las filas sea 100%, Recuento para ver el recuento bruto en cada celda o % para ver el total de toda la tabla al 100%. Como alternativa, puede convertir las filas con las columnas por completo seleccionando ← en la parte superior del resultado del análisis.
En el siguiente ejemplo, dado que las columnas suman el 100%, la pregunta que estamos haciendo es: “¿Qué proporción de encuestados de EE. UU. estaban regresando invitados?” Si seleccionamos Fila % (o intercambiamos las columnas y filas), ahora nos preguntamos “¿Qué proporción de huéspedes que regresaron estaban en EE. UU.?” En este caso, cualquiera de estas preguntas podría ser útil. A veces, solo una pregunta tendrá sentido.
Las flechas verde y roja dentro de las celdas indicarán si el valor de una celda es estadísticamente más alto o más bajo de lo que esperaría si no hubiera relación entre las variables. Si se selecciona % columna, las flechas comparan el número de esa celda con los otros números de esa fila. Más flechas corresponden a un mayor grado de significación estadística. Las celdas con números altos en ellas aparecen más oscuras que otras celdas.
En el siguiente ejemplo, el 75,2% es más alto que el total de los otros números en esa fila, por lo que el Reino Unido tiene una proporción superior a la típica de visitantes que regresan.
El resultado de la prueba estadística se puede ver haciendo clic en Mostrar resultados de prueba estadística en la tarjeta. Stats iQ realiza una prueba exacta de Fisher o una prueba de chi cuadrado cuando se relacionan 2 variables categóricas. Se mostrarán hasta 3 flechas en una celda, dependiendo del valor p calculado a partir del residuo ajustado de la celda. Para obtener más detalles sobre cómo Stats iQ elige la prueba estadística, visite la página Supuestos de prueba estadísticos y detalles técnicos.
Además de la tabla de referencias cruzadas general, Stats iQ también generará una tabla de comparación por parejas, que compara los valores de pares de categorías en una fila determinada. Por ejemplo, la siguiente tabla de referencias cruzadas muestra la proporción de clientes que están devolviendo visitantes desde varias ubicaciones. La tabla de comparación por parejas muestra, por ejemplo, que el Reino Unido tiene una proporción de visitantes retornados de 6 puntos porcentuales superior a la de los Estados Unidos. Las flechas verde y roja de las celdas indican diferencias estadísticamente significativas.
Casillas de selección y variables numéricas relacionadas
Cuando vincula una variable de casillas de verificación y una variable numérica, Stats iQ ejecuta una prueba estadística y crea una tabla de resumen.
Stats iQ muestra una tabla con 2 filas para cada casilla de verificación: una para si la casilla estaba marcada y otra para si no lo estaba. Por ejemplo, si 1 de las casillas representa si un encuestado ha utilizado o no el grupo, habrá una fila para utilizar (marcado) y no utilizar (desmarcado) el grupo, junto con las puntuaciones medias de satisfacción de los encuestados que se encuentran en cualquiera de estos 2 grupos.
Esta tabla, como la mayoría de Stats iQ, se puede ordenar. Por ejemplo, es posible que desee ordenar por promedio o por si la casilla estaba seleccionada o no. Haga clic en el encabezado de la columna (por ejemplo, Promedio) para ordenar la tabla por los valores de esa columna.
Aunque la tabla mostrará información estadística como la mediana y el promedio, no se realizan pruebas estadísticas en esta situación. Para ejecutar un análisis separado que compare los promedios de los que utilizaron el pool frente a los que no lo hicieron:
Relacionar casillas de selección y variables de categorías
Cuando vincula una variable de casillas de verificación y una variable de categorías, Stats iQ ejecuta pruebas estadísticas y crea una tabla de resumen.
En función de la variable que tenga la clave, una de las 2 primeras columnas contendrá las opciones de variable de categoría y la otra contendrá las opciones de casilla de selección. La columna “%” indicará la proporción del grupo de la primera columna que seleccionó el grupo de la segunda columna.
En el siguiente ejemplo, la primera fila indica lo siguiente:
- Había 1663 encuestados que son nuevos clientes.
- De los 1663 encuestados, 359 utilizaron la piscina.
- Esto significa que el 21,6% de los 1663 encuestados utilizaron la reserva.
- Las flechas rojas de la última columna indican que es una proporción inferior a la típica.
Las flechas de la última columna se calculan de la misma manera que en la tabla de referencias cruzadas para variables categóricas, discutidas anteriormente.
Variables de números y tiempos de relación
Al relacionar una variable numérica y una variable de horas, Stats iQ creará un gráfico que muestra cómo ha variado la variable numérica a lo largo del tiempo. Para modificar el tamaño de la ubicación (de días a semanas, por ejemplo), haga clic en Tamaño de ubicación encima del gráfico.
Además de los agrupamientos de fechas, Stats iQ mostrará una línea para un valor estadístico específico a lo largo del tiempo. El valor por defecto es la media. Si selecciona una opción diferente en la parte superior del gráfico (Media, Mín. o Máx.), cambiará qué valor se representa como una línea en el gráfico. Al ajustar el deslizador debajo del gráfico, se reducirá el intervalo de fechas que se muestra.
El resultado de esta prueba estadística se puede ver haciendo clic en Mostrar resultados de prueba estadística en la tarjeta. Las pruebas estadísticas que se ejecutan con Stats iQ son las mismas que se ejecutarían si la variable de veces fuera una variable numérica. En particular, esto significa que Stats iQ ejecutará una correlación entre las variables.
Variables de categorías y tiempos relacionados
Cuando relaciona una variable de veces y una variable de categorías, Stats iQ creará un gráfico que muestra cómo han cambiado los recuentos de esas categorías a lo largo del tiempo. Para modificar el tamaño de la ubicación (de días a semanas, por ejemplo), haga clic en Tamaño de ubicación encima del gráfico.
Para este tipo de tarjeta, tendrá la opción de seleccionar el tipo de gráfico que se muestra. El tipo de gráfico se modifica cuando se selecciona una opción diferente (Barra, Línea o Área) encima del gráfico. El gráfico mostrará los datos como Porcentaje o Recuento en función de la opción seleccionada en la parte superior del gráfico. El porcentaje es especialmente útil para ver cómo ha cambiado la distribución de grupos a lo largo del tiempo. No se ejecuta ninguna prueba estadística para este tipo de tarjeta.
Pruebas estadísticas en Stats iQ
Stats iQ selecciona pruebas estadísticas basadas en los tipos de variables y la estructura de las columnas que se analizan. Como referencia, esta es una lista completa de las pruebas estadísticas no de regresión y las medidas de tamaño del efecto en Stats iQ:
- Prueba T (2 categorías vs. Números)
- ANOVA (3+ categorías vs. Números)
- Games-Howell post-pruebas ad hoc (3+ categorías vs. Números)
- La f de Cohen
- Correlación (números frente a Números)
- Correlación de Pearson
- Correlación de Spearman
- Correlación biserial puntual
- Cohen’s d
- Prueba T emparejada (Números vs. Números)
- Prueba exacta de Fisher (2 categorías frente a 2 categorías)
- Chi-cuadrado (3+ categorías vs. Categorías)
- V del cramer
- Test Z (Categorías vs. Categorías)
- Análisis de series temporales
- Diferencia en diferencias (DID, DD)
Selección de tests estadísticos
Stats iQ seleccionará la prueba estadística correcta para usted, dada su comprensión de los datos (por ejemplo, si una variable es una variable numérica o una variable de categorías). Sin embargo, puede modificar el tipo de variable para desencadenar un resultado diferente.
Por ejemplo, podría relacionar un 1/0 con una escala 1-7. Si el 1/0 se considera categórico, el resultado es un test t. Si se considera numérico, el resultado es una correlación (los resultados de esos 2 análisis serán muy similares).
Stats iQ ejecutará una relación “clasificada” si los datos numéricos no se distribuyen normalmente o tienen valores atípicos. Si prefiere ver la relación “no clasificada” (o viceversa), esa opción está disponible en los resultados de la prueba estadística. Para obtener más detalles sobre las pruebas clasificadas, visite la página Supuestos de prueba estadísticos y detalles técnicos.
Problema de comparaciones múltiples
El problema Comparaciones múltiples puede producirse si utiliza el análisis “relacionar” con una gran cantidad de variables no clave seleccionadas. En este análisis, es probable que vea que alrededor de 5 de los resultados aparecen como estadísticamente significativos a través de pura suerte, y no necesariamente una relación significativa. Esta es una consecuencia necesaria de la forma en que funciona el análisis estadístico.
En Stats iQ, si ejecuta muchos análisis a la vez y ve resultados donde el valor p es muy significativo (por ejemplo, 0,03 en lugar de 0,00004), esto es una buena indicación de que estas correlaciones no son necesariamente significativas.
Traducir estadísticas en frases
Stats iQ explica los resultados del análisis de Relacionar de una manera fácil de entender, incluso sin el conocimiento experto de las estadísticas.
Si el valor p no está por debajo del umbral de significación estadística (el valor predeterminado para esto en Stats iQ es 0.05), las oraciones explicarán que no hay una relación con significación estadística.
Si el valor p está por debajo del umbral, Stats iQ observará el tamaño del efecto. En función del tamaño del efecto, Stats iQ añadirá palabras a la frase como “débil” o “fuerte” para caracterizar la relación. Puede encontrar más información sobre cómo se interpretan el tamaño del efecto y el valor p haciendo clic en el botón de información (i) en Mostrar resultados de pruebas estadísticas.
La siguiente tabla describe cómo describiremos las relaciones variables para las pruebas t basadas en el tamaño del efecto.
Tamaño del efecto | Interpretación del tamaño del efecto | Idioma de Stats iQ |
Por debajo de 0,2 | Trivial o sin efecto | No existe una relación de significación estadística entre las variables. |
Entre 0,2 y 0,5 | Efecto pequeño | Las variables están relacionadas estadísticamente. No utilizaríamos un adjetivo extra para caracterizar su relación. |
Entre 0,5 y 0,8 | Efecto medio | Las variables están relacionadas estadísticamente. No utilizaríamos un adjetivo extra para caracterizar su relación. |
Por encima de 0,8 | Efecto grande | Las variables están “fuertemente” relacionadas. |
En función del tipo de prueba estadística utilizada, los umbrales del tamaño del efecto serán ligeramente diferentes. Sin embargo, se aplica el mismo patrón general.