Scripts R precompuestos
Acerca de los scripts R precompuestos
R es un lenguaje de programación estadístico que se utiliza ampliamente para el análisis flexible y potente. Al utilizar la codificación R en Stats iQ, puede seleccionar entre varios scripts de análisis para que el uso de R sea más fácil y eficiente.
Selección de un script para el código R
- Seleccione las variables que desea analizar. Consulte Selección de variables de dataframe para código R para obtener más información.
- Haga clic en Avanzado.
- Haga clic en Código R.
- Seleccione un script. Para obtener más información sobre las opciones de análisis, consulte las siguientes secciones.
- Haga clic en Siguiente.
- Confirme las variables que ha seleccionado. Si desea modificar una variable, haga clic en el menú desplegable y seleccione una nueva.
- Edite el nombre de sus variables, si lo desea. Para obtener más información, consulte Nombrar variables de dataframe para código R.
Consejo Q: Puede realizar cambios en las variables que ha seleccionado directamente en esta ventana. Para editar los valores recodificados, haga clic en Editar. Si desea eliminar la variable, haga clic en el icono ( – ). Si desea añadir una variable nueva, haga clic en Añadir variable en la parte inferior izquierda.
- Cuando haya terminado de editar sus variables de dataframe, haga clic en Crear tarjeta de código.
Navegar por scripts de código R precompuestos
El script se pegará en la sección de código de la tarjeta Código R. Este código contendrá consejos junto con los comandos para generar el análisis que ha seleccionado. Para ejecutar el análisis, haga clic en Ejecutar todo. Los resultados se mostrarán en el cuadro de salida de la derecha.
Puede editar sus variables de dataframe o agregar un filtro al análisis haciendo clic en las opciones de la parte superior derecha. Haga clic en el menú de tres puntos para añadir notas a su tarjeta de código, copiar el análisis o abrir la tarjeta en pantalla completa.
CORRECCIONES
Los accesos directos de teclado se pueden utilizar para navegar de forma más eficiente por la tarjeta de código R. Haga clic en Accesos directos para obtener una lista de las posibles acciones.
PAQUETES
La codificación R en Stats iQ viene preinstalada con cientos de los paquetes de R más populares que se utilizan para el análisis. Haga clic en la pestaña Paquetes en la mitad derecha de la tarjeta para ver la lista de paquetes disponibles. Para obtener más información sobre el uso de paquetes, consulte Codificación R en Stats iQ.
Confiabilidad de la escala
La fiabilidad de escala evalúa hasta qué punto los elementos de una escala de varios elementos pueden medir de forma fiable un constructo. En otras palabras, si se mide lo mismo utilizando el mismo conjunto de preguntas, ¿habrá resultados similares de manera fiable? Si es así, hay confianza en que cualquier cambio que veamos en el futuro se deba a cambios en la población encuestada o a intervenciones que se han realizado para mejorar la puntuación.
MEDIDAS DE CONFIABILIDAD DE INTERPRETACIÓN
Las medidas de fiabilidad de escala están entre 0 y 1 y son esencialmente una correlación agregada entre todos los elementos de la escala.
El alfa de Cronbach, una medida de fiabilidad ampliamente utilizada, a menudo subestima la fiabilidad debido a ciertas suposiciones. McDonald’s omega, una alternativa recomendada, evita estos defectos. Usamos McDonald’s omega por defecto, pero el alfa de Cronbach sigue siendo ampliamente aceptado.
No hay una sola manera correcta de interpretar el número resultante, pero nuestra regla general preferida para ambos omega se describe a continuación:
Menos de 0,65 | Inaceptable |
0,65 | Aceptable |
0.8 | Muy bueno |
Si su escala fiable no es aceptable, hay algunas opciones para corregir su conjunto de datos:
- Elimine cualquier elemento que esté bajando el omega o alfa.
- Es posible que haya dos construcciones distintas que se miden. Si ese es el caso, la separación de las variables en dos grupos y la ejecución de este análisis en cada uno daría lugar a puntuaciones de fiabilidad que son superiores a las del análisis inicial. Puede explorarlo revisando la matriz de correlación en la salida o utilizando el script Análisis de factor exploratorio para ver qué agrupaciones caen naturalmente de los datos.
- En última instancia, puede ser necesario modificar y ejecutar la encuesta de nuevo. Es posible que los elementos que tengan una correlación baja con los demás deban aclararse o reelaborarse, o puede que sea necesario añadir otros elementos.
Los resultados muy altos (por ejemplo, 0,95) también pueden indicar un problema con la escala, por lo general, que todavía podría tener una escala que sea muy fiable sin tener tantos elementos. En este caso, recomendamos eliminar las posiciones menos útiles de la escala y volver a ejecutar el análisis.
ESTADÍSTICAS DE INTERPRETACIÓN A NIVEL DE ARTÍCULOS
El script primero ejecuta un indicador de fiabilidad general y, a continuación, ejecuta una iteración para cada variable. El objetivo del análisis de fiabilidad por artículo es comprender qué elementos son más útiles para la construcción de la escala. Stats iQ generará una tabla que se parece a esta:
En general, McDonald’s Omega: 0.71
N | Medio | Correlación posición-total | McDonald’s Omega si se elimina | |
A1 | 2784 | 4.59 | 0.31 | 0.72 |
A2 | 2773 | 4.80 | 0.56 | 0.69 |
A3 | 2774 | 4.60 | 0,59 | 0.61 |
… | … | … | … | … |
- El objetivo general es tener un Omega de McDonald’s más alto con un menor número de artículos. Así que si un investigador estuviera creando una nueva escala, probablemente querrían eliminar A1, ya que el omega es en realidad más alto sin ella.
- El resto de los elementos que disminuirían la confiabilidad si se eliminan están a la altura del investigador para determinar. Por ejemplo, si un investigador está preocupado por la fatiga de la encuesta, podrían permitir una mayor disminución en la confiabilidad al decidir eliminar una variable.
- La Correlación Item-Total es la correlación entre ese elemento y el promedio de todos los demás. Correlación total-elemento baja sugiere que la variable no es suficientemente representativa del constructo subyacente. La regla general más común es sospechar de cualquier cosa con una Correlación Item-Total de 0.3 o inferior, especialmente si tiene muchos elementos, lo que infla artificialmente la métrica de fiabilidad.
Si opta por eliminar una posición, debe volver a ejecutar todas las demás estadísticas antes de decidir si eliminar otra posición. En Stats iQ, esto significa que solo se elimina la variable de toda la tarjeta; el resto se realizará automáticamente.
MATRIZ DE CORRELACIÓN ENTRE POSICIONES
La Matriz de correlación entre elementos muestra la correlación entre cada variable en el análisis y cada otra variable. Por ejemplo, si una variable está muy correlacionada con otra (por ejemplo, 0,9), esas preguntas pueden ser redundantes y eliminarlas solo tendrá un pequeño impacto en su fiabilidad.
La Correlación media entre posiciones es la media de los números en la matriz. Los números más altos sugieren que algunos elementos pueden ser redundantes y podrían eliminarse. Generalmente, las variables deben estar en el rango de 0,2 a 0,4.
MÁS RECURSOS
- El análisis de fiabilidad en Stats iQ es ejecutado por la función compRelSem() del paquete semTools R. En la documentación se describe una variedad de opciones avanzadas. No es necesario utilizar o comprender estas opciones para ejecutar un análisis de fiabilidad.
- La matriz de correlación es ejecutada por la función corrplot() del paquete corrplot R. Una variedad de opciones avanzadas y personalizaciones se describen en la documentación y en este recorrido.
Fiabilidad entre calificadores
La fiabilidad entre calificadores (IRR) se utiliza para evaluar el grado en que dos o más calificadores están de acuerdo en su evaluación. Por ejemplo, tres codificadores diferentes pueden evaluar un comentario de texto como si hubiera tenido un sentimiento positivo o neutral o negativo; IRR describe cuánto estuvieron de acuerdo entre sí.
MEDIDAS DE CONFIABILIDAD INTERRATER
La TIR se evalúa utilizando métricas ligeramente diferentes en función de la estructura de los datos. Por ejemplo, un análisis de la interfiabilidad de dos calificadores utilizará una métrica ligeramente diferente de la de la interconfiabilidad de 3 calificadores.
Stats iQ seleccionará automáticamente la métrica adecuada para sus datos.
RESULTADOS DE INTERPRETACIÓN
La métrica Kappa o ICC es el resultado principal, entre 0 y 1, e indica cuán bien correlacionados están los calificadores. Sugerimos los siguientes rangos para interpretar el Kappa:
0,75 a 1 | Excelente |
0,6 a 0,75 | Bien |
0,4 a 0,6 | Justo |
0,4 o inferior | Algo mal |
MÁS RECURSOS
- Este análisis de fiabilidad es ejecutado por las funciones del paquete IRR. En la documentación se describe una variedad de opciones avanzadas. No es necesario utilizar o comprender estas opciones para ejecutar este análisis.
Análisis de factores exploratorios
El análisis de factores exploratorios (EFA) es una técnica estadística que le ayuda a reducir un gran número de variables en un conjunto más pequeño y manejable de “factores” de resumen. Esto los hace significativamente más fáciles de interpretar, comunicar y ejecutar más análisis en (por ejemplo, análisis de regresión). EFA suele seguir este conjunto de pasos:
- Diagnóstico: Ejecutar e interpretar un conjunto de diagnósticos que determinan si los datos son adecuados para el análisis de factores. Las variables deben estar lo suficientemente correlacionadas entre sí para formar agrupaciones significativas, pero no tan correlacionadas que sean esencialmente redundantes.
- Elegir factores: Determinar el número de factores presentes en los datos. Los factores son las agrupaciones de variables similares juntas. Por defecto, el script R utilizará un criterio que se calcula y se ejecuta automáticamente.
- Factores de denominación: Quedará con varios factores después de ejecutar el EFA que mejor representen los temas clave en los datos. Es útil etiquetar estos factores con nombres legibles por humanos que capturen su significado.
- Medidas y métricas asociadas: El análisis de factores se ejecuta con el número de factores del paso anterior. El resultado es un conjunto de agrupaciones de variables junto con alguna descripción estadística del cálculo alícuota.
El resultado es un conjunto de factores nombrados y sus elementos de encuesta de componente. Estos factores pueden servir como marco conceptual para análisis adicionales, o pueden aplicarse de nuevo a los datos.
DIAGNÓSTICOS
El script primero ejecuta una serie de diagnósticos para garantizar que los datos son adecuados para EFA:
- Tamaño de la muestra: Generalmente, se sugiere una relación 10:1 de respuestas a los elementos. Por ejemplo, si tiene 10 preguntas, debería tener al menos 100 encuestados.
- Prueba de Esfericidad de Bartlett: Esta prueba evalúa si los elementos están lo suficientemente correlacionados como para ser agrupados de manera útil en factores. Si esto falla, es probable que haya varios elementos que no se correlacionen lo suficiente con los demás. Puede plantearse soltar elementos de su análisis que no estén correlacionados con otros o añadir más elementos relacionados a la encuesta.
- Determinante: El determinante evalúa si los elementos están demasiado correlacionados para ser agrupados útilmente en factores. Si este diagnóstico falla, es probable que haya elementos que son demasiado similares entre sí para separarse en factores. Considere editar los elementos de la encuesta para que sean más distintos.
- Medida de Kaiser-Meyer-Olkin (KMO): esta medida comprueba si los elementos de su encuesta tienen suficiente en común para agruparlos en factores significativos. Aprobar este diagnóstico significa que las respuestas de su encuesta tienen mucho en común y se pueden agrupar de forma agradable. De lo contrario, los elementos no se agrupan en categorías. Si este diagnóstico falla, es posible que desee revisar los elementos de la encuesta para capturar temas más similares y plantearse la posibilidad de eliminar elementos que no muestren una relación clara con los demás.
FACTORES DE ELECCIÓN
El punto de EFA es reducir muchas variables en un número relativamente pequeño que sean útiles para el análisis, por lo que es posible que deba ejecutar el análisis factorial varias veces con diferentes números de factores para encontrar una agrupación que le funcione. El script EFA sugerirá el número de factores utilizando sus propios valores.
El script EFA dará salida a un diagrama de pantalla, que muestra los valores propios de las variables en orden descendente. Puede examinar el gráfico para ver cuántos factores ocurren antes del “codo” en el gráfico, después de lo cual añadir más factores es menos útil.
NOMBRE DE SUS FACTORES
Después de ejecutar EFA, cada variable se asigna a un factor. Es útil dar a cada factor un nombre que te dé una abreviatura para hablar de ellos, lo que hace que tus hallazgos sean más accesibles. El objetivo aquí es simplificar sus datos complejos en algunos temas comprensibles.
Estas son algunas pautas para nombrar sus factores:
- Sea descriptivo: Trate de capturar el tema común que resume las variables del grupo.
- Manténgalo simple: Sus nombres de factores deben ser fáciles de entender y comunicar. Evite la jerga técnica o frases demasiado complejas.
- Considere a su audiencia: Los nombres de los factores deben tener sentido para las personas que usarán su análisis. Por ejemplo, “Limpieza” sería significativo tanto para los gerentes de hotel como para los huéspedes del hotel.
- Consistencia: si su encuesta o conjunto de datos abarca diferentes dominios o asuntos, asegúrese de que los nombres de sus factores sean coherentes.
MEDIDAS Y MEDIDAS ASOCIADAS; MÉTRICAS
La tabla de cargas de factores es uno de los resultados clave de EFA. La carga de factor para un par de factores variables dado es la correlación entre esa variable y el factor. Si una variable tiene una carga de factor alta para un factor determinado, significa que la pregunta está fuertemente conectada a ese factor.
La univocidad es la parte de la desviación que es única para la variable específica y no se comparte con otras variables. Los valores de univocidad van de 0 a 1 con valores más altos que indican que la variable es única y no encaja bien en ninguno de los factores.
En general, se recomienda eliminar variables si sus cargas de factores son superiores a 0,3 o si su singularidad es superior a 0,7.
UTILIZAR SUS RESULTADOS
El análisis de factores es un proceso iterativo, por lo que es posible que deba ejecutarlo varias veces con diferentes números de factores para encontrar una agrupación que funcione para usted. Para la mayoría de los investigadores, la conclusión clave es encontrar agrupaciones de factores que puedan proporcionar una nueva visión de sus datos, pero puede utilizar estos factores como nuevas variables en análisis posteriores, como regresión o análisis de clúster. Por ejemplo, podría crear una nueva variable para cada factor que tome el valor promedio de todas las variables que se agrupan en ella.
Matriz de correlación
La matriz de correlación es una tabla que muestra la correlación entre cada par de variables proporcionadas. Esta tabla utiliza la r de Pearson de forma predeterminada para medir la correlación, pero puede cambiarla por la rho de Spearman si lo desea.
Puede editar los parámetros de la función corrplot() para modificar la tabla y hacerla más legible. Para obtener más información, puede ver el recorrido R oficial y la documentación.