Predict iQ
Acerca de Predict iQ
Cuando los clientes dejan una empresa, a menudo nos pillan desprevenidos. Si hubiéramos sabido que este cliente estaba en riesgo, entonces quizás podríamos habernos puesto en contacto con él antes de que perdieran totalmente su fe en nosotros. Si solo hubiera una manera de predecir la probabilidad de que un cliente abandone la empresa.
Predict iQ aprende de las respuestas de los encuestados y de los datos embebidos para predecir si el encuestado terminará abandonando la encuesta. Luego, cuando llegan nuevas respuestas a la encuesta, Predict iQ puede predecir la probabilidad de que esos encuestados abandonen la encuesta en el futuro. Para predecir si un cliente abandonará, Predict iQ utiliza redes neuronales (un subconjunto del cual se denomina Deep Learning) y regresión para crear modelos de candidatos. Intenta variaciones de esos modelos diferentes para cada conjunto de datos y, a continuación, selecciona el modelo que mejor se adapte a los datos.
Preparar sus datos
Antes de crear un modelo de predicción de abandono, querrá asegurarse de que los datos están listos.
Predict iQ funciona mejor cuando tiene al menos 500 encuestados que han abandonado. Sin embargo, 5.000 encuestados abandonados o más le darán los mejores resultados.
Configuración de una variable de abandono
- En la encuesta en la que desea predecir Churn, vaya al flujo de la encuesta.
- Haga clic en Añadir nuevo elemento aquí.
- Seleccione Datos embebidos.
- Le pedirá que introduzca un nombre de campo. Puede introducir el nombre de campo que desee. Aquí elegimos a Churn.
- Haga clic en Aplicar.
- Es posible que también desee repetir este mismo proceso para otros datos que le gustaría incorporar, especialmente los datos operativos que pueden ser útiles para predecir la pérdida (por ejemplo, antigüedad o número de compras).
Registro de datos
Una vez que tenga una variable de abandono, puede importar datos históricos a su encuesta, incluida una columna para Abandono donde indica con Sí o No si el cliente abandonó.
Crear un modelo de predicción de abandono
Una vez configurada la variable de abandono y que tenga suficientes datos, estará listo para abrir Predict iQ.
- Dentro de la encuesta, haga clic en Datos y análisis.
- Seleccione Predict iQ.
- Haga clic en Crear modelo de predicción de abandono.
- Seleccione la variable que ha realizado en la sección anterior. En este ejemplo, se llama Churn.
Consejo Q: Predict iQ solo predice resultados que tienen 2 opciones posibles, como Sí/No o Verdadero/Falso. No predice resultados numéricos (por ejemplo, una escala de 1-7) o resultados categóricos con más de 2 valores (por ejemplo, Sí/Tal vez/No). - Seleccione el valor que indica el cliente abandonado.
Ejemplo: Debido a que en este ejemplo nuestra variable se llama Churn, alguien con Churn igual a Yes ha abandonado. Pero digamos que en su lugar nombró a su variable “Staying with our company” (Permanecer en nuestra empresa). Entonces No indicaría que la persona no se quedaba con la empresa, y ha roto.
- Seleccione variables para excluirlas del modelo o incluirlas con el modelo. Haga clic en excluir/incluir para cambiar entre 2.
- Excluir: Por ejemplo, si tiene una variable que mide “Motivo de abandono” en sus datos históricos, es posible que desee excluirlo del análisis, ya que no estará disponible para los encuestados nuevos cuando se realice la predicción.
- Incluir: Seleccionar variables para incluir en el modelo; se ignorarán todas las demás.
- Haga clic en Crear.
Una vez completado el modelo de predicción, la página Predict iQ se sustituirá por información sobre el modelo de predicción de abandono que acaba de crear.
¿Cómo se divide el conjunto de datos para la formación de modelo?
En el proceso de entrenamiento de su modelo, su conjunto de datos se divide en datos de entrenamiento, validación y prueba. El 80% de sus datos se usa para entrenamiento. El 10% de sus datos se usa para validación y el 10% de sus datos se usa para pruebas.
Información de variable
La sección de resultados y configuración del modelo de predicción proporciona el nombre de su variable de datos embebidos en Churn y el valor que indica que es probable que un cliente abandone. En esta sección también se enumeran las variables excluidas.
Impulsores de predicción
Los controladores de predicción son las variables que se han analizado para crear su modelo de predicción, ordenadas por su importancia en la predicción de abandono. Esto incluye cualquier variable que no se haya excluido del análisis. En el siguiente ejemplo, las puntuaciones de NPS y las valoraciones de fiabilidad impulsan la predicción de abandono.
Haga clic en Mostrar otros controladores para expandir la lista.
Consejo Q: Para crear este gráfico, cada variable se ejecuta en una regresión logística simple frente a la variable de abandono. El valor r-cuadrado más alto se fija en 1 y los valores de las otras variables se escalan según corresponda. Por ejemplo, si el R-cuadrado más alto es 0,5, la longitud de la barra de cada variable será r-cuadrado * 2, donde la longitud de la barra es 1.
Por lo tanto, el gráfico es un indicador de la fuerza relativa de las variables en la predicción de rotación, y no es de naturaleza multivariante. Una valoración del impacto de cada variable en la salida de un modelo basado en algoritmos de aprendizaje profundo es un área de investigación académica activa, sin mejores prácticas aceptadas en este punto.
Métricas de predicción
Prediga que iQ “se mantiene” (reserva) el 10% de los datos antes de crear el modelo. Una vez creado el modelo, crea predicciones para ese 10%. Luego compara sus predicciones con lo que realmente ocurrió, si esos clientes realmente abandonaron. Estos resultados se utilizan para impulsar las métricas de precisión siguientes. Tenga en cuenta que, aunque se trata de un método de mejores prácticas efectivo para estimar la precisión del modelo, no es una garantía de la precisión futura del modelo.
- Precisión: La proporción de predicciones del modelo que serán precisas.
- Precisión: la proporción de clientes pronosticó la rotación de clientes que realmente abandonarán.
- Retirada: La proporción de los que realmente abandonaron que el modelo predijo antes de tiempo lo haría.
Predict iQ calculará el valor umbral óptimo maximizando la puntuación F1. Su modelo se establecerá en el umbral óptimo de forma predeterminada, pero puede ajustarlo; consulte Configurar umbral a continuación.
Haga clic en Salida avanzada debajo de la tabla Métricas predictivas para revelar las tablas Matriz de confusión y Métricas de predicción avanzada.
Precisión y retirada
La precisión y la retirada son las métricas de predicción más importantes. Tienen una relación inversa y, por lo tanto, a menudo debe pensar en la compensación entre saber exactamente qué clientes abandonarán y saber que ha identificado a todos o a la mayoría de los clientes que es probable que abandonen.
Configurar umbral
Haga clic en Configurar umbral para establecer un umbral para cuando un cliente debe ser etiquetado como probable de abandono. Este porcentaje de umbral es la probabilidad individual de abandono.
Haga clic y arrastre el punto en el gráfico para ajustar el umbral o escriba un % de umbral y observe cómo cambia el gráfico. Cuando haya terminado, haga clic en Establecer umbral para guardar los cambios. También puede cancelar los cambios haciendo clic en Cancelar en la parte inferior derecha o en la X en la parte superior derecha.
Al ajustar el umbral se ajusta la precisión a lo largo del eje y y la recuperación a lo largo del eje X. Estas métricas tienen una relación inversa. Cuanto más precisas sean sus mediciones, menor será la retirada, y viceversa.
Matriz de confusión
Cuando Predict iQ crea un modelo de predicción, “retiene” (o reserva) el 10% de los datos. Para verificar la precisión del modelo generado, los datos del modelo nuevo se ejecutan con el 10% de retención. Esto sirve como una comparación de lo que se predice y lo que “realmente sucedió”.
“Sí” en este gráfico se sustituirá por lo que haya indicado en el paso 5 de la configuración.
- Real No Sí / Previsto No Sí: el porcentaje de clientes que el modelo predijo no abandonaría, que en realidad no abandonaron.
- Real Sí / Previsto No Sí: El porcentaje de clientes que el modelo predijo no se abandonaría, que a la inversa se abandonaron.
- Real No Sí / Previsto Sí: El porcentaje de clientes que el modelo predijo abandonaría, que a la inversa no se abandonaron.
- Real Sí / Previsto Sí: el porcentaje de clientes que el modelo predijo abandonaría, que realmente abandonaron.
Los números son verdes para indicar que desea que esos números sean lo más altos posible, ya que reflejan suposiciones correctas. Los números son rojos para indicar que desea que estos números sean bajos, ya que reflejan conjeturas incorrectas.
Puede ajustar la matriz para mostrar Porcentaje o Recuento. Este recuento incluye el 10% de sus datos retenidos, no el conjunto de datos completo.
Métricas de predicción avanzadas
Esta tabla muestra métricas de predicción adicionales.
- Precisión: la proporción de clientes pronosticó la rotación de clientes que realmente abandonarán.
- Retirada: La proporción de los que realmente abandonaron que el modelo predijo antes de tiempo lo haría.
- Precisión: La proporción de predicciones del modelo que serán precisas.
- Puntuación F1: La puntuación F1 se utiliza para seleccionar un umbral que equilibre la precisión con la revocación. Un puntaje F1 más alto es generalmente mejor, aunque el lugar correcto para establecer el umbral debería estar determinado por sus objetivos de negocio.
- Área bajo Curva de precisión-revocación: La curva de precisión-revocación es la curva que se observa en el gráfico al hacer clic en Configurar umbral. El área total bajo la curva es una medida de la precisión global del modelo (independientemente de dónde fije el umbral). Un área bajo la curva del 50% es igual a la probabilidad aleatoria; el 100% es perfectamente preciso.
Hacer predicciones
Predicción por lotes (CSV)
Además de analizar las respuestas que ha recopilado en su encuesta, también puede cargar un archivo de datos específico que desea que Predict iQ evalúe.
Para obtener una plantilla del archivo, haga clic en Plantilla de predicción de lotes para este modelo.
Cuando haya terminado de editar el archivo en Excel y esté listo para volver a cargarlo, haga clic en Elegir archivo para seleccionar el archivo. A continuación, haga clic en Realizar predicciones para iniciar el análisis.
Predicciones de flujo
Actualización de predicciones de flujo a medida que los datos ingresan a la encuesta. En esta sección, puede decidir cuándo tienen lugar estas actualizaciones de predicción.
Cree una predicción cada vez que un encuestado nuevo complete esta encuesta: esta opción activa las predicciones en tiempo real. Tendrá 2 columnas más en sus datos: Probabilidad de abandono, la probabilidad de abandono en un formato decimal y Predicción de abandono, una variable Sí/No. La predicción de abandono se basa en el umbral configurado.
Gestionar modelos
A la izquierda de la página, verá un menú en el que puede desplazarse y seleccionar los modelos de predicción que ha creado en el pasado.
- Buscar por nombre de modelo.
- Ordene su lista de modelos. Haga clic en el menú desplegable para seleccionar lo que desea clasificar y utilice la flecha situada junto a la lista desplegable para ajustar si está ordenando por orden descendente o ascendente.
- Seleccione el modelo que desea visualizar.
- Cree un nuevo modelo de predicción.
- Una vez seleccionado un modelo de la izquierda, puede hacer clic en su nombre en la parte superior de la página para editar el nombre.
Datos de rotación
En la sección Datos de la pestaña Datos y análisis, puede exportar sus datos como una hoja de cálculo conveniente. Después de cargar su modelo de predicción, tendrá columnas adicionales para los datos de abandono en esta página.
- Probabilidad de abandono: La probabilidad de abandonar en formato decimal. Aparece cuando la predicción de flujo se ha activado y se basa en el conjunto de umbrales. Si no ve la columna Probabilidad de abandono, también puede buscar una columna de datos llamada “[selected churn field]_PROBABILITY_PREDICT_IQ”.
- Predicción de abandono: una variable Sí/No que confirma o deniega la rotación según el umbral establecido. Aparece cuando se ha activado la predicción de flujo. Si no ve la columna Predicción de abandono, también puede buscar una columna de datos llamada “[selected churn field]_CLASS_PREDICT_IQ”.
Los nombres de columna también incluirán la fecha en la que el modelo se formó en formato MMDDAAAA. Por ejemplo, 14 de enero de 2022 se representaría en el nombre de columna como 01142022.
Tenga en cuenta que las probabilidades y predicciones de abandono solo se aplican a los nuevos resultados de encuestas. Las respuestas existentes anteriormente no tendrán probabilidades de abandono y predicciones añadidas.
Limpieza de datos automática
Al entrenar el modelo, Predict iQ ignorará automáticamente determinados tipos de variables que no serán útiles para las predicciones, al tiempo que transformará automáticamente otras variables.
Variables de cardinalidad alta
Si una variable tiene más de 50 valores únicos o más del 20% de los valores registrados son únicos, se ignorará durante la formación del modelo. Las variables con demasiados valores únicos no son buenas columnas de características para las predicciones.
Valores faltantes para columnas numéricas
Para las variables numéricas que se incluyen en el modelo, los valores que faltan siempre se imputan como 0 (cero).
Codificación única de productos categorizados
Las variables categóricas serán codificadas de un solo modo si la variable no está recodificada o la variable no tiene una relación ordinal para sus categorías.
Consejo Q: Predict iQ transfiere la misma configuración de variables utilizada en Stats iQ.
Variables invariantes
Cualquier variable que no tenga variación en sus valores registrados se ignorará para la formación de modelo. Esto significa que si tiene una variable que solo tiene un valor único, no formará parte del modelo. Las variables que son útiles para la predicción encontrarán un buen equilibrio entre tener muy pocos valores únicos y tener demasiados valores únicos. Consulte “Variables de cardinalidad alta” más arriba.
If any invariant variables are excluded during data cleaning, then they will be listed in the Prediction model results and configuration section.
Proyectos en los que puede utilizar Predict iQ
Predict iQ no está incluido en todas las licencias. Sin embargo, si tiene esta función, puede tener acceso en algunos tipos diferentes de proyectos:
- Proyectos de encuesta
- Proyectos de datos importados
- Soluciones XM
- Investigación de la experiencia de empleado ad hoc
Predict iQ también puede aparecer en proyectos de Engagement y Lifecycle, pero según la naturaleza de los datos que suelen recopilar estos tipos de proyectos, el conjunto de datos no necesariamente sería el mejor para Predict iQ.
Aunque Predict iQ aparece en Conjoint y MaxDiff, no recomendamos usarlos juntos. El contenido específico de Conjoint y MaxDiff no es compatible con Predict iQ, por lo que solo puede analizar datos demográficos.
No se admiten otros tipos de proyecto.