Saltar al contenido principal
Loading...
Skip to article
  • Qualtrics Platform
    Qualtrics Platform
  • Customer Journey Optimizer
    Customer Journey Optimizer
  • XM Discover
    XM Discover
  • Qualtrics Social Connect
    Qualtrics Social Connect

La matriz de confusión y la compensación precisión-retirada


Was this helpful?


This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

The feedback you submit here is used only to help improve this page.

That’s great! Thank you for your feedback!

Thank you for your feedback!


La matriz de confusión y el gráfico de retirada de precisión le ayudan a evaluar la precisión de su modelo.

Matriz de confusión

Supongamos que está pensando en darle un cubo de azúcar extra a los clientes que es probable que vuelvan. Pero por supuesto que desea evitar regalar cubos de azúcar innecesariamente, por lo que solo les da a los clientes que el modelo dice que es probable que al menos un 30% regrese.

Si tuviera clientes nuevos, camina por aquí…

ID de cliente Edad Género
324 54 Femenino
325 23 Femenino
326 62 Masculino
327 15 Femenino

 

…podría utilizar nuestro modelo de regresión para predecir la probabilidad de que devuelvan…

ID de cliente Edad Género Probabilidad de retorno estimada por modelo
324 54 Femenino 34%
325 23 Femenino 24%
326 62 Masculino 65%
327 15 Femenino 7%

 

…y decida clasificar a los clientes con al menos un 30% de probabilidad como “Devolverá” y darles cubos de azúcar:

ID de cliente Edad Género Probabilidad de retorno estimada por modelo Predicción de modelo
(30% de corte)
324 54 Femenino 34% Volverá
325 23 Femenino 24% No desea
326 62 Masculino 65% Volverá
327 15 Femenino 7% No desea

 

Para comprender mejor la precisión de nuestro modelo, sin embargo, puede aplicar el modelo a los puntos de datos que ya tiene, donde ya sabe si ese cliente finalmente regresó…

ID de cliente Edad Género Probabilidad de retorno estimada por modelo Predicción de modelo
(30% de corte)
Devuelto
1 21 Masculino 44% Volverá Devuelto
2 34 Femenino 4% No desea Devuelto
3 13 Femenino 65% Volverá No lo hice
4 25 Femenino 27% No desea No lo hice

 

…y evalúe la precisión de los datos…

ID de cliente Edad Género Probabilidad de retorno estimada por modelo Predicción de modelo
(30% de corte)
Devuelto Precisión de predicción
1 21 Masculino 44% Volverá Devuelto Correcto
2 34 Femenino 4% No desea Devuelto Incorrecto
3 13 Femenino 65% Volverá No lo hice Incorrecto
4 25 Femenino 27% No desea No lo hice Correcto

 

…y, a continuación, divídalo en las siguientes categorías:

  • Verdadero positivo: Clasificado por el modelo como “Volverá” y de hecho había “Regresado” en realidad.
  • Falso Positivo: Clasificado por el modelo como “Volverá” pero en realidad “No regresó” en realidad.
  • Verdadero Negativo: Clasificado por el modelo como “Won’t return” y de hecho “Didn’t return” en realidad.
  • Falso Negativo: Clasificado por el modelo como “Won’t return” pero en realidad había “Regresado” en realidad.
ID de cliente Edad Género Probabilidad de retorno estimada por modelo Predicción de modelo
(30% de corte)
Devuelto Precisión de predicción Tipo de precisión
1 21 Masculino .44 Volverá Devuelto Correcto Positivo verdadero
2 34 Femenino 0,04 No desea Devuelto Incorrecto Falso negativo
3 13 Femenino 65 Volverá No lo hice Incorrecto Falso positivo
4 25 Femenino .27 No desea No lo hice Correcto Negativo verdadero

 

Por último, puede resumir todo este trabajo en precisión y recuperación.

Precisión:

  • De los clasificados como “Volverá”, ¿qué proporción hizo realmente?
  • Positivo verdadero / (positivo verdadero + falso positivo)

Recuperación:

  • Retiro: De esos que de hecho “Regresó”, ¿qué proporción se clasificó de esa manera?
  • Positivo verdadero / (positivo verdadero + falso negativo)

Los mejores modelos tienen valores más altos para precisión y retirada.

  • Se puede imaginar un modelo con 94% de precisión (casi todos identificados como “Volverá” de hecho) y el 97% recuerda (casi todos los que “Regresaron” fueron identificados como tales).
  • Un modelo más débil puede tener una precisión del 95% pero el 50% recuerda (cuando identifica a alguien como “Volverá”, es en gran medida correcto, pero mal etiqueta como “No volverás” a la mitad de los que de hecho hicieron “Regresar”).
  • O quizás el modelo tiene un 60% de precisión y un 60% de retirada.

Estos números deberían darle una buena idea de la precisión de su modelo, incluso si en realidad nunca desea realizar predicciones.

Precisión frente a Curva de revocación

Dentro de cualquier modelo, también puede decidir enfatizar la precisión o la retirada. Tal vez sea muy corto en los cubos de azúcar y solo quiera entregárselos a las personas que esté muy seguro de que regresarán, por lo que decide darles solo a clientes que tienen un 60% de probabilidades de regresar (en lugar del 30%).

Nuestra precisión subirá porque solo repartirá los cubos de azúcar cuando esté seguro de que alguien “volverá”. Nuestro recuerdo bajará porque habrá muchas personas que, en última instancia, “devuelven” a quienes usted no tenía la confianza suficiente como para darle un cubo de azúcar.

Precisión:   62%   —>   80%
Recall:        60%   —>   30%

O, si te sientes rico en cubos de azúcar, podrías dárselos a cualquier persona con al menos un 10% de posibilidades de volver.

Precisión:   62%   —>   40%
Recuperación:        60%   —>   90%

Puede rastrear este compromiso entre precisión y retirada con este gráfico:

Gráfico de intercambio entre revocación y precisión

Puede ser útil seleccionar un punto en el gráfico que represente una buena mezcla de precisión y retirada, y luego tener una idea de cuán preciso es el modelo en ese punto.

Preguntas frecuentes

Muchas de las páginas de este sitio han sido traducidas del inglés original utilizando la traducción automática. Aunque en Qualtrics hemos realizado nuestra diligencia debida para obtener las mejores traducciones automáticas posibles, la traducción automática nunca es perfecta. El texto original en inglés se considera la versión oficial, y cualquier discrepancia entre el inglés original y las traducciones automáticas no son legalmente vinculantes.