Ir para o conteúdo principal
Loading...
Skip to article
  • Qualtrics Platform
    Qualtrics Platform
  • Customer Journey Optimizer
    Customer Journey Optimizer
  • XM Discover
    XM Discover
  • Qualtrics Social Connect
    Qualtrics Social Connect

A matriz de confusão e a negociação de chamada de retorno de precisão


Was this helpful?


This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

The feedback you submit here is used only to help improve this page.

That’s great! Thank you for your feedback!

Thank you for your feedback!


A matriz de confusão e o gráfico de recolha de precisões ajudam você a avaliar a precisão do seu modelo.

Matriz de confusão

Digamos que você esteja pensando em dar um cubo de açúcar extra para clientes propensos a retornar. Mas é claro que você quer evitar dar cubos de açúcar desnecessariamente, então você só lhes dá aos clientes que o modelo diz ter pelo menos 30% de probabilidade de retornar.

Se você teve novos clientes andando…

ID do cliente Idade Gênero
324 54 Feminino
325 23 Feminino
326 62 Masculino
327 15 Feminino

 

…você poderia usar nosso modelo de regressão para prever a probabilidade de retornar…

ID do cliente Idade Gênero Probabilidade de retorno estimada por modelo
324 54 Feminino 34%
325 23 Feminino 24%
326 62 Masculino 65%
327 15 Feminino 7%

 

…e decida classificar clientes com pelo menos 30% de probabilidade como “Irá retornar” e dar-lhes cubos de açúcar:

ID do cliente Idade Gênero Probabilidade de retorno estimada por modelo Previsão do modelo
(30% de corte)
324 54 Feminino 34% Vai retornar
325 23 Feminino 24% Não vai
326 62 Masculino 65% Vai retornar
327 15 Feminino 7% Não vai

 

Para entender melhor a precisão do nosso modelo, no entanto, você pode aplicar o modelo aos pontos de dados que já tem, onde você já sabe se esse cliente finalmente retornou…

ID do cliente Idade Gênero Probabilidade de retorno estimada por modelo Previsão do modelo
(30% de corte)
Devolvido
1 21 Masculino 44% Vai retornar Devolvido
2 34 Feminino 4% Não vai Devolvido
3 13 Feminino 65% Vai retornar Não fiz
4 25 Feminino 27% Não vai Não fiz

 

…e avaliar a precisão dos dados…

ID do cliente Idade Gênero Probabilidade de retorno estimada por modelo Previsão do modelo
(30% de corte)
Devolvido Precisão da previsão
1 21 Masculino 44% Vai retornar Devolvido Correto
2 34 Feminino 4% Não vai Devolvido Incorreto
3 13 Feminino 65% Vai retornar Não fiz Incorreto
4 25 Feminino 27% Não vai Não fiz Correto

 

…e depois divida-os nas seguintes categorias:

  • Verdadeiro Positivo: Classificado pelo modelo como “Vai retornar” e tinha de fato “Retornado” na realidade.
  • Falso Positivo: Classificado pelo modelo como “Vai retornar”, mas na verdade “Não retornou” na realidade.
  • Verdadeiro negativo: classificado pelo modelo como “Não retornará” e, de fato, “Não retornou” na realidade.
  • Falso negativo: classificado pelo modelo como “Não retornaria”, mas tinha realmente “Retornado” na realidade.
ID do cliente Idade Gênero Probabilidade de retorno estimada por modelo Previsão do modelo
(30% de corte)
Devolvido Precisão da previsão Tipo de precisão
1 21 Masculino .44 Vai retornar Devolvido Correto Verdadeiro positivo
2 34 Feminino .04 Não vai Devolvido Incorreto Falso negativo
3 13 Feminino .65 Vai retornar Não fiz Incorreto Falso positivo
4 25 Feminino 0,27 Não vai Não fiz Correto Verdadeiro negativo

 

Por fim, você pode resumir todo este trabalho em precisão e recall.

Precisão:

  • Dos classificados como “Vai retornar”, que proporção realmente fez?
  • Verdadeiro positivo / (Verdadeiro positivo + Falso positivo)

Recall:

  • Recolhimento: Dos que de fato “Retornaram”, que proporção foi classificada dessa forma?
  • Verdadeiro positivo / (Verdadeiro positivo + Falso negativo)

Melhores modelos têm valores mais altos para precisão e revocação.

  • Você pode imaginar um modelo com 94% de precisão (quase todos identificados como “Vai retornar” de fato) e 97% de recall (quase todos os que “Devolveram” foram identificados como tal).
  • Um modelo mais fraco pode ter 95% de precisão, mas 50% de revocação (quando identifica alguém como “Vai retornar”, em grande parte correto, mas rotula-se erroneamente como “Não retornará” metade daqueles que de fato fizeram mais tarde “Retorno”).
  • Ou talvez o modelo tenha 60% de precisão e 60% de revocação.

Esses números devem dar a você uma boa noção da precisão do seu modelo, mesmo que você nunca queira fazer previsões.

Precisão vs. Curva de recall

Dentro de qualquer modelo, você também pode decidir enfatizar a precisão ou a revogação. Talvez você tenha muito pouco uso de cubos de açúcar e só queira entregá-los às pessoas que você está muito confiante para retornar, então você decide entregá-los apenas a clientes com 60% de probabilidade de retornar (em vez de 30%).

Nossa precisão vai subir porque você só vai entregar cubos de açúcar quando estiver realmente confiante alguém “Vai voltar”. Nossa lembrança vai diminuir porque haverá muita gente que, em última análise, “Retornar” para quem você não estava confiante o suficiente para dar um cubo de açúcar.

Precisão:   62%   —>   80%
Recall:        60%   —>   30%

Ou, se você está se sentindo rico em cubos de açúcar, você pode entregá-los a qualquer pessoa com pelo menos 10% de chance de ser um retornador.

Precisão:   62%   —>   40%
Recall:        60%   —>   90%

Você pode rastrear esta negociação entre precisão e recall com este gráfico:

Gráfico de tradeoff entre Revogação e Precisão

Pode ser útil escolher um ponto no gráfico que representa uma mistura agradável de precisão e revocação e, em seguida, ter uma noção da precisão do modelo nesse ponto.

Perguntas frequentes

Muitas das páginas neste site foram traduzidas do inglês original usando tradução automática. Embora na Qualtrics tenhamos feito nossa diligência prévia para obter as melhores traduções automáticas possíveis, a tradução automática nunca é perfeita. O texto original em inglês é considerado a versão oficial, e quaisquer discrepâncias entre o inglês original e as traduções automáticas não são juridicamente vinculativas.