Predict iQ
Sobre o Predict iQ
Quando os clientes saem de uma empresa, muitas vezes somos pegos desprevenidos. Se só soubéssemos que esse cliente estava em risco, talvez poderíamos ter contatado eles antes de perderem totalmente sua fé em nós. Se houver apenas uma maneira de prever a probabilidade de um cliente desistir (deixar a empresa).
O Predict iQ aprende com as respostas da pesquisa e os dados integrados dos entrevistados para prever se ele acabará por desistir. Assim, quando novas respostas da pesquisa chegarem, o Predict iQ poderá prever a probabilidade desses entrevistados desistirem no futuro. Para prever se um cliente vai desistir, o Predict iQ usa redes neurais (um subconjunto das quais são chamadas de Deep Learning) e regressão para criar modelos candidatos. Ele tenta variações desses diferentes modelos para cada conjunto de dados e, em seguida, escolhe o modelo que melhor se ajusta aos dados.
Preparação de dados
Antes de criar um modelo de previsão de desistência, certifique-se de que seus dados estejam prontos.
Preveja que o iQ funcione melhor quando você tem pelo menos 500 entrevistados que desistiram. No entanto, 5.000 entrevistados perdidos ou mais obterão os melhores resultados.
Configuração de uma variável de desistência
- Na pesquisa em que você deseja prever a rotatividade, vá para o fluxo de Pesquisa.
- Clique em Adicionar um novo elemento aqui.
- Selecione Dados integrados.
- Será solicitado que você insira um nome de campo. Você pode inserir o nome do campo que desejar. Aqui, escolhemos a simples desistência.
- Clique em Aplicar.
- Você também pode repetir esse mesmo processo para outros dados que gostaria de trazer, especialmente dados operacionais que possam ser úteis na previsão de desistência (por exemplo, Prazo do contrato ou Número de compras).
Dados de registro
Depois de ter uma variável de desistência, você pode importar dados históricos para sua pesquisa, incluindo uma coluna para Desistência, onde você indica com Sim ou Não se o cliente desistiu.
Criação de um modelo de previsão de desistência
Assim que sua variável de desistência estiver configurada e você tiver dados suficientes, estará pronto para abrir o Predict iQ.
- Dentro de sua pesquisa, clique em Dados & Análise.
- Selecione Prever iQ.
- Clique em Criar modelo de previsão de desistência.
- Selecione a variável que você criou na seção anterior. Neste exemplo, se chama Desistência.
Qdica: O Predict iQ prevê apenas os resultados que têm duas opções possíveis, como Sim/Não ou Verdadeiro/Falso. Ele não prevê resultados numéricos (por exemplo, uma escala 1-7) ou resultados categóricos com mais de 2 valores (por exemplo, Sim/Talvez/Não). - Selecione o valor que indica a perda do cliente.
Exemplo: como neste exemplo nossa variável é denominada Desistência, alguém com Desistência igual a Sim desistiu. Mas digamos que você nomeou sua variável Permanecendo em nossa empresa. Então Não indicaria que a pessoa não estava hospedada na empresa, e desistiu.
- Selecione variáveis a serem excluídas do modelo ou incluídas no modelo. Clique em excluir/incluir para alternar entre os 2.
- Excluir: por exemplo, se você tiver uma variável medindo “Motivo da desistência” em seus dados históricos, convém excluí-la da análise, uma vez que ela não estará disponível para novos entrevistados quando a previsão estiver sendo feita.
- Incluir: selecione as variáveis a serem incluídas no modelo; todas as outras serão ignoradas.
- Clique em Criar.
Quando o modelo de previsão estiver concluído, a página Predict iQ será substituída por informações sobre o modelo de previsão de desistência que você acabou de criar.
Como é a divisão do seu conjunto de dados para treinamento do modelo?
No processo de treinamento do seu modelo, seu conjunto de dados é dividido em dados de treinamento, validação e teste. 80% de seus dados são usados para treinamento. 10% de seus dados são usados para validação e 10% de seus dados são usados para testes.
Informações da variável
A seção Resultados do modelo de previsão e configuração fornece o nome da variável de dados integrados Desistência e o valor que indica que é provável que um cliente desista. Esta seção também lista suas variáveis excluídas.
Motivadores da previsão
Os drivers de previsão são as variáveis que foram analisadas com o intuito de criar seu modelo de previsão, ordenado pela sua importância na previsão da rotatividade. Isso inclui qualquer variável que não tenha sido excluída da análise. No exemplo abaixo, as pontuações NPS e as classificações de confiabilidade orientam a previsão de desistência.
Clique em Mostrar outros drivers para expandir a lista.
Qdica: para criar esse gráfico, cada variável é executada em uma regressão logística simples em relação à variável desistência. O valor de coeficiente de determinação mais alto é definido como 1 e os valores das outras variáveis são escalonados de modo correspondente. Por exemplo, se o coeficiente de determinação mais alto for 0,5, o comprimento de barra de cada variável será coeficiente de determinação * 2, em que o comprimento de barra é 1.
O gráfico é, portanto, um indicador da força relativa das variáveis na previsão de rotatividade e não é de natureza multivariada. Uma classificação do impacto de cada variável na produção de um modelo baseado em algoritmos de aprendizagem profunda é uma área de pesquisa acadêmica ativa, sem melhores práticas aceitas neste ponto.
Métricas de previsão
Preveja o iQ “retém” (deixa de lado) 10% dos dados antes de criar o modelo. Depois que o modelo é criado, ele cria previsões para esse 10%. Em seguida, compara suas previsões com o que realmente aconteceu, se esses clientes realmente desistiram. Esses resultados são usados para potencializar as métricas de precisão abaixo. Observe que embora este seja um método eficaz de melhores práticas para estimar a precisão do modelo, ele não é uma garantia da precisão futura do modelo.
- Precisão: a proporção das previsões do modelo que serão precisas.
- Precisão: a proporção de clientes previstos para desistir que realmente desistirão.
- Recall: A proporção de quem realmente desistiu que o modelo previsto antes do tempo o faria.
O Predict iQ calculará o valor de limite ideal maximizando a pontuação F1. Por padrão, seu modelo será definido como o limite ideal, mas você pode ajustá-lo; consulte Configurar limite abaixo.
Clique em Saída avançada abaixo da tabela Métricas preditivas para revelar as tabelas Matriz de confusão e Métricas de previsão avançada.
Precisão e revogação
Precisão e revogação são as métricas de previsão mais importantes. Eles têm um relacionamento inverso e, muitas vezes, você precisa pensar no compromisso entre saber exatamente quais clientes desistirão e saber que você identificou todos ou a maioria dos clientes propensos a desistir.
Configurar limite
Clique em Configurar limite para definir um limite para quando um cliente deve ser identificado como provável desistência. Esta porcentagem limite é a probabilidade individual de desistência.
Clique e arraste o ponto no gráfico para ajustar o limite ou digite um limite % e observe como o gráfico é alterado. Quando terminar, clique em Definir limite para salvar suas alterações. Você também pode cancelar as alterações clicando em Cancelar no canto inferior direito ou no X na parte superior direita.
O ajuste do valor limiar ajusta a precisão ao longo do eixo y e a revogação ao longo do eixo x. Essas métricas têm uma relação inversa. Quanto mais precisas forem as suas medições, mais baixa é a revogação e vice-versa.
Matriz de confusão
Quando o Predict iQ cria um modelo de previsão, ele “detém” (ou deixa de lado) 10% dos dados. Para verificar a precisão do modelo gerado, os dados do novo modelo são executados em relação ao holdout de 10%. Isso serve como uma comparação do que é previsto e o que “realmente aconteceu”.
“Sim” neste gráfico será substituído pelo que você indicou como valor-alvo na etapa 5 da configuração.
- Real Não Sim / Previsto Não Sim: a porcentagem de clientes que o modelo previsto não desistiu, que na verdade não desistiu.
- Real Sim / Previsto Não Sim: a porcentagem de clientes que o modelo previsto não desistiu, que inversamente desistiu.
- Real não Sim / Previsto Sim: a porcentagem de clientes que o modelo previsto desistiria, que inversamente não desistiu.
- Real Sim / Previsto Sim: a porcentagem de clientes que o modelo previu desistiria, que realmente desistiu.
Os números são verdes para indicar que você quer que esses números sejam o mais altos possível, pois eles refletem suposições corretas. Os números são vermelhos para indicar que você quer que esses números sejam baixos, pois eles refletem suposições incorretas.
Você pode ajustar a matriz para exibir Porcentagem ou Contagem. Essa contagem inclui 10% dos seus dados mantidos, não o conjunto de dados completo.
Métricas avançadas de previsão
Esta tabela exibe métricas de previsão adicionais.
- Precisão: a proporção de clientes previstos para desistir que realmente desistirão.
- Recall: A proporção de quem realmente desistiu que o modelo previsto antes do tempo o faria.
- Precisão: a proporção das previsões do modelo que serão precisas.
- Pontuação F1: a Pontuação F1 é usada para selecionar um limite que equilibre a precisão com a revogação. Uma pontuação F1 mais alta geralmente é melhor, embora o local correto para definir o limite deva ser determinado por suas metas de negócios.
- Área Abaixo da Curva Precision-Recall: A curva Precision-Recall é a curva que você observa no gráfico quando clica em Configurar limite. A área total abaixo da curva é uma medida da precisão global do modelo (independentemente de onde você define o valor limiar). Uma área abaixo da curva de 50% é igual a chance aleatória; 100% é perfeitamente precisa.
Fazer previsões
Previsão de lote (CSV)
Além de analisar as respostas coletadas em sua pesquisa, você também pode carregar um arquivo de dados específico que deseja que o Predict iQ avalie.
Para obter um modelo do arquivo, clique em Modelo de previsão de lote para este modelo.
Quando terminar de editar seu arquivo no Excel e estiver pronto para recarregá-lo, clique em Escolher arquivo para selecionar o arquivo. Em seguida, clique em Fazer previsões para iniciar a análise.
Previsões de fluxo
As previsões de fluxo são atualizadas à medida que os dados chegam à pesquisa. Nesta seção, você pode decidir quando essas atualizações de previsão são efetuadas.
Crie uma previsão sempre que um novo participante concluir esta pesquisa: essa configuração permite previsões em tempo real. Você terá mais duas colunas em seus dados: Probabilidade de desistência, a probabilidade de desistência em um formato decimal; e Previsão de desistência, uma variável Sim/Não. A previsão de desistência é baseada no valor limiar configurado.
Administrando modelos
À esquerda da página, você verá um menu onde pode rolar e selecionar os modelos de previsão que criou no passado.
- Procurar por nome do modelo.
- Ordene sua lista de modelos. Clique no menu suspenso para escolher o que deseja classificar e use a seta ao lado do menu suspenso para ajustar se você está ordenando por ordem decrescente ou crescente.
- Selecione o modelo que você deseja visualizar.
- Criar um novo modelo de previsão.
- Depois de selecionar um modelo à esquerda, você pode clicar no nome dele na parte superior da página para editar o nome.
Dados de desistência
Na seção Dados da guia Dados & Análise, você pode exportar seus dados como uma planilha conveniente. Depois que o modelo de previsão for carregado, você terá colunas adicionais para desistência de dados nesta página.
- Probabilidade de desistência: a probabilidade de desistência em um formato decimal. Aparece quando a previsão de fluxo foi ativada e é baseada no limite definido. Se a coluna Probabilidade de desistência não for exibida, você também poderá procurar uma coluna de dados chamada “[selected churn field]_PROBABILITY_PREDICT_IQ”.
- Previsão de desistência: uma variável Sim/Não que confirma ou recusa a desistência com base no limite definido. Aparece quando a previsão de fluxo é ativada. Se a coluna Previsão de desistência não for exibida, você também poderá procurar uma coluna de dados chamada “[selected churn field]_CLASS_PREDICT_IQ”.
Os nomes de coluna também incluirão a data em que o modelo foi treinado no formato MMDDAAAA. Por exemplo, 14 de janeiro de 2022 seria representado no nome da coluna como 01142022.
Observe que as probabilidades e previsões de desistência só são aplicadas a novos resultados da pesquisa. Respostas existentes anteriormente não terão probabilidades de desistência e previsões adicionadas a elas.
Limpeza automática de dados
Ao treinar o modelo, o Predict iQ ignorará automaticamente certos tipos de variáveis que não serão úteis para previsões enquanto transforma automaticamente outras variáveis.
Variáveis de alta cardinalidade
Se uma variável tiver mais de 50 valores exclusivos ou mais de 20% dos valores registrados forem exclusivos, ela será ignorada durante o treinamento do modelo. Variáveis com muitos valores exclusivos não são boas colunas de recursos para previsões.
Valores ausentes para colunas numéricas
Para variáveis numéricas incluídas no modelo, os valores ausentes são sempre imputados como 0 (zero).
Codificação One Hot de categorias
As variáveis categóricas serão codificadas em um hot se a variável não for recodificada ou se a variável não tiver uma relação ordinal para suas categorias.
Qdica: Predict iQ transfere as mesmas configurações de variável usadas no Stats iQ.
Variáveis de invariante
Qualquer variável que não tenha desvio em seus valores registrados será ignorada para o treinamento do modelo. Isso significa que se você tiver uma variável que só tem um único valor exclusivo, ela não fará parte do modelo. As variáveis que são úteis para a previsão terão um bom equilíbrio entre ter muito poucos valores únicos e ter demasiados valores únicos. Consulte “Variáveis de alta cardinalidade” acima.
If any invariant variables are excluded during data cleaning, then they will be listed in the Prediction model results and configuration section.
Projetos onde você pode usar o Predict iQ
O Predict iQ não está incluído em todas as licenças. No entanto, se você tiver esse recurso, ele poderá ser acessado em alguns tipos diferentes de projetos:
O Predict iQ também pode aparecer em projetos de engajamento e ciclo de vida, mas com base na natureza dos dados geralmente coletados por esses tipos de projeto, o conjunto de dados não seria necessariamente melhor para o Predict iQ.
Enquanto Predict iQ aparece em Conjoint e MaxDiff, não recomendamos usá-los juntos. O conteúdo conjugado e específico do MaxDiff não é compatível com o Predict iQ, portanto, você só pode analisar dados demográficos.
Nenhum outro tipo de projeto é suportado.