Chamar formatos de dados de transcrições
Sobre formatos de dados de transcrições de chamada
O XM Discover permite que você chame transcrições (ou seja, transcrições de conversas de áudio) pelo formato CSV, Excel, JSON ou WebVTT. As transcrições de chamada identificam os participantes em uma conversação e atribuem cada mensagem a um participante.
Normalmente, as transcrições de chamada contêm vários campos de dados estruturados e não estruturados que representam uma conversa entre um cliente e uma entidade em sua empresa (por exemplo, a transcrição entre um cliente e seu serviço telefônico automatizado ou a transcrição da chamada entre um cliente e um representante de suporte ao vivo). Os campos estruturados podem conter datas, números ou dados de texto com um alto grau de organização (como nomes de marcas, nomes de participantes e produtos). Os campos não estruturados contêm notas, comentários e outros campos de texto aberto.
Você pode efetuar o upload da chamada por meio dos seguintes formatos:
- CSV
- XLS ou XLSX (Microsoft Excel)
- JSON
- WebVTT
Formatação CSV e Excel para transcrições de chamada
Esta seção abrange a formatação de transcrições de chamada para arquivos CSV e Excel. A formatação e os requisitos para os dois tipos de arquivo são os mesmos.
Em arquivos CSV e Excel, as transcrições de chamada são definidas usando várias linhas. Veja como funciona:
- Cada linha contém uma linha individual de diálogo em uma conversação, juntamente com os dados do participante e um registro da hora.
- As linhas separadas são roladas em uma única conversação compartilhando o mesmo ID de conversação.
- Os valores de campo para toda a conversação (como Data do documento ou atributos personalizados) são retirados da primeira linha da conversação.
Elemento | Descrição |
conversationId
(obrigatório) |
Um código exclusivo para toda a conversação. Cada linha que tem o mesmo código é tratada como uma linha separada em uma única conversação.
Você pode mapear este campo para o atributo natural_id para usá-lo como o ID natural do documento. |
conversationTimestamp
(obrigatório) |
A data e hora de toda a conversa. Use o formato ISO 8601 com precisão de segundos.
Você pode mapear este campo para o atributo document_date para usá-lo como Data do documento. |
participantId
(obrigatório) |
O código do participante. Deve ser exclusivo por conversação (documento). |
participantType
(obrigatório) |
O tipo do participante. Valores possíveis:
Esses valores são transferidos para o atributo Tipo de participante CB para relatórios e visualização de participantes. Se não especificado, o Tipo de Participante CB não terá valor relatável. |
is_ivr
(opcional) |
Um campo booliano que indica se um participante é um bot Interactive Voice Response (IVR) ou uma pessoa.
Esses valores são transferidos para o atributo Tipo de participante CB para relatórios e visualização de participantes. Se não especificado, o tipo de participante CB não terá valor sujeito a notificação. |
texto
(obrigatório) |
Transcrição da fala.
Atenção: um total de todos os elementos de texto não pode exceder 100.000 caracteres. Em caso afirmativo, o documento é ignorado.
|
início
(obrigatório) |
A hora em que o discurso começa (em milissegundos passou desde o início da conversa). |
end
(obrigatório) |
O tempo que a fala termina (em milissegundos passou desde o início da conversa). |
contentSegmentType
(obrigatório) |
Este parâmetro identifica o formato de transcrição, que permite que o mecanismo de processamento de linguagem natural (NLP) processe os dados corretamente.
Valores possíveis:
|
campos personalizados
(opcional) |
Você pode fornecer vários campos para adicionar atributos estruturados à conversação. |
Formatação JSON para transcrições de chamada
Esta seção contém formatação JSON para transcrições de chamada.
Objetos de nível superior
A tabela a seguir descreve os objetos de nível superior de um nó de documento.
Elemento | Descrição |
conversationId | Um código exclusivo para toda a conversação.
Você pode mapear este campo para o atributo natural_id para usá-lo como o ID natural do documento. |
conversationTimestamp | A data e hora de toda a conversa. Use o formato ISO 8601 com precisão de segundos.
Você pode mapear este campo para o atributo document_date para usá-lo como Data do documento. |
conteúdo | Um objeto que contém o conteúdo da conversação. Inclui estes objetos aninhados:
|
campos personalizados (atributos) | Você pode fornecer vários pares chave-valor para adicionar atributos estruturados à conversação. |
Objeto de conteúdo
A tabela seguinte descreve os objetos aninhados dentro do objeto de conteúdo.
Elemento | Descrição |
participantes | Uma matriz de objetos que fornece informações sobre os participantes da conversação. Inclui estes campos:
|
conversationContent | Uma matriz de objetos que contém as linhas da conversação. Inclui estes campos:
|
contentSegmentType
(obrigatório) |
Este parâmetro identifica o formato de transcrição, que permite que o mecanismo de processamento de linguagem natural (NLP) processe os dados corretamente.
Valores possíveis:
|
objeto participante
A tabela seguinte descreve os campos aninhados dentro do objeto de participantes.
Elemento | Descrição |
participant_id
(obrigatório) |
O código do participante. Deve ser exclusivo por conversação (documento). |
tipo
(obrigatório) |
O tipo do participante. Valores possíveis:
Esses valores são transferidos para o atributo Tipo de participante CB para relatórios e visualização de participantes. Se não especificado, o Tipo de Participante CB não terá valor relatável. |
is_ivr
(opcional) |
Um campo booliano que indica se um participante é um bot Interactive Voice Response (IVR) ou uma pessoa.
Esses valores são transferidos para o atributo Tipo de participante CB para relatórios e visualização de participantes. Se não especificado, o tipo de participante CB não terá valor sujeito a notificação. |
Objeto conversationContent
A tabela seguinte descreve os campos aninhados dentro do objeto conversationContent.
Elemento | Descrição |
participant_id
(obrigatório) |
O ID do participante que está falando. Deve corresponder a um dos códigos fornecidos na matriz de participantes. |
texto
(obrigatório) |
Transcrição da fala.
Atenção: um total de todos os elementos de texto não pode exceder 100.000 caracteres. Em caso afirmativo, o documento é ignorado.
|
início
(obrigatório) |
A hora em que o discurso começa (em milissegundos passou desde o início da conversa). |
end
(obrigatório) |
O tempo que a fala termina (em milissegundos passou desde o início da conversa). |
Exemplo
Aqui está um exemplo de transcrição de chamada entre um agente e um cliente.
[
{
"conversationId": "46289",
"conversationTimestamp": "2020-07-30T10:15:45.000Z",
"content": {
"participant": [
"participant_id": "
,
type
" {
ENT AGisr:" ivr" "
" "
",
"start": 22000,
"end": 32000
},
{
"participant_id": "2",
"text": "Oi, eu tenho algumas perguntas.",
"start": 32000,
"end": 42000
"contentSegmentType": "TURN"
},
"city": "Boston",
"
"
Formatação WebVTT para certificados de chamada
Você pode carregar transcrições de chamada utilizando a formatação WebVTT.
A Data do documento é retirada automaticamente do nome do arquivo, se disponível. Para definir a Data do documento automaticamente, certifique-se de que o nome do arquivo começa com o seguinte prefixo:
<Timezone><YYYY><MM><DD>-
Se os nomes de arquivo usarem um formato diferente, aplique uma transformação de data ao campo Data do documento no passo de mapeamentos. Para obter detalhes, consulte Definindo uma data do documento específica.
Exemplo
Aqui está um exemplo de uma transcrição de chamada Zoom no formato WebVTT.
WEBVTT
1
00:00:00.599 --> 00:00:02.280
John Smith: Tudo bem
2
00:00:04.230 --> sim; 00:00:00:05.339
John Smith: começar a compartilhar
3
00:12.809 --:
:
:
&4