Formatos de dados de transcrições de chamadas
Sobre formatos de dados de transcrições de chamadas
XM Discover permite que você chame transcrições (ou seja, transcrições de conversas de áudio) nos formatos CSV, Excel, JSON ou WebVTT. As transcrições de chamadas identificam os participantes de uma conversa e atributo cada mensagem a um participante.
Normalmente, as transcrições de chamadas contêm vários campos de dados estruturados e não estruturados que representam uma conversa entre um cliente e uma entidade em sua empresa (por exemplo, a transcrição entre um cliente e seu serviço telefônico automatizado ou a transcrição de chamadas entre um cliente e um representante de suporte ao vivo). Os campos estruturados podem conter datas, números ou dados de texto com um alto grau de organização (como nomes de marcas, nomes participante e produtos). Os campos não estruturados contêm notas, comentários e outros campos texto aberto.
Você pode fazer upload da chamada nos seguintes formatos:
- CSV
- XLS ou XLSX (Microsoft Excel)
- JSON
- WebVTT
Formatação de CSV e Excel para transcrições de chamadas
Esta seção aborda a formatação de transcrições de chamadas para arquivos CSV e Excel. A formatação e os requisitos para ambos os tipos de arquivo são os mesmos.
Nos arquivos CSV e Excel, as transcrições de chamadas são definidas usando várias linhas. Veja como funciona:
- Cada linha contém uma linha individual de diálogo em uma conversa, juntamente com os dados participante e um registro de data e hora.
- Linhas separadas são reunidas em uma única conversa compartilhando o mesmo ID de conversa.
- Os valores de campo em toda a conversa (como Data do Documento ou atributos personalizados) são obtidos da primeira linha da conversa.
Elemento | Descrição |
conversationId
(Obrigatório) |
Uma ID exclusiva para toda a conversa. Cada linha que tem a mesma ID é tratada como uma linha separada em uma única conversa.
Você pode mapear esse campo para o atributo natural_id para usá-lo como ID natural do documento. |
conversationTimestamp
(Obrigatório) |
A data e a hora de toda a conversa. Use o formato ISO 8601 com precisão de segundos.
Você pode mapear esse campo para o atributo document_date para usá-lo como data do documento. |
participantId
(Obrigatório) |
O ID do participante. Deve ser único por conversa (documento). |
participantType
(Obrigatório) |
O tipo de participante. Valores possíveis:
Esses valores são passados para o atributo CB Participante Type para geração de relatórios e visualização dos participantes. Se não for especificado, o CB Participante Type não terá valor reportável. |
is_ivr
(Opcional) |
Um campo booleano que indica se um participante é um bot de resposta interativa de voz (IVR) ou uma pessoa.
Esses valores são passados para o atributo CB Kind of Participante para geração de relatórios e visualização dos participantes. Se não for especificado, o CB Kind of Participante não terá valor reportável. |
text
(Obrigatório) |
Transcrição do discurso.
Atenção: A soma de todos os elementos de texto não pode exceder 100.000 caracteres. Se isso acontecer, o documento será ignorado.
|
start
(Obrigatório) |
A hora em que a fala começa (em milissegundos passados desde o início da conversa). |
end
(Obrigatório) |
A hora em que a fala termina (em milissegundos passados desde o início da conversa). |
contentSegmentType
(Obrigatório) |
Esse parâmetro identifica o formato da transcrição, o que permite que o mecanismo de processamento de linguagem natural (NLP) processe os dados corretamente.
Valores possíveis:
|
campos personalizados
(opcional) |
Você pode fornecer vários campos para adicionar atributos estruturados à conversa. |
Formatação JSON para transcrições de chamadas
Esta seção contém a formatação JSON para transcrições de chamadas.
Objetos de nível superior
A tabela a seguir descreve os objetos de nível superior de um nó de documento.
Elemento | Descrição |
conversationId | Uma ID exclusiva para toda a conversa.
Você pode mapear esse campo para o atributo natural_id para usá-lo como ID natural do documento. |
conversationTimestamp | A data e a hora de toda a conversa. Use o formato ISO 8601 com precisão de segundos.
Você pode mapear esse campo para o atributo document_date para usá-lo como data do documento. |
conteúdo | Um objeto que contém o conteúdo da conversa. Inclui esses objetos aninhados:
|
campos personalizados (atributos) | Você pode fornecer vários pares de valores-chave para adicionar atributos estruturados à conversa. |
objeto de conteúdo
A tabela a seguir descreve os objetos aninhados dentro do objeto de conteúdo.
Elemento | Descrição |
participantes | Uma matriz de objetos que fornece informações sobre os participantes da conversa. Inclui estes campos:
|
conversationContent | Uma matriz de objetos que contém as linhas da conversa. Inclui estes campos:
|
contentSegmentType
(obrigatório) |
Esse parâmetro identifica o formato da transcrição, o que permite que o mecanismo de processamento de linguagem natural (NLP) processe os dados corretamente.
Valores possíveis:
|
participantes Objeto
A tabela a seguir descreve os campos aninhados no objeto participantes.
Elemento | Descrição |
participant_id
(obrigatório) |
O ID do participante. Deve ser único por conversa (documento). |
type
(Obrigatório) |
O tipo de participante. Valores possíveis:
Esses valores são passados para o atributo CB Participante Type para geração de relatórios e visualização dos participantes. Se não for especificado, o CB Participante Type não terá valor reportável. |
is_ivr
(Opcional) |
Um campo booleano que indica se um participante é um bot de resposta interativa de voz (IVR) ou uma pessoa.
Esses valores são passados para o atributo CB Kind of Participante para geração de relatórios e visualização dos participantes. Se não for especificado, o CB Kind of Participante não terá valor reportável. |
objeto conversationContent
A tabela a seguir descreve os campos aninhados no objeto conversationContent.
Elemento | Descrição |
participant_id
(Obrigatório) |
A ID do participante que está falando. Deve corresponder a uma das IDs fornecidas na matriz de participantes. |
text
(Obrigatório) |
Transcrição do discurso.
Atenção: A soma de todos os elementos de texto não pode exceder 100.000 caracteres. Se isso acontecer, o documento será ignorado.
|
start
(Obrigatório) |
A hora em que a fala começa (em milissegundos passados desde o início da conversa). |
end
(Obrigatório) |
A hora em que a fala termina (em milissegundos passados desde o início da conversa). |
Exemplo
Aqui está um exemplo de uma transcrição de chamada entre um agente e um cliente.
[
{
"conversationId": "46289",
"conversationTimestamp": "2020-07-30T10:15:45.000Z",
"content": {
"participants": [
{
"participant_id": "1",
"type": "AGENT",
"is_ivr": false
},
{
"participant_id": "2",
"type": "CLIENT",
"is_ivr": false
}
],
"conversationContent": [
{
"participant_id": "1",
"text": "This is Emily, how may I help you?",
"start": 22000,
"end": 32000
},
{
"participant_id": "2",
"text": "Hi, I have a couple of questions." (Olá, tenho algumas perguntas),
"start" (início): 32000,
"end": 42000
}
],
"contentSegmentType": "TURN"
},
"city": "Boston",
"source": "Call Center"
}
]
Formatação WebVTT para transcrições de chamadas
Você pode carregar transcrições de chamadas usando a formatação WebVTT.
A data do documento é obtida automaticamente do nome do arquivo, se disponível. Para definir a data do documento automaticamente, certifique-se de que o nome do arquivo comece com o seguinte prefixo
<Timezone><YYYY><MM><DD>:-
Se os nomes dos arquivos usarem um formato diferente, aplicar uma transformação de data ao campo Data do documento na etapa de mapeamentos. Para obter detalhes, consulte Definição de uma data de documento específica.
Exemplo
Aqui está um exemplo de uma transcrição de chamada do Zoom no formato WebVTT.
WEBVTT
1
00:00:00.599 --> 00:00:02.280
John Smith: Alright so let me
2
00:00:04.230 --> 00:00:05.339
John Smith: start sharing
3
00:00:12.809 --> 00:00:13.469
John Smith: Minha tela.
4
00:00:15.750 --> 00:00:18.119
John Smith: Todos podem ver.
5
00:00:19.050 --> 00:00:28.890
Paul Jones: Sim, estou vendo.