Ir para o conteúdo principal
Loading...
Skip to article
  • Qualtrics Platform
    Qualtrics Platform
  • Customer Journey Optimizer
    Customer Journey Optimizer
  • XM Discover
    XM Discover
  • Qualtrics Social Connect
    Qualtrics Social Connect

Formatos de dados de transcrições de chamadas


Was this helpful?


This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

The feedback you submit here is used only to help improve this page.

That’s great! Thank you for your feedback!

Thank you for your feedback!


Sobre formatos de dados de transcrições de chamadas

XM Discover permite que você chame transcrições (ou seja, transcrições de conversas de áudio) nos formatos CSV, Excel, JSON ou WebVTT. As transcrições de chamadas identificam os participantes de uma conversa e atributo cada mensagem a um participante.

Normalmente, as transcrições de chamadas contêm vários campos de dados estruturados e não estruturados que representam uma conversa entre um cliente e uma entidade em sua empresa (por exemplo, a transcrição entre um cliente e seu serviço telefônico automatizado ou a transcrição de chamadas entre um cliente e um representante de suporte ao vivo). Os campos estruturados podem conter datas, números ou dados de texto com um alto grau de organização (como nomes de marcas, nomes participante e produtos). Os campos não estruturados contêm notas, comentários e outros campos texto aberto.

Você pode fazer upload da chamada nos seguintes formatos:

  • CSV
  • XLS ou XLSX (Microsoft Excel)
  • JSON
  • WebVTT

Formatação de CSV e Excel para transcrições de chamadas

Esta seção aborda a formatação de transcrições de chamadas para arquivos CSV e Excel. A formatação e os requisitos para ambos os tipos de arquivo são os mesmos.

Nos arquivos CSV e Excel, as transcrições de chamadas são definidas usando várias linhas. Veja como funciona:

  • Cada linha contém uma linha individual de diálogo em uma conversa, juntamente com os dados participante e um registro de data e hora.
  • Linhas separadas são reunidas em uma única conversa compartilhando o mesmo ID de conversa.
  • Os valores de campo em toda a conversa (como Data do Documento ou atributos personalizados) são obtidos da primeira linha da conversa.
Elemento Descrição
conversationId

(Obrigatório)

Uma ID exclusiva para toda a conversa. Cada linha que tem a mesma ID é tratada como uma linha separada em uma única conversa.

Você pode mapear esse campo para o atributo natural_id para usá-lo como ID natural do documento.

conversationTimestamp

(Obrigatório)

A data e a hora de toda a conversa. Use o formato ISO 8601 com precisão de segundos.

Você pode mapear esse campo para o atributo document_date para usá-lo como data do documento.

participantId

(Obrigatório)

O ID do participante. Deve ser único por conversa (documento).
participantType

(Obrigatório)

O tipo de participante. Valores possíveis:

  • AGENTE: Indica um representante da empresa ou um chatbot.
  • CLIENTE: Indica um cliente.
  • TYPE_UNKNOWN: indica um participante não identificado.

Esses valores são passados para o atributo CB Participante Type para geração de relatórios e visualização dos participantes.

Se não for especificado, o CB Participante Type não terá valor reportável.

is_ivr

(Opcional)

Um campo booleano que indica se um participante é um bot de resposta interativa de voz (IVR) ou uma pessoa.

  • true: indica um bot de URA.
  • falso: Indica uma pessoa.

Esses valores são passados para o atributo CB Kind of Participante para geração de relatórios e visualização dos participantes.

Se não for especificado, o CB Kind of Participante não terá valor reportável.

text

(Obrigatório)

Transcrição do discurso.

Atenção: A soma de todos os elementos de texto não pode exceder 100.000 caracteres. Se isso acontecer, o documento será ignorado.
start

(Obrigatório)

A hora em que a fala começa (em milissegundos passados desde o início da conversa).
end

(Obrigatório)

A hora em que a fala termina (em milissegundos passados desde o início da conversa).
contentSegmentType

(Obrigatório)

Esse parâmetro identifica o formato da transcrição, o que permite que o mecanismo de processamento de linguagem natural (NLP) processe os dados corretamente.

Valores possíveis:

  • TOKEN: os dados transcritos são fornecidos uma palavra de cada vez.
  • SENTENÇA: Os dados transcritos são fornecidos em uma frase de cada vez.
  • TURNO: os dados transcritos são fornecidos um turno de locutor por vez.
campos personalizados

(opcional)

Você pode fornecer vários campos para adicionar atributos estruturados à conversa.

Formatação JSON para transcrições de chamadas

Esta seção contém a formatação JSON para transcrições de chamadas.

Objetos de nível superior

A tabela a seguir descreve os objetos de nível superior de um nó de documento.

Elemento Descrição
conversationId Uma ID exclusiva para toda a conversa.

Você pode mapear esse campo para o atributo natural_id para usá-lo como ID natural do documento.

conversationTimestamp A data e a hora de toda a conversa. Use o formato ISO 8601 com precisão de segundos.

Você pode mapear esse campo para o atributo document_date para usá-lo como data do documento.

conteúdo Um objeto que contém o conteúdo da conversa. Inclui esses objetos aninhados:

  • participantes
  • conversationContent
  • contentSegmentType
campos personalizados (atributos) Você pode fornecer vários pares de valores-chave para adicionar atributos estruturados à conversa.

objeto de conteúdo

A tabela a seguir descreve os objetos aninhados dentro do objeto de conteúdo.

Elemento Descrição
participantes Uma matriz de objetos que fornece informações sobre os participantes da conversa. Inclui estes campos:

  • id_participante
  • tipo
  • is_ivr
conversationContent Uma matriz de objetos que contém as linhas da conversa. Inclui estes campos:

  • id_participante
  • texto
  • início
  • fim
contentSegmentType

(obrigatório)

Esse parâmetro identifica o formato da transcrição, o que permite que o mecanismo de processamento de linguagem natural (NLP) processe os dados corretamente.

Valores possíveis:

  • TOKEN: os dados transcritos são fornecidos uma palavra de cada vez.
  • SENTENÇA: Os dados transcritos são fornecidos em uma frase de cada vez.
  • TURNO: os dados transcritos são fornecidos um turno de locutor por vez.

participantes Objeto

A tabela a seguir descreve os campos aninhados no objeto participantes.

Elemento Descrição
participant_id

(obrigatório)

O ID do participante. Deve ser único por conversa (documento).
type

(Obrigatório)

O tipo de participante. Valores possíveis:

  • AGENTE: Indica um representante da empresa ou um chatbot.
  • CLIENTE: Indica um cliente.
  • TYPE_UNKNOWN: indica um participante não identificado.

Esses valores são passados para o atributo CB Participante Type para geração de relatórios e visualização dos participantes.

Se não for especificado, o CB Participante Type não terá valor reportável.

is_ivr

(Opcional)

Um campo booleano que indica se um participante é um bot de resposta interativa de voz (IVR) ou uma pessoa.

  • true: indica um bot de URA.
  • false:Indica uma pessoa.

Esses valores são passados para o atributo CB Kind of Participante para geração de relatórios e visualização dos participantes.

Se não for especificado, o CB Kind of Participante não terá valor reportável.

objeto conversationContent

A tabela a seguir descreve os campos aninhados no objeto conversationContent.

Elemento Descrição
participant_id

(Obrigatório)

A ID do participante que está falando. Deve corresponder a uma das IDs fornecidas na matriz de participantes.
text

(Obrigatório)

Transcrição do discurso.

Atenção: A soma de todos os elementos de texto não pode exceder 100.000 caracteres. Se isso acontecer, o documento será ignorado.
start

(Obrigatório)

A hora em que a fala começa (em milissegundos passados desde o início da conversa).
end

(Obrigatório)

A hora em que a fala termina (em milissegundos passados desde o início da conversa).

Exemplo

Aqui está um exemplo de uma transcrição de chamada entre um agente e um cliente.

[

{


"conversationId": "46289",
"conversationTimestamp": "2020-07-30T10:15:45.000Z",
"content": {
"participants": [
{
"participant_id": "1",
"type": "AGENT",
"is_ivr": false
},
{
"participant_id": "2",
"type": "CLIENT",
"is_ivr": false
}
],
"conversationContent": [
{
"participant_id": "1",
"text": "This is Emily, how may I help you?",
"start": 22000,
"end": 32000
},
{
"participant_id": "2",
"text": "Hi, I have a couple of questions." (Olá, tenho algumas perguntas),
"start" (início): 32000,
"end": 42000
}
],
"contentSegmentType": "TURN"
},
"city": "Boston",
"source": "Call Center"
}
]

Formatação WebVTT para transcrições de chamadas

Você pode carregar transcrições de chamadas usando a formatação WebVTT.

A data do documento é obtida automaticamente do nome do arquivo, se disponível. Para definir a data do documento automaticamente, certifique-se de que o nome do arquivo comece com o seguinte prefixo

<Timezone><YYYY><MM><DD>:-

Exemplo: GMT20201011-meeting.vtt

Se os nomes dos arquivos usarem um formato diferente, aplicar uma transformação de data ao campo Data do documento na etapa de mapeamentos. Para obter detalhes, consulte Definição de uma data de documento específica.

Exemplo

Aqui está um exemplo de uma transcrição de chamada do Zoom no formato WebVTT.

WEBVTT
1
00:00:00.599 --> 00:00:02.280
John Smith: Alright so let me
2
00:00:04.230 --> 00:00:05.339
John Smith: start sharing
3
00:00:12.809 --> 00:00:13.469
John Smith: Minha tela.
4
00:00:15.750 --> 00:00:18.119
John Smith: Todos podem ver.
5
00:00:19.050 --> 00:00:28.890
Paul Jones: Sim, estou vendo.

Muitas das páginas neste site foram traduzidas do inglês original usando tradução automática. Embora na Qualtrics tenhamos feito nossa diligência prévia para obter as melhores traduções automáticas possíveis, a tradução automática nunca é perfeita. O texto original em inglês é considerado a versão oficial, e quaisquer discrepâncias entre o inglês original e as traduções automáticas não são juridicamente vinculativas.