Plantilla de artículo
Acerca de los formatos de datos de las transcripciones de llamadas
XM Discover le permite transcripciones de llamadas (es decir, transcripciones de conversaciones de audio) mediante formato CSV, Excel, JSON o WebVTT. Las transcripciones de llamadas identifican a los participantes de una conversación y atributo cada mensaje a un participante.
Normalmente, las transcripciones de llamadas contienen una serie de campos de datos estructurados y no estructurados que representan una conversación entre un cliente y una entidad de su empresa (por ejemplo, la transcripción entre un cliente y su servicio telefónico automatizado, o la transcripción de la llamada entre un cliente y un representante de soporte en vivo). Los campos estructurados pueden contener fechas, números o datos de texto con un alto grado de organización (como nombres de marcas, nombres de participante y productos). Los campos no estructurados contienen notas, comentarios y otros campos de texto libre .
Puedes cargar llamadas a través de los siguientes formatos:
- CSV
- XLS o XLSX (Microsoft Excel)
- JSON
- WebVTT
Formato CSV y Excel para transcripciones de llamadas
Esta sección cubre el formato de las transcripciones de llamadas para archivos CSV y Excel. El formato y los requisitos para ambos tipos de archivos son los mismos.
En archivos CSV y Excel, las transcripciones de llamadas se definen utilizando varias filas. Así es como funciona:
- Cada fila contiene una línea individual de diálogo en una conversación junto con los datos de los participante y una marca de tiempo.
- Las filas separadas se agrupan en una sola conversación al compartir el mismo ID de conversación.
- Los valores de campo de toda la conversación (como la fecha del documento o los atributos personalizados) se toman de la primera fila de la conversación.
Elemento | Descripción |
ID de conversación
(Requerido) |
Una identificación única para toda la conversación. Cada fila que tiene el mismo ID se trata como una línea separada dentro de una sola conversación.
Puede asignar este campo a la identificación natural atributo para usarlo como ID natural del documento. |
ConversaciónMarca de tiempo
(Requerido) |
La fecha y hora de toda la conversación. Utilice el ISO 8601 formato con precisión de segundos.
Puede asignar este campo a la fecha del documento atributo para usarlo como Fecha del Documento. |
Id. del participante
(Requerido) |
El ID del participante. Debe ser único por conversación (documento). |
tipo de participante
(Requerido) |
El tipo de participante. Valores posibles:
Estos valores se transmiten a la Tipo de Participante del CB atributo para informes y visualización de participantes. Si no se especifica, Tipo de Participante del CB no tendrá valor declarable. |
es_ivr
(Opcional) |
Un campo booleano que indica si un participante es un bot de respuesta de voz interactiva (IVR) o una persona.
Estos valores se transmiten a la CB Tipo de Participante atributo para informes y visualización de participantes. Si no se especifica, CB Tipo de Participante no tendrá valor declarable. |
texto
(Requerido) |
Transcripción del discurso.
Atención: Una suma de todo texto Los elementos no pueden exceder los 100.000 caracteres. Si es así, se omite el documento.
|
comenzar
(Requerido) |
La hora en que comienza el discurso (en milisegundos transcurridos desde el comienzo de la conversación). |
fin
(Requerido) |
La hora en que termina el discurso (en milisegundos transcurridos desde el inicio de la conversación). |
tipodesegmentocontenido
(Requerido) |
Este parámetro identifica el formato de transcripción, que permite que el motor de procesamiento del lenguaje natural (PLN) procese los datos correctamente.
Valores posibles:
|
campos personalizados
(Opcional) |
Puede proporcionar varios campos para agregar atributos estructurados a la conversación. |
Formato JSON para transcripciones de llamadas
Esta sección contiene formato JSON para transcripciones de llamadas.
Objetos de nivel superior
La siguiente tabla describe los objetos de nivel superior de un nodo de documento.
Elemento | Descripción |
ID de conversación | Una identificación única para toda la conversación.
Puede asignar este campo a la identificación natural atributo para usarlo como ID natural del documento. |
ConversaciónMarca de tiempo | La fecha y hora de toda la conversación. Utilice el ISO 8601 formato con precisión de segundos.
Puede asignar este campo a la fecha del documento atributo para usarlo como Fecha del Documento. |
contenido | Un objeto que contiene el contenido de la conversación. Incluye estos objetos anidados:
|
campos personalizados (atributos) | Puede proporcionar múltiples pares clave-valor para agregar atributos estructurados a la conversación. |
objeto de contenido
La siguiente tabla describe los objetos anidados dentro del contenido objeto.
Elemento | Descripción |
participantes | Una matriz de objetos que proporciona información sobre los participantes de la conversación. Incluye estos campos:
|
conversaciónContenido | Una matriz de objetos que contiene las líneas de la conversación. Incluye estos campos:
|
tipodesegmentocontenido
(requerido) |
Este parámetro identifica el formato de transcripción, que permite que el motor de procesamiento del lenguaje natural (PLN) procese los datos correctamente.
Valores posibles:
|
Participantes Objeto
La siguiente tabla describe los campos anidados dentro del Participantes objeto.
Elemento | Descripción |
id_participante
(requerido) |
El ID del participante. Debe ser único por conversación (documento). |
tipo
(Requerido) |
El tipo de participante. Valores posibles:
Estos valores se transmiten a la Tipo de Participante del CB atributo para informes y visualización de participantes. Si no se especifica, Tipo de Participante del CB no tendrá valor declarable. |
es_ivr
(Opcional) |
Un campo booleano que indica si un participante es un bot de respuesta de voz interactiva (IVR) o una persona.
Estos valores se transmiten a la CB Tipo de Participante atributo para informes y visualización de participantes. Si no se especifica, CB Tipo de Participante no tendrá valor declarable. |
Objeto de contenido de conversación
La siguiente tabla describe los campos anidados dentro del conversaciónContenido objeto.
Elemento | Descripción |
id_participante
(Requerido) |
El ID del participante que está hablando. Debe coincidir con una de las identificaciones proporcionadas en el Participantes formación. |
texto
(Requerido) |
Transcripción del discurso.
Atención: Una suma de todo texto Los elementos no pueden exceder los 100.000 caracteres. Si es así, se omite el documento.
|
comenzar
(Requerido) |
La hora en que comienza el discurso (en milisegundos transcurridos desde el comienzo de la conversación). |
fin
(Requerido) |
La hora en que termina el discurso (en milisegundos transcurridos desde el inicio de la conversación). |
Ejemplo
A continuación se muestra un ejemplo de una transcripción de una llamada entre un agente y un cliente.
[
{
"conversationId": "46289",
"conversationTimestamp": "2020-07-30T10:15:45.000Z",
"contenido": {
"participantes": [
{
"participante_id": "1",
"tipo": "AGENTE",
"is_ivr": falso
},
{
"participante_id": "2",
"tipo": "CLIENTE",
"is_ivr": falso
}
],
"contenido de la conversación": [
{
"participante_id": "1",
"texto": "Soy Emily, ¿en qué puedo ayudarle?",
"inicio": 22000,
"fin": 32000
},
{
"participante_id": "2",
"texto": "Hola, tengo un par de preguntas.",
"inicio": 32000,
"fin": 42000
}
],
"contentSegmentType": "GIRAR"
},
"ciudad": "Boston",
"fuente": "Centro de llamadas"
}
]
Formato WebVTT para transcripciones de llamadas
Puede cargar transcripciones de llamadas usando Formato WebVTT.
La fecha del documento se toma automáticamente del nombre del archivo si está disponible. Para establecer la fecha del documento automáticamente, asegúrese de que el nombre del archivo comience con el siguiente prefijo:
<Timezone><YYYY><MM><DD>-
Si los nombres de archivo utilizan un formato diferente, aplicar una transformación de fecha al campo Fecha del documento en el paso de asignaciones. Para más detalles, consulte Establecer una fecha de documento específica.
Ejemplo
A continuación se muestra un ejemplo de una transcripción de una llamada de Zoom en formato WebVTT.
WEBVTT
1
00:00:00.599 --> 00:00:02.280
John Smith: Muy bien, déjame...
2
00:00:04.230 --> 00:00:05.339
John Smith: empieza a compartir
3
00:00:12.809 --> 00:00:13.469
John Smith: Mi pantalla.
4
00:00:15.750 --> 00:00:18.119
John Smith: ¿Todo el mundo puede verlo?
5
00:00:19.050 --> 00:00:28.890
Paul Jones: Sí, puedo verlo.