Modello di articolo
Informazioni sui formati dei dati delle trascrizioni delle chiamate
XM Discover consente di chiamare le trascrizioni (cioè le trascrizioni delle conversazioni audio) in formato CSV, Excel, JSON o WebVTT. Le trascrizioni delle chiamate identificano i partecipanti a una conversazione e attribuiscono ogni messaggio a un partecipante.
In genere, le trascrizioni delle chiamate contengono una serie di campi dati strutturati e non strutturati che rappresentano una conversazione tra un cliente e un’entità della vostra azienda (ad esempio, la trascrizione tra un cliente e il vostro servizio telefonico automatizzato, o la trascrizione della chiamata tra un cliente e un rappresentante dell’assistenza dal vivo). I campi strutturati possono contenere date, numeri o dati testuali con un alto grado di organizzazione (come nomi di brand, nomi di partecipanti e prodotti). I campi non strutturati contengono note, commenti e altre risposte aperte.
È possibile caricare la chiamata nei seguenti formati:
- CSV
- XLS o XLSX (Microsoft Excel)
- JSON
- WebVTT
Formattazione CSV e Excel per le trascrizioni delle chiamate
Questa sezione tratta la formattazione delle trascrizioni delle chiamate per i file CSV ed Excel. La formattazione e i requisiti per entrambi i tipi di file sono gli stessi.
Nei file CSV ed Excel, le trascrizioni delle chiamate sono definite utilizzando più righe. Ecco come funziona:
- Ogni riga contiene una singola riga di dialogo in una conversazione, insieme ai dati dei partecipanti e a un timestamp.
- Le righe separate vengono riunite in un’unica conversazione condividendo lo stesso ID di conversazione.
- I valori dei campi personalizzati (come la data del documento o gli attributi personalizzati) vengono presi dalla prima riga della conversazione.
Elemento | Descrizione |
conversationId
(Obbligatorio) |
Un ID unico per l’intera conversazione. Ogni riga con lo stesso ID viene trattata come una riga separata all’interno di una singola conversazione.
È possibile mappare questo campo all’attributo natural_id per utilizzarlo come ID naturale del documento. |
conversationTimestamp
(Obbligatorio) |
La data e l’ora dell’intera conversazione. Utilizzare il formato ISO 8601 con la precisione dei secondi.
È possibile mappare questo campo sull’attributo document_date per utilizzarlo come data del documento. |
participantId
(obbligatorio) |
L’ID del partecipante. Deve essere unico per ogni conversazione (documento). |
participantType
(obbligatorio) |
Il tipo di partecipante. Valori possibili:
Questi valori vengono passati all’attributo CB Tipo di partecipante per i rapporti e la visualizzazione dei partecipanti. Se non specificato, il tipo di partecipante CB non avrà alcun valore di segnalazione. |
is_ivr
(Opzionale) |
Campo booleano che indica se il partecipante è un bot di Interactive Voice Response (IVR) o una persona.
Questi valori vengono passati all’attributo CB Tipo di partecipante per i rapporti e la visualizzazione dei partecipanti. Se non specificato, il tipo di partecipante CB non avrà valore di segnalazione. |
testo
(Obbligatorio) |
Trascrizione del discorso.
Attenzione: La somma di tutti gli elementi di testo non può superare i 100.000 caratteri. In caso contrario, il documento viene saltato.
|
inizio
(Obbligatorio) |
Il tempo di inizio del discorso (in millisecondi trascorsi dall’inizio della conversazione). |
fine
(Obbligatorio) |
L’ora in cui termina il discorso (in millisecondi dall’inizio della conversazione). |
contentSegmentType
(obbligatorio) |
Questo parametro identifica il formato di trascrizione, che consente al motore di elaborazione del linguaggio naturale (NLP) di elaborare correttamente i dati.
Valori possibili:
|
campi personalizzati
(facoltativo) |
È possibile fornire più campi per aggiungere attributi strutturati alla conversazione. |
Formattazione JSON per le trascrizioni delle chiamate
Questa sezione contiene la formattazione JSON per le trascrizioni delle chiamate.
Oggetti di livello superiore
La tabella seguente descrive gli oggetti di primo livello di un nodo documento.
Elemento | Descrizione |
iD conversazione | Un ID unico per l’intera conversazione.
È possibile mappare questo campo all’attributo natural_id per utilizzarlo come ID naturale del documento. |
conversazioneTimestamp | La data e l’ora dell’intera conversazione. Utilizzare il formato ISO 8601 con la precisione dei secondi.
È possibile mappare questo campo sull’attributo document_date per utilizzarlo come data del documento. |
contenuto | Un oggetto che contiene il contenuto della conversazione. Include questi oggetti annidati:
|
campi personalizzati (attributi) | È possibile fornire più coppie chiave-valore per aggiungere attributi strutturati alla conversazione. |
contenuto Oggetto
La tabella seguente descrive gli oggetti annidati all’interno dell’oggetto content.
Elemento | Descrizione |
partecipanti | Un array di oggetti che fornisce informazioni sui partecipanti alla conversazione. Include questi campi:
|
conversazioneContenuto | Un array di oggetti che contiene le righe della conversazione. Include questi campi:
|
contentSegmentType
(obbligatorio) |
Questo parametro identifica il formato di trascrizione, che consente al motore di elaborazione del linguaggio naturale (NLP) di elaborare correttamente i dati.
Valori possibili:
|
pARTECIPANTI Oggetto
La tabella seguente descrive i campi annidati all’interno dell’oggetto Partecipante.
Elemento | Descrizione |
participant_id
(obbligatorio) |
L’ID del partecipante. Deve essere unico per ogni conversazione (documento). |
tipo
(Obbligatorio) |
Il tipo di partecipante. Valori possibili:
Questi valori vengono passati all’attributo CB Tipo di partecipante per i rapporti e la visualizzazione dei partecipanti. Se non specificato, il tipo di partecipante CB non avrà alcun valore di segnalazione. |
is_ivr
(Opzionale) |
Campo booleano che indica se il partecipante è un bot di Interactive Voice Response (IVR) o una persona.
Questi valori vengono passati all’attributo CB Tipo di partecipante per i rapporti e la visualizzazione dei partecipanti. Se non specificato, il tipo di partecipante CB non avrà valore di segnalazione. |
oggetto conversationContent
La tabella seguente descrive i campi annidati all’interno dell’oggetto conversationContent.
Elemento | Descrizione |
participant_id
(Obbligatorio) |
L’ID del partecipante che sta parlando. Deve corrispondere a uno degli ID forniti nell’array dei partecipanti. |
testo
(Obbligatorio) |
Trascrizione del discorso.
Attenzione: La somma di tutti gli elementi di testo non può superare i 100.000 caratteri. In caso contrario, il documento viene saltato.
|
inizio
(Obbligatorio) |
Il tempo di inizio del discorso (in millisecondi trascorsi dall’inizio della conversazione). |
fine
(Obbligatorio) |
L’ora in cui termina il discorso (in millisecondi dall’inizio della conversazione). |
Esempio
Ecco un esempio di trascrizione di una chiamata tra un agente e un cliente.
[
{
"conversationId": "46289",
"conversationTimestamp": "2020-07-30T10:15:45.000Z",
"content": {
"partecipante": [
{
"participant_id": "1",
"type": "AGENT",
"is_ivr": false
},
{
"participant_id": "2",
"type": "CLIENT",
"is_ivr": false
}
],
"conversationContent": [
{
"participant_id": "1",
"text": "Sono Emily, come posso aiutarla?",
"start": 22000,
"end": 32000
},
{
"participant_id": "2",
"text": "Salve, ho un paio di domande",
"inizio": 32000,
"end": 42000
}
],
"contentSegmentType": "TURN"
},
"city": "Boston",
"source": "Call Center"
}
]
Formattazione WebVTT per le trascrizioni delle chiamate
È possibile caricare le trascrizioni delle chiamate utilizzando la formattazione WebVTT.
La data del documento viene ricavata automaticamente dal nome del file, se disponibile. Per impostare automaticamente la data del documento, assicurarsi che il nome del file inizi con il seguente prefisso
<Timezone><YYYY><MM><DD>:-
Se i nomi dei file utilizzano un formato diverso, applicare una trasformazione della data al campo Data documento nella fase di mappatura. Per ulteriori informazioni, consultare la sezione Impostazione di una data documento specifica.
Esempio
Ecco un esempio di trascrizione di una chiamata Zoom in formato WebVTT.
WEBVTT
1
00:00:00.599 --> 00:00:02.280
John Smith: Va bene, allora fammi
2
00:00:04.230 --> 00:00:05.339
John Smith: inizia a condividere
3
00:00:12.809 --> 00:00:13.469
John Smith: Il mio schermo.
4
00:00:15.750 --> 00:00:18.119
John Smith: Tutti possono vederlo.
5
00:00:19.050 --> 00:00:28.890
Paul Jones: Sì, lo vedo.