Formati dati trascrizioni chiamata
Informazioni sui formati di dati trascrizioni delle chiamate
XM Discover ti consente di chiamare trascrizioni (ad esempio trascrizioni di conversazioni audio) in formato CSV, Excel, JSON o WebVTT. Le trascrizioni delle chiamate identificano i partecipanti a una conversazione e attribuiscono ogni messaggio a un partecipante.
In genere, le trascrizioni delle chiamate contengono una serie di campi di dati strutturati e non strutturati che rappresentano una conversazione tra un cliente e un’entità della società (ad esempio, la trascrizione tra un cliente e il servizio telefonico automatizzato o la trascrizione della chiamata tra un cliente e un rappresentante del supporto in tempo reale). I campi strutturati possono contenere date, numeri o dati di testo con un alto grado di organizzazione (ad esempio nomi di marchi, nomi di partecipanti e prodotti). I campi non strutturati contengono note, commenti e altri campi di testo aperto.
È possibile eseguire l’upload della chiamata tramite i seguenti formati:
- CSV
- XLS o XLSX (Microsoft Excel)
- JSON
- WebVTT
Formattazione CSV ed Excel per trascrizioni di chiamate
Questa sezione riguarda la formattazione per trascrizioni di chiamate per file CSV ed Excel. La formattazione e i requisiti per entrambi i tipi di file sono gli stessi.
Nei file CSV ed Excel, le trascrizioni delle chiamate vengono definite utilizzando più righe. Ecco come funziona:
- Ogni riga contiene una singola riga di dialogo in una conversazione insieme ai dati del partecipante e un timestamp.
- Righe separate vengono inserite in un’unica conversazione condividendo lo stesso ID conversazione.
- I valori dei campi per l’intera conversazione (ad esempio Data documento o attributi personalizzati) vengono rilevati dalla prima riga della conversazione.
Elemento | Descrizione |
conversationId
(richiesto) |
Un ID univoco per l’intera conversazione. Ogni riga con lo stesso ID viene trattata come una riga separata all’interno di una singola conversazione.
È possibile mappare questo campo all’attributo natural_id per utilizzarlo come ID naturale del documento. |
conversationTimestamp
(obbligatorio) |
La data e l’ora dell’intera conversazione. Utilizzare il formato ISO 8601 con precisione dei secondi.
È possibile mappare questo campo all’attributo document_date per utilizzarlo come Data documento. |
participantId
(obbligatorio) |
L’ID del partecipante. Deve essere univoco per ogni conversazione (documento). |
participantType
(obbligatorio) |
Il tipo di partecipante. Valori possibili:
Questi valori vengono inoltrati all’attributo Tipo di partecipante CB per il reporting e la visualizzazione dei partecipanti. Se non specificato, il tipo di partecipante CB non avrà alcun valore da dichiarare. |
is_ivr
(facoltativo) |
Campo booleano che indica se un partecipante è un bot Interactive Voice Response (IVR) o una persona.
Questi valori vengono trasferiti all’attributo Tipo di partecipante BC per la creazione di rapporti e la visualizzazione dei partecipanti. Se non specificato, il tipo di partecipante CB non avrà alcun valore con obbligo di notifica. |
testo
(obbligatorio) |
Trascrizione vocale.
Attenzione: la somma di tutti gli elementi di testo non può superare i 100.000 caratteri. In caso affermativo, il documento viene ignorato.
|
inizio
(obbligatorio) |
Il tempo di inizio del discorso (in millisecondi trascorsi dall’inizio della conversazione). |
fine
(obbligatorio) |
Il tempo in cui termina il discorso (in millisecondi trascorsi dall’inizio della conversazione). |
contentSegmentType
(obbligatorio) |
Questo parametro identifica il formato di trascrizione, che consente al motore di elaborazione del linguaggio naturale (NLP) di elaborare correttamente i dati.
Valori possibili:
|
campi personalizzati
(facoltativo) |
È possibile fornire più campi per aggiungere attributi strutturati alla conversazione. |
Formattazione JSON per trascrizioni di chiamate
Questa sezione contiene la formattazione JSON per le trascrizioni delle chiamate.
Oggetti di livello superiore
La seguente tabella descrive gli oggetti di livello superiore di un nodo documento.
Elemento | Descrizione |
ID conversazione | Un ID univoco per l’intera conversazione.
È possibile mappare questo campo all’attributo natural_id per utilizzarlo come ID naturale del documento. |
Timestamp conv. | La data e l’ora dell’intera conversazione. Utilizzare il formato ISO 8601 con precisione dei secondi.
È possibile mappare questo campo all’attributo document_date per utilizzarlo come Data documento. |
contenuto | Oggetto che contiene il contenuto della conversazione. Include questi oggetti nidificati:
|
campi personalizzati (attributi) | È possibile fornire più coppie chiave-valore per aggiungere attributi strutturati alla conversazione. |
Oggetto contenuto
La seguente tabella descrive gli oggetti nidificati all’interno dell’oggetto contenuto.
Elemento | Descrizione |
partecipanti | Una matrice di oggetti che fornisce informazioni sui partecipanti alla conversazione. Include i seguenti campi:
|
ConversationContent | Una matrice di oggetti che contiene le linee della conversazione. Include i seguenti campi:
|
contentSegmentType
(obbligatorio) |
Questo parametro identifica il formato di trascrizione, che consente al motore di elaborazione del linguaggio naturale (NLP) di elaborare correttamente i dati.
Valori possibili:
|
Partecipanti oggetto
La seguente tabella descrive i campi nidificati all’interno dell’oggetto partecipante.
Elemento | Descrizione |
participant_id
(obbligatorio) |
L’ID del partecipante. Deve essere univoco per ogni conversazione (documento). |
tipo
(obbligatorio) |
Il tipo di partecipante. Valori possibili:
Questi valori vengono inoltrati all’attributo Tipo di partecipante CB per il reporting e la visualizzazione dei partecipanti. Se non specificato, il tipo di partecipante CB non avrà alcun valore da dichiarare. |
is_ivr
(facoltativo) |
Campo booleano che indica se un partecipante è un bot Interactive Voice Response (IVR) o una persona.
Questi valori vengono trasferiti all’attributo Tipo di partecipante BC per la creazione di rapporti e la visualizzazione dei partecipanti. Se non specificato, il tipo di partecipante CB non avrà alcun valore con obbligo di notifica. |
ConversationContent Object
La seguente tabella descrive i campi nidificati all’interno dell’oggetto conversationContent.
Elemento | Descrizione |
participant_id
(obbligatorio) |
L’ID del partecipante che sta parlando. Deve corrispondere a uno degli ID forniti nella matrice dei partecipanti. |
testo
(obbligatorio) |
Trascrizione vocale.
Attenzione: la somma di tutti gli elementi di testo non può superare i 100.000 caratteri. In caso affermativo, il documento viene ignorato.
|
inizio
(obbligatorio) |
Il tempo di inizio del discorso (in millisecondi trascorsi dall’inizio della conversazione). |
fine
(obbligatorio) |
Il tempo in cui termina il discorso (in millisecondi trascorsi dall’inizio della conversazione). |
Esempio
Di seguito è riportato un esempio di trascrizione di chiamata tra un agente e un client.
[
{
"conversationId": "46289",
"conversationTimestamp": "2020-07-30T10:15:45.000Z",
"content": {
"participant": [
{
"participant_id": "anty,
"type": "AGENT","type" "isisid": "
"participant_id",
"anty" "type": "AGENT",
"false" "isisisid": "
"participant_id",
"anty" "type": "AGENT",
"false": "isisis_
" "participant_id": "anty
"type "type": "AGENT",
"false": "isisisisid": "
"participant_id -": "anty" "type": "AGENT",
"false": "
",
"start": 22000,
"end": 32000
},
{
"participant_id": "2",
"text": "Ciao, ho un paio di domande.",
"start": 32000,
"end": 42000
}
],
"contentSegmentType": "TURN"
},
"
city": "Boston"
Formattazione WebVTT per trascrizioni di chiamate
È possibile caricare trascrizioni di chiamata utilizzando la formattazione WebVTT.
La Data documento viene rilevata automaticamente dal nome del file, se disponibile. Per impostare automaticamente la data del documento, assicurarsi che il nome del file inizi con il seguente prefisso
<Timezone><YYYY><MM><DD>:
Se i nomi dei file utilizzano un formato diverso, applicare una trasformazione della data al campo Data documento nella fase di mapping. Per i dettagli, consultare Impostazione di una data documento specifica.
Esempio
Ecco un esempio di trascrizione di una chiamata Zoom in formato WebVTT.
WEBVTT
1
00:00:00.599 --> 00:00:02.280
John Smith: Va bene così che io
2
00:00:04.230 --> 00:00:05.339
John Smith: iniziare a
condividere
Sì 00
:
12.809 --&My
John:
00
:400:00
;