Modèle d’article
À propos des formats de données des transcriptions d’appels
XM Discover vous permet d’appeler des transcriptions (c’est-à-dire des transcriptions de conversations audio) au format CSV, Excel, JSON ou WebVTT. Les transcriptions d’appels permettent d’identifier les participants à une conversation et d’attribuer chaque message à un participant.
Généralement, les transcriptions d’appels contiennent un certain nombre de champs de données structurés et non structurés qui représentent une conversation entre un client et une entité de votre entreprise (par exemple, la transcription entre un client et votre service téléphonique automatisé, ou la transcription de l’appel entre un client et un représentant de l’assistance en direct). Les champs structurés peuvent contenir des dates, des nombres ou des données textuelles avec un haut degré d’organisation (comme les noms des organisations, les noms des participants et les produits). Les champs non structurés contiennent des notes, des commentaires et d’autres champs de question ouverte.
Vous pouvez télécharger l’appel dans les formats suivants :
- CSV
- XLS ou XLSX (Microsoft Excel)
- JSON
- WebVTT
Formatage CSV et Excel pour les transcriptions d’appels
Cette section traite du formatage des transcriptions d’appels pour les fichiers CSV et Excel. Le formatage et les exigences pour les deux types de fichiers sont les mêmes.
Dans les fichiers CSV et Excel, les transcriptions d’appels sont définies à l’aide de plusieurs lignes. Découvrez l’univers de de l’XM :
- Chaque ligne contient une ligne de dialogue individuelle dans une conversation, ainsi que les données du participant et un horodatage.
- Des lignes distinctes sont regroupées en une seule conversation en partageant le même identifiant de conversation.
- Les valeurs des champs personnalisés (tels que la date du document ou les attributs personnalisés) sont tirées de la première ligne de la conversation.
Élément | Description |
conversationId
(Requis) |
Un identifiant unique pour l’ensemble de la conversation. Chaque ligne ayant le même identifiant est traitée comme une ligne distincte au sein d’une même conversation.
Vous pouvez associer ce champ à l’attribut natural_id pour l’utiliser comme identifiant naturel du document. |
conversationTimestamp
(Requis) |
La date et l’heure de l’ensemble de la conversation. Utiliser le format ISO 8601 avec la précision de la seconde.
Vous pouvez associer ce champ à l’attribut document_date pour l’utiliser comme date du document. |
participantId
(Requis) |
L’identifiant du participant. Doit être unique par conversation (document). |
participantType
(Obligatoire) |
Le type de participant. Valeurs possibles :
Ces valeurs sont transmises à l’attribut CB Participant Type pour l’établissement de rapports et la visualisation des participants. S’il n’est pas spécifié, le type de participant CB n’aura pas de valeur à déclarer. |
is_ivr
(Facultatif) |
Champ booléen indiquant si un participant est un robot de réponse vocale interactive (SVI) ou une personne.
Ces valeurs sont transmises à l’attribut CB Kind of Participant pour l’établissement de rapports et la visualisation des participants. S’il n’est pas spécifié, le type de participant à la CB n’aura aucune valeur à déclarer. |
texte
(Obligatoire) |
Transcription du discours.
Attention : La somme de tous les éléments de texte ne doit pas dépasser 100 000 caractères. Dans le cas contraire, le document est ignoré.
|
début
(Obligatoire) |
L’heure à laquelle le discours commence (en millisecondes écoulées depuis le début de la conversation). |
fin
(Obligatoire) |
L’heure à laquelle le discours se termine (en millisecondes écoulées depuis le début de la conversation). |
contentSegmentType
(Requis) |
Ce paramètre identifie le format de la transcription, ce qui permet au moteur de traitement du langage naturel (NLP) de traiter correctement les données.
Valeurs possibles :
|
champs personnalisés
(Facultatif) |
Vous pouvez fournir plusieurs champs pour ajouter des attributs structurés à la conversation. |
Formatage JSON pour les transcriptions d’appel
Cette section contient le formatage JSON pour les transcriptions d’appels.
Objets de niveau supérieur
Le tableau suivant décrit les objets de niveau supérieur d’un nœud de document.
Élément | Description |
conversationId | Un identifiant unique pour l’ensemble de la conversation.
Vous pouvez associer ce champ à l’attribut natural_id pour l’utiliser comme identifiant naturel du document. |
conversationTimestamp | La date et l’heure de l’ensemble de la conversation. Utilisez le format ISO 8601 avec la précision de la seconde.
Vous pouvez associer ce champ à l’attribut document_date pour l’utiliser comme date du document. |
contenu | Un objet qui contient le contenu de la conversation. Comprend ces objets imbriqués :
|
champs personnalisés (attributs) | Vous pouvez fournir plusieurs paires clé-valeur pour ajouter des attributs structurés à la conversation. |
contenu Objet
Le tableau suivant décrit les objets imbriqués dans l’objet de contenu.
Élément | Description |
participants | Un tableau d’objets qui fournit des informations sur les participants à la conversation. Comprend les champs suivants :
|
contenu de la conversation | Un tableau d’objets contenant les lignes de la conversation. Comprend les champs suivants :
|
contentSegmentType
(obligatoire) |
Ce paramètre identifie le format de la transcription, ce qui permet au moteur de traitement du langage naturel (NLP) de traiter correctement les données.
Valeurs possibles :
|
participants Objet
Le tableau suivant décrit les champs imbriqués dans l’objet participant.
Élément | Description |
participant_id
(obligatoire) |
L’identifiant du participant. Doit être unique par conversation (document). |
type
(Obligatoire) |
Le type de participant. Valeurs possibles :
Ces valeurs sont transmises à l’attribut CB Participant Type pour l’établissement de rapports et la visualisation des participants. S’il n’est pas spécifié, le type de participant CB n’aura pas de valeur à déclarer. |
is_ivr
(Facultatif) |
Champ booléen indiquant si un participant est un robot de réponse vocale interactive (SVI) ou une personne.
Ces valeurs sont transmises à l’attribut CB Kind of Participant pour l’établissement de rapports et la visualisation des participants. S’il n’est pas spécifié, le type de participant CB n’aura pas de valeur à déclarer. |
objet conversationContent
Le tableau suivant décrit les champs imbriqués dans l’objet conversationContent.
Élément | Description |
participant_id
(Obligatoire) |
L’identifiant du participant qui parle. Doit correspondre à l’un des identifiants fournis dans le tableau des participants. |
texte
(Obligatoire) |
Transcription du discours.
Attention : La somme de tous les éléments de texte ne doit pas dépasser 100 000 caractères. Dans le cas contraire, le document est ignoré.
|
début
(Obligatoire) |
L’heure à laquelle le discours commence (en millisecondes écoulées depuis le début de la conversation). |
fin
(Obligatoire) |
L’heure à laquelle le discours se termine (en millisecondes écoulées depuis le début de la conversation). |
Exemple
Voici un exemple de transcription d’appel entre un agent et un client.
[
{
"conversationId" : "46289",
"conversationTimestamp" : "2020-07-30T10:15:45.000Z",
"content" : {
"participants" : [
] {
"participant_id" : "1",
"type" : "AGENT",
"is_ivr" : false
},
{
"participant_id" : "2",
"type" : "CLIENT",
"is_ivr" : false
}
],
"conversationContent" : [
{
"participant_id" : "1",
"text" : "Ici Emily, comment puis-je vous aider ?",
"start" : 22000,
"end" : 32000
},
{
"participant_id" : "2",
"text" : "Bonjour, j'ai quelques questions à poser",
"start" : 32000,
"end" : 42000
}
],
"contentSegmentType" : "TURN"
},
"city" : "Boston",
"source" : "Call Center"
}
]
Formatage WebVTT pour les transcriptions d’appels
Vous pouvez télécharger des transcriptions d’appels en utilisant le formatage WebVTT.
La date du document est automatiquement extraite du nom du fichier si elle est disponible. Pour définir automatiquement la date du document, assurez-vous que le nom du fichier commence par le préfixe suivant
<Timezone><YYYY><MM><DD>:-
Si les noms de champ utilisent un format différent, appliquez une transformation de date au champ Date du document à l’étape des correspondances. Pour plus de détails, veuillez consulter la section Définition d’une date de document spécifique.
Exemple
Voici un exemple de transcription d’un appel Zoom au format WebVTT.
WEBVTT
1
00:00:00.599 --> ; 00:00:02.280
John Smith : D'accord, laissez-moi
2
00:00:04.230 --> ; 00:00:05.339
John Smith : commencer à partager
3
00:00:12.809 --> ; 00:00:13.469
John Smith : Mon écran.
4
00:00:15.750 --> ; 00:00:18.119
John Smith : Est-ce que tout le monde peut le voir.
5
00:00:19.050 --> ; 00:00:28.890
Paul Jones : Oui, je peux le voir.