Qualtrics Platform
Customer Journey Optimizer
XM Discover
Qualtrics Social Connect

Transcriptions d’appels Formats de données

À propos des formats de données des transcriptions d’appels

XM Discover vous permet d’appeler des transcriptions (c’est-à-dire des transcriptions de conversations audio) au format CSV, Excel, JSON ou WebVTT. Les transcriptions d’appels permettent d’identifier les participants à une conversation et d’attribuer chaque message à un participant.

Généralement, les transcriptions d’appels contiennent un certain nombre de champs de données structurés et non structurés qui représentent une conversation entre un client et une entité de votre entreprise (par exemple, la transcription entre un client et votre service téléphonique automatisé, ou la transcription de l’appel entre un client et un représentant de l’assistance en direct). Les champs structurés peuvent contenir des dates, des nombres ou des données textuelles avec un haut degré d’organisation (comme les noms des organisations, les noms des participants et les produits). Les champs non structurés contiennent des notes, des commentaires et d’autres champs de question ouverte.

Vous pouvez télécharger l’appel dans les formats suivants :

CSV
XLS ou XLSX (Microsoft Excel)
JSON
WebVTT

Formatage CSV et Excel pour les transcriptions d’appels

Cette section traite du formatage des transcriptions d’appels pour les fichiers CSV et Excel. Le formatage et les exigences pour les deux types de fichiers sont les mêmes.

Dans les fichiers CSV et Excel, les transcriptions d’appels sont définies à l’aide de plusieurs lignes. Découvrez l’univers de de l’XM :

Chaque ligne contient une ligne de dialogue individuelle dans une conversation, ainsi que les données du participant et un horodatage.
Des lignes distinctes sont regroupées en une seule conversation en partageant le même identifiant de conversation.
Les valeurs des champs personnalisés (tels que la date du document ou les attributs personnalisés) sont tirées de la première ligne de la conversation.

Élément

Description

conversationId

(Obligatoire)

Un identifiant unique pour l’ensemble de la conversation. Chaque ligne ayant le même identifiant est traitée comme une ligne distincte au sein d’une même conversation.

Vous pouvez associer ce champ à l’attribut natural_id pour l’utiliser comme identifiant naturel du document.

conversationTimestamp

(Obligatoire)

La date et l’heure de l’ensemble de la conversation. Utilisez le format ISO 8601 avec la précision de la seconde.

Vous pouvez associer ce champ à l’attribut document_date pour l’utiliser comme date du document.

participantId

(Obligatoire)

L’identifiant du participant. Doit être unique par conversation (document).

participantType

(Obligatoire)

Le type de participant. Valeurs possibles :

AGENT : Indique un représentant de l’entreprise ou un chatbot.
CLIENT : Indique un client.
TYPE_UNKNOWN : Indique un participant non identifié.

Ces valeurs sont transmises à l’attribut CB Participant Type pour l’établissement de rapports et la visualisation des participants.

S’il n’est pas spécifié, le type de participant CB n’aura pas de valeur à déclarer.

is_ivr

(Facultatif)

Champ booléen indiquant si un participant est un robot de réponse vocale interactive (SVI) ou une personne.

true : Indique un robot IVR.
faux : Indique une personne.

Ces valeurs sont transmises à l’attribut CB Kind of Participant pour l’établissement de rapports et la visualisation des participants.

S’il n’est pas spécifié, le type de participant CB n’aura pas de valeur à déclarer.

text

(Obligatoire)

Transcription du discours.

Attention : La somme de tous les éléments de texte ne doit pas dépasser 100 000 caractères. Dans le cas contraire, le document est ignoré.

start

(Obligatoire)

L’heure à laquelle le discours commence (en millisecondes écoulées depuis le début de la conversation).

end

(Obligatoire)

L’heure à laquelle le discours se termine (en millisecondes écoulées depuis le début de la conversation).

contentSegmentType

(Obligatoire)

Ce paramètre identifie le format de la transcription, ce qui permet au moteur de traitement du langage naturel (NLP) de traiter correctement les données.

Valeurs possibles :

TOKEN : Les données chronométrées sont fournies mot par mot.
SENTENCE : Les données chronométrées sont fournies une phrase à la fois.
TURN : Les données chronométrées sont fournies un tour de parole à la fois.

custom fields

(Facultatif)

Vous pouvez fournir plusieurs champs pour ajouter des attributs structurés à la conversation.

Formatage JSON pour les transcriptions d’appel

Cette section contient le formatage JSON pour les transcriptions d’appels.

Objets de niveau supérieur

Le tableau suivant décrit les objets de niveau supérieur d’un nœud de document.

Élément	Description
`conversationId`	Un identifiant unique pour l’ensemble de la conversation. Vous pouvez associer ce champ à l’attribut `natural_id` pour l’utiliser comme identifiant naturel du document.
`conversationTimestamp`	La date et l’heure de l’ensemble de la conversation. Utilisez le format ISO 8601 avec la précision de la seconde. Vous pouvez associer ce champ à l’attribut `document_date` pour l’utiliser comme date du document.
`content`	Un objet qui contient le contenu de la conversation. Comprend ces objets imbriqués : `participants` `conversationContent` `contentSegmentType`
champs personnalisés (attributs)	Vous pouvez fournir plusieurs paires clé-valeur pour ajouter des attributs structurés à la conversation.

contenu Objet

Le tableau suivant décrit les objets imbriqués dans l’objet de contenu.

Élément	Description
`participants`	Un tableau d’objets qui fournit des informations sur les participants à la conversation. Comprend les champs suivants : `participant_id` `type` `is_ivr`
`conversationContent`	Un tableau d’objets contenant les lignes de la conversation. Comprend les champs suivants : `participant_id` `text` `start` `end`
`contentSegmentType` (obligatoire)	Ce paramètre identifie le format de la transcription, ce qui permet au moteur de traitement du langage naturel (NLP) de traiter correctement les données. Valeurs possibles : TOKEN : Les données chronométrées sont fournies mot par mot. SENTENCE : Les données chronométrées sont fournies une phrase à la fois. TURN : Les données chronométrées sont fournies un tour de parole à la fois.

participants Objet

Le tableau suivant décrit les champs imbriqués dans l’objet participant.

Élément

Description

participant_id

(obligatoire)

L’identifiant du participant. Doit être unique par conversation (document).

type

(Obligatoire)

Le type de participant. Valeurs possibles :

AGENT : Indique un représentant de l’entreprise ou un chatbot.
CLIENT: Indique un client.
TYPE_UNKNOWN: Indique un participant non identifié.

Ces valeurs sont transmises à l’attribut CB Participant Type pour l’établissement de rapports et la visualisation des participants.

S’il n’est pas spécifié, le type de participant CB n’aura pas de valeur à déclarer.

is_ivr

(Facultatif)

Champ booléen indiquant si un participant est un robot de réponse vocale interactive (SVI) ou une personne.

true : Indique un robot IVR.
false:Indique une personne.

Ces valeurs sont transmises à l’attribut CB Kind of Participant pour l’établissement de rapports et la visualisation des participants.

S’il n’est pas spécifié, le type de participant CB n’aura pas de valeur à déclarer.

objet conversationContent

Le tableau suivant décrit les champs imbriqués dans l’objet conversationContent.

Élément	Description
`participant_id` (Obligatoire)	L’identifiant du participant qui parle. Doit correspondre à l’un des identifiants fournis dans le tableau des participants.
`text` (Obligatoire)	Transcription du discours. Attention : La somme de tous les éléments de texte ne doit pas dépasser 100 000 caractères. Dans le cas contraire, le document est ignoré.
`start` (Obligatoire)	L’heure à laquelle le discours commence (en millisecondes écoulées depuis le début de la conversation).
`end` (Obligatoire)	L’heure à laquelle le discours se termine (en millisecondes écoulées depuis le début de la conversation).

Exemple

Voici un exemple de transcription d’appel entre un agent et un client.

[

{

"conversationId" : "46289", "conversationTimestamp" : "2020-07-30T10:15:45.000Z", "content" : { "participants" : [ ] { "participant_id" : "1", "type" : "AGENT", "is_ivr" : false }, { "participant_id" : "2", "type" : "CLIENT", "is_ivr" : false } ], "conversationContent" : [ { "participant_id" : "1", "text" : "Ici Emily, comment puis-je vous aider ?", "start" : 22000, "end" : 32000 }, { "participant_id" : "2", "text" : "Bonjour, j'ai quelques questions à poser", "start" : 32000, "end" : 42000 } ], "contentSegmentType" : "TURN" }, "city" : "Boston", "source" : "Call Center" } ]

Formatage WebVTT pour les transcriptions d’appels

Vous pouvez télécharger des transcriptions d’appels en utilisant le formatage WebVTT.

La date du document est automatiquement extraite du nom du fichier si elle est disponible. Pour définir automatiquement la date du document, assurez-vous que le nom du fichier commence par le préfixe suivant :

<Timezone><YYYY><MM><DD>-

Exemple : GMT20201011-meeting.vtt

Si les noms de champ utilisent un format différent, appliquez une transformation de date au champ Date du document à l’étape des correspondances. Pour plus de détails, veuillez consulter la section Définition d’une date de document spécifique.

Exemple

Voici un exemple de transcription d’un appel Zoom au format WebVTT.

WEBVTT 1 00:00:00.599 --> ; 00:00:02.280 John Smith : D'accord, laissez-moi 2 00:00:04.230 --> ; 00:00:05.339 John Smith : commencer à partager 3 00:00:12.809 --> ; 00:00:13.469 John Smith : Mon écran. 4 00:00:15.750 --> ; 00:00:18.119 John Smith : Est-ce que tout le monde peut le voir. 5 00:00:19.050 --> ; 00:00:28.890 Paul Jones : Oui, je peux le voir.

De nombreuses pages de ce site ont été traduites de l'anglais en traduction automatique. Chez Qualtrics, nous avons accompli notre devoir de diligence pour trouver les meilleures traductions automatiques possibles. Toutefois, le résultat ne peut pas être constamment parfait. Le texte original en anglais est considéré comme la version officielle, et toute discordance entre l'original et les traductions automatiques ne pourra être considérée comme juridiquement contraignante.

Transcriptions d’appels Formats de données

À propos des formats de données des transcriptions d’appels

Formatage CSV et Excel pour les transcriptions d’appels

Formatage JSON pour les transcriptions d’appel

Objets de niveau supérieur

contenu Objet

participants Objet

objet conversationContent

Exemple

Formatage WebVTT pour les transcriptions d’appels

Exemple

Related Articles

Assistance

Société

Ressources