Aufruf von Transkripten in Datenformaten
Datenformate für Anrufprotokolle
Mit XM Discover können Sie Transkripte (d.h. Transkripte von Audio-Konversationen) im CSV-, Excel-, JSON- oder WebVTT-Format aufrufen. Anrufprotokolle identifizieren die Teilnehmer in einer Unterhaltung und ordnen jede Nachricht einem Teilnehmer zu.
In der Regel enthalten Anrufprotokolle eine Reihe strukturierter und unstrukturierter Datenfelder, die ein Gespräch zwischen einem Kunden und einer Entität in Ihrem Unternehmen darstellen (z.B. das Protokoll zwischen einem Kunden und Ihrem automatisierten Telefondienst oder das Anrufprotokoll zwischen einem Kunden und einem Live-Support-Mitarbeiter). Strukturierte Felder können Daten, Zahlen oder Textdaten mit einem hohen Organisationsgrad enthalten (z.B. Namen von Marken, Teilnehmernamen und Produkte). Unstrukturierte Felder enthalten Notizen, Kommentare und andere Freitextfelder.
Sie können einen Anruf über die folgenden Formate hochladen:
- CSV
- XLS oder XLSX (Microsoft Excel)
- JSON
- WebVTT
CSV- und Excel-Formatierung für Anrufprotokolle
Dieser Abschnitt behandelt die Formatierung von Anrufprotokollen für CSV- und Excel-Dateien. Die Formatierung und die Anforderungen für beide Dateitypen sind identisch.
In CSV- und Excel-Dateien werden Anrufprotokolle mehrzeilig definiert. So funktioniert das System:
- Jede Zeile enthält eine einzelne Dialogzeile in einer Unterhaltung zusammen mit Teilnehmerdaten und einem Zeitstempel.
- Getrennte Zeilen werden in eine einzelne Konversation übertragen, indem dieselbe Conversation-ID verwendet wird.
- Conversation-weite Feldwerte (wie Dokumentdatum oder benutzerdefinierte Attribute) werden aus der ersten Zeile der Unterhaltung übernommen.
Element | Beschreibung |
ConversationId
(erforderlich) |
Eine eindeutige ID für die gesamte Konversation. Jede Zeile mit derselben ID wird als separate Zeile innerhalb einer einzelnen Konversation behandelt.
Sie können dieses Feld dem Attribut natural_id zuordnen, um es als natürliche ID des Dokuments zu verwenden. |
conversationTimestamp
(Erforderlich) |
Datum und Uhrzeit des gesamten Gesprächs. Verwenden Sie das ISO-8601-Format mit Sekundengenauigkeit.
Sie können dieses Feld dem Attribut document_date zuordnen, um es als Belegdatum zu verwenden. |
ParticipantId
(erforderlich) |
Die ID des Teilnehmers. Muss pro Konversation (Dokument) eindeutig sein. |
ParticipantType
(Erforderlich) |
Der Typ des Teilnehmers. Mögliche Werte:
Diese Werte werden zur Berichterstellung und zur Visualisierung der Teilnehmer an das Attribut CB-Teilnehmertyp übergeben. Wenn nicht angegeben, hat die Teilnehmerart der Zentralbank keinen berichtspflichtigen Wert. |
is_ivr
(optional) |
Ein boolesches Feld, das angibt, ob ein Teilnehmer ein IVR-Bot (Interactive Voice Response) oder eine Person ist.
Diese Werte werden zur Berichterstellung und zur Visualisierung der Teilnehmer an das Attribut CB-Art des Teilnehmers übergeben. Wenn nicht angegeben, hat die CB-Art des Teilnehmers keinen berichtspflichtigen Wert. |
Text
(erforderlich) |
In: Speech Transcript.
Achtung: Eine Summe aller Textelemente darf 100.000 Zeichen nicht überschreiten. Ist dies der Fall, wird der Beleg übersprungen.
|
Start
(erforderlich) |
Die Zeit, zu der die Rede beginnt (in Millisekunden, die seit Beginn der Unterhaltung vergangen sind). |
end
(obligatorisch) |
Die Zeit, zu der die Rede endet (in Millisekunden, die seit Beginn der Unterhaltung vergangen sind). |
contentSegmentType
(Erforderlich) |
Dieser Parameter identifiziert das Transkriptformat, das es der NLP-Engine (Natural Language Processing) ermöglicht, Daten korrekt zu verarbeiten.
Mögliche Werte:
|
Benutzerdefinierte Felder
(optional) |
Sie können mehrere Felder bereitstellen, um der Konversation strukturierte Attribute hinzuzufügen. |
JSON-Formatierung für Anrufprotokolle
Dieser Abschnitt enthält die JSON-Formatierung für Anrufprotokolle.
Objekte der obersten Ebene
In der folgenden Tabelle werden die Objekte der obersten Ebene eines Dokumentknotens beschrieben.
Element | Beschreibung |
ConversationId | Eine eindeutige ID für die gesamte Konversation.
Sie können dieses Feld dem Attribut natural_id zuordnen, um es als natürliche ID des Dokuments zu verwenden. |
conversationTimestamp | Datum und Uhrzeit des gesamten Gesprächs. Verwenden Sie das ISO-8601-Format mit Sekundengenauigkeit.
Sie können dieses Feld dem Attribut document_date zuordnen, um es als Belegdatum zu verwenden. |
Inhalt | Ein Objekt, das den Inhalt der Konversation enthält. Umfasst die folgenden verschachtelten Objekte:
|
Benutzerdefinierte Felder (Attribute) | Sie können mehrere Schlüssel-Wert-Paare angeben, um der Konversation strukturierte Attribute hinzuzufügen. |
Inhaltsobjekt
In der folgenden Tabelle werden die im Inhaltsobjekt verschachtelten Objekte beschrieben.
Element | Beschreibung |
Teilnehmer:innen | Eine Reihe von Objekten, die Informationen über die Teilnehmer der Konversation bereitstellen. Umfasst die folgenden Felder:
|
ConversationContent | Ein Array von Objekten, das die Zeilen der Konversation enthält. Umfasst die folgenden Felder:
|
contentSegmentType
(obligatorisch) |
Dieser Parameter identifiziert das Transkriptformat, das es der NLP-Engine (Natural Language Processing) ermöglicht, Daten korrekt zu verarbeiten.
Mögliche Werte:
|
Akteurs-Objekt
In der folgenden Tabelle werden die Felder beschrieben, die im Teilnehmerobjekt verschachtelt sind.
Element | Beschreibung |
Participant_id
(erforderlich) |
Die ID des Teilnehmers. Muss pro Konversation (Dokument) eindeutig sein. |
type
(Erforderlich) |
Der Typ des Teilnehmers. Mögliche Werte:
Diese Werte werden zur Berichterstellung und zur Visualisierung der Teilnehmer an das Attribut CB-Teilnehmertyp übergeben. Wenn nicht angegeben, hat die Teilnehmerart der Zentralbank keinen berichtspflichtigen Wert. |
is_ivr
(optional) |
Ein boolesches Feld, das angibt, ob ein Teilnehmer ein IVR-Bot (Interactive Voice Response) oder eine Person ist.
Diese Werte werden zur Berichterstellung und zur Visualisierung der Teilnehmer an das Attribut CB-Art des Teilnehmers übergeben. Wenn nicht angegeben, hat die CB-Art des Teilnehmers keinen berichtspflichtigen Wert. |
conversationContent-Objekt
In der folgenden Tabelle werden die Felder beschrieben, die innerhalb des ConversationContent-Objekts verschachtelt sind.
Element | Beschreibung |
Participant_id
(Erforderlich) |
Die ID des Teilnehmers, der spricht. Muss mit einer der im Teilnehmer-Array angegebenen IDs übereinstimmen. |
Text
(erforderlich) |
In: Speech Transcript.
Achtung: Eine Summe aller Textelemente darf 100.000 Zeichen nicht überschreiten. Ist dies der Fall, wird der Beleg übersprungen.
|
Start
(erforderlich) |
Die Zeit, zu der die Rede beginnt (in Millisekunden, die seit Beginn der Unterhaltung vergangen sind). |
end
(obligatorisch) |
Die Zeit, zu der die Rede endet (in Millisekunden, die seit Beginn der Unterhaltung vergangen sind). |
Beispiel
Hier ist ein Beispiel für ein Anruftranskript zwischen einem Agent und einem Client.
[
{
"conversationId": "46289",
"conversationTimestamp": "2020-07-30T10:15:45.000Z",
"content": {
"teilnehmender Teilnehmer":
partizipativer "
ant_id": "1",
"false" "type" "isr}
" "
isr
",
"start": 22000,
"end": 32000
},
{
"Participant_id": "2",
"text": "Hi, I have a some Questions.",
"start": 32000,
"end": 42000
],
"contentSegmentType": "TURN"
},
"city" "city": "Boston" ] "Boston
" }
WebVTT-Formatierung für Anrufprotokolle
Sie können Anrufprotokolle mit WebVTT-Formatierung hochladen.
Das Belegdatum wird automatisch aus dem Dateinamen übernommen, sofern verfügbar. Um das Belegdatum automatisch festzulegen, stellen Sie sicher, dass der Dateiname mit
<Timezone><YYYY><MM><DD>dem
folgenden Präfix beginnt:
Wenn die Dateinamen ein anderes Format verwenden, wenden Sie eine Datumstransformation auf das Feld Belegdatum im Zuordnungsschritt an. Weitere Informationen finden Sie unter Festlegen eines bestimmten Belegdatums.
Beispiel
Im Folgenden finden Sie ein Beispiel für ein Zoom-Anrufprotokoll im WebVTT-Format.
WEBVTT
1
00:00:00.599 --> 00:00:02.280
John Smith: Alright so let me
2
00:00:04.230 --> 00:00:00:05.339
John Smith: start sharing
3
00 00 00:12.809 --&&Smith gt; 00:00:gt -