Attribute Grundübersicht
Attribute – Allgemeine Übersicht
Ein Attribut ist eine Eigenschaft eines Dokuments, die es in irgendeiner Weise charakterisiert. Allgemeine Beispiele für Attribute sind der Name des Autors und das Erstellungsdatum.
Sie können benutzerdefinierte Attribute für Ihre Projekte anlegen. Es gibt auch eine Vielzahl von Systemattributen, die Sie verwenden können. Sie können auch intelligente Entitäten einrichten, die Attribute basierend auf dem Belegtext automatisch ermitteln (z.B. wenn eine Marke oder ein Produkt im Feedback eines Kunden erwähnt wird).
Nachdem Sie Attribute hinzugefügt haben, können Sie zusätzliche abgeleitete Attribute anlegen, um Ihre Daten besser zu verstehen. Sie können Ihre Attribute auch in Attributgruppen organisieren, was die Auswertung dieser Attribute erleichtert.
Attributfeldtypen
Folgende Feldtypen werden für Attribute unterstützt:
- Text
- Zahl
- Datum
Zugriff auf Attribute
Attribute werden auf Projektebene verwaltet. So greifen Sie auf die Attribute für ein Projekt zu:
- Wechseln Sie in Designer zur Registerkarte Admin, und suchen Sie das Projekt, an dem Sie interessiert sind.
- Klicken Sie in der Spalte Aktionen auf die Option Attribute.
Dadurch wird die Attributtabelle geöffnet, die die folgenden Informationen zu jedem Attribut im Projekt enthält:
- Name: Der Systemname des Attributs. Weitere Informationen zu den Benennungsanforderungen finden Sie unter Attributbenennung.
- Anzeigename: Der Anzeigename des Attributs, der in Berichten, Filtern usw. angezeigt wird. Weitere Informationen zu den Benennungsanforderungen finden Sie unter Attributbenennung.
- Typ: Der Typ des Attributs. Für Standardattribute können die Werte Text, Zahl oder Datum sein. Für abgeleitete Attribute können die Werte Dimensionaler Lookup, Bereichs-Rollup, Zufriedenheitswert oder Aus Kategorie abgeleitet sein.
- Gruppe: Die Gruppe des Attributs, die den Ursprung und den Verwendungszweck des Attributs darstellt. Folgende Werte stehen zur Verfügung:
- Kategorie abgeleitet: Attribute, die aus Modellen oder Kategorien abgeleitet wurden.
- System: Systemattribute.
- Kundendefiniert: alle benutzerdefinierten Attribute, die aus der Datenquelle Ihrer Wahl verfügbar sind (einschließlich dimensionaler Lookups, Bereichs-Rollups und Zufriedenheits-Scores).
- Scorecard: Attribute, die im intelligenten Scoring verwendet werden.
- Für Berichterstellung aktivieren: Zeigt an, ob ein Attribut für die Berichterstellung aktiviert ist (Ein) oder nicht (Aus).
- Groß-/Kleinschreibung beachten: Zeigt an, ob ein Attribut beim Anzeigen von Werten im Dokument-Explorer, im Quellen-Highlighter, im benutzerdefinierten Export und beim Export in der Satzvorschau als Groß-/Kleinschreibung gekennzeichnet ist.
- Drill-Pfad: Zeigt den benutzerdefinierten Drill-Pfad an, wenn er definiert wurde. Wenn kein benutzerdefinierter Drill-Pfad vorhanden ist, ist dieses Feld leer.
- E-Mail-Feld: Zeigt an, ob ein Attribut eine E-Mail-Adresse enthält.
- DocValue aktivieren: Zeigt an, ob ElasticSearch-Dokumentwerte für dieses Attribut verwendet werden.
- Mehrwertiges Trennzeichen aktivieren: Zeigt an, ob mehrere Werte für dieses Attribut aktiviert sind.
- Übergeordnet: Wenn das Attribut ein abgeleitetes Attribut ist, wird in diesem Feld „übergeordnetes Attribut“ angezeigt. Dieses Feld ist für benutzerdefinierte Attribute und Standardattribute leer.
- Aktionen: Führen Sie die folgenden Aktionen für das Attribut aus:
- Attribut bearbeiten
- Abgeleitetes Attribut anlegen
- Attribut löschen
Attributgruppen verwalten
Verwenden Sie die Umschaltfläche Attributgruppen oben auf der Seite, um Ihre Attributgruppen anzuzeigen. Auf diese Weise können Sie neue Attributgruppen anlegen und vorhandene löschen. Wählen Sie Attribute, um Ihre individuellen Attribute anzuzeigen.
Systemattribute
Es gibt eine Reihe von Systemattributen, z.B. Belegdatum und Quell-ID, die automatisch auf jedes Dokument angewendet werden, das in XM Discover hochgeladen wird. Mit diesen Attributen können Sie Feedback in XM Discover verwalten und mit XM-Daten anreichern, die von der NLP-Engine abgeleitet wurden.
Nachfolgend finden Sie eine Tabelle der verschiedenen Systemattribute, gruppiert nach den verschiedenen Attributkategorien. Diese Tabelle enthält zu jedem Attribut folgende Informationen:
- Name: Der Attributname, der in Berichten, Filtern usw. angezeigt wird.
- Systemname: Der Systemname des Attributs, mit dem Sie Ihre Daten abfragen oder filtern.
- Typ: Der Attributtyp.
- Beschreibung: Eine kurze Beschreibung der Bedeutung und des Zwecks des Attributs.
- Granularität: Die mit einem Attribut verknüpfte Datengranularitätsebene. Beispiel: Satzwortanzahl ist nur auf Satzebene relevant, während das Dokumentdatum sowohl für ein Dokument als auch für jeden Satz in diesem Dokument verfügbar ist.
IDs und Referenzen
Name | Systemname | Typ | Beschreibung | Granularität |
Dokument-ID | _id_document | Nummer | Die eindeutige System-ID des Dokuments. Im Gegensatz zur natürlichen ID wird die Dokument-ID automatisch von XM Discover generiert. | Dokument und Satz |
Natürliche ID | natural_id | Text | Die eindeutige natürliche ID des Dokuments. Im Gegensatz zur Dokument-ID wird die natürliche ID aus den beim Hochladen eines Dokuments angegebenen Feldern generiert. Die natürliche ID wird von der Dublettenerkennung verwendet und kann auch nützlich sein, wenn das Dokument zu seiner Quelle außerhalb von XM Discover verfolgt wird. | Dokument und Satz |
Satz-ID | _id_record | Nummer | Die eindeutige ID des Satzes. Diese ID wird automatisch generiert.
|
Satz |
Sitzungs-ID | _id_batch | Nummer | Die eindeutige ID der Upload-Sitzung, während der das Dokument in XM Discover geladen wurde. Diese ID wird automatisch generiert. | Dokument und Satz |
Quell-ID | _id_source | Text | Der Name der Datenquelle. Abhängig von der Datenquelle kann sie entweder automatisch oder aus den beim Hochladen des Dokuments angegebenen Feldern generiert werden. | Dokument und Satz |
Ausführliche ID | _id_wörtlich | Nummer | Die eindeutige ID des ausführlichen Begriffs. Diese ID wird automatisch generiert. | Wortlaut und Satz |
Ausführlicher Typ | _verbatimtype | Text | Der Name des ausführlichen Feldes. Mit diesem Attribut können Sie Sätze nach verschiedenen ausführlichen Feldern in Ihren Daten unterscheiden. | Wortlaut und Satz |
Datum und Uhrzeit
Name | Systemname | Typ | Beschreibung | Granularität |
VB Erstellungsdatum | cb_date_created_utc | Datum, Epochenzeit in Millisekunden | Das Datum, an dem das Dokument zu XM Discover hinzugefügt wurde. Dieses Datum wird automatisch generiert. | Dokument und Satz |
VB Aktualisierungsdatum | cb_date_updated | Datum, Epochenzeit in Millisekunden | Das Datum, an dem das Dokument zuletzt aktualisiert wurde. Aktualisierungen enthalten keine Kategorisierungsänderungen. Dieses Datum wird automatisch generiert. | Dokument |
Belegdatum | _doc_time | Datum, ISO 8601 in Sekunden | Das primäre Datum des Belegs. Das Dokumentdatum wird in Berichten, Trendberichten, Warnungen usw. verwendet. Dieses Datum wird aus den beim Hochladen des Dokuments angegebenen Feldern generiert. | Dokument und Satz |
Belegdatum ohne Uhrzeit | _doc_date | Datum, Format JJJJ-MM-TT | Das Datum des Dokuments ohne Zeitstempel.
Dieses Datum wird aus den beim Hochladen des Dokuments angegebenen Feldern generiert. |
Dokument und Satz |
Tageszeit | Zeit_des_Tages | Text, Format hh:mm | Die Uhrzeit des Dokuments, die auf die Stunde heruntergerollt wurde. Beispielsweise werden Kommentare, die um 9:09 und 9:59 gepostet wurden, auf 9:00 hochgerollt. Dieses Attribut wird automatisch generiert. | Dokument und Satz |
Anzahl und Position von Wörtern
Name | Systemname | Typ | Beschreibung | Granularität |
CB-Dokument – Word-Anzahl | cb_document_word_count | Nummer | Die Anzahl der Wörter in einem Dokument. Die Dokumentwortanzahl ist die Summe aller Satzwortanzahlen.
|
Dokument und Satz |
CB Satzquartil | cb_sentence_quartile | Nummer | Der Teil des Wortlauts, in den ein Satz fällt. Dieses Attribut kann einen der folgenden Werte haben: 1, 2, 3 oder 4. Jeder Abschnitt entspricht 25 % der gesamten ausführlichen Länge. | Satz |
CB Satzwortanzahl | cb_sentence_word_count | Nummer | Die Anzahl der Wörter in einem Satz. | Satz |