Aperçu général des attributs
À propos de la synthèse générale des attributs
Un attribut est une propriété d’un document qui le caractérise d’une manière ou d’une autre. Le nom de l’auteur et la date de création sont des exemples courants d’attributs.
Vous pouvez créer des attributs personnalisés pour vos projets. Il existe également une variété d’attributs système que vous pouvez utiliser. Vous pouvez également configurer des entités intelligentes qui détectent automatiquement les attributs en fonction du texte du document (par exemple, lorsqu’une marque ou un produit est mentionné dans le feedback d’un client).
Après avoir ajouté des attributs, il est possible de créer des attributs dérivés supplémentaires pour mieux comprendre vos données. Vous pouvez également organiser vos attributs en ensembles d’attributs, ce qui facilite le reporting de ces attributs.
Types de zone d’attribut
Les types de zones suivants sont pris en charge pour les attributs :
- Texte
- Nombre
- Date
Accès aux attributs
Les attributs sont gérés au niveau du projet. Pour accéder aux attributs d’un projet :
- Dans Designer, accédez à l’onglet Admin et recherchez le projet qui vous intéresse.
- Cliquez sur l’option Attributs dans la colonne Actions.
La table des attributs contenant les informations suivantes sur chaque attribut du projet s’ouvre :
- Nom : nom du système de l’attribut. Voir Attribution d’un nom d’attribut pour connaître les exigences d’appellation.
- Nom d’affichage : nom d’affichage de l’attribut, qui apparaît dans les rapports, les filtres, etc. Voir Attribution d’un nom d’attribut pour connaître les exigences d’appellation.
- Type : type de l’attribut. Pour les attributs standard, les valeurs peuvent être Texte, Nombre ou Date. Pour les attributs dérivés, les valeurs peuvent être Recherche dimensionnelle, Cumul d’intervalles, Score de satisfaction ou Dérivé de la catégorie.
- Groupe : groupe de l’attribut qui représente son origine et son utilisation prévue. Les valeurs sont l’une des suivantes :
- Catégorie dérivée : attributs dérivés de modèles ou de catégories.
- Système : attributs système.
- Défini par le client : tous les attributs personnalisés disponibles à partir de la source de données de votre choix (y compris les recherches dimensionnelles, les cumuls de plages et les scores de satisfaction).
- Scorecard : attributs utilisés dans le scoring intelligent.
- Activer pour le reporting : indique si un attribut est activé pour le reporting (Activé) ou non (Désactivé).
- Sensible à la casse : indique si un attribut est marqué comme sensible à la casse lors de l’affichage des valeurs dans l’Explorateur de documents, le Surligneur de la source, l’Exportation personnalisée et l’exportation de l’aperçu des phrases.
- Chemin d’exploration : affiche le chemin d’exploration personnalisé s’il a été défini. S’il n’existe pas de chemin d’exploration personnalisé, ce champ sera vide.
- Champ E-mail : indique si un attribut contient une adresse e-mail.
- Activer DocValue : indique si les valeurs de document ElasticSearch sont utilisées pour cet attribut.
- Activer les valeurs multiples délimitées : indique si plusieurs valeurs sont activées pour cet attribut.
- Parent : si l’attribut est un attribut dérivé, cette zone affichera “parent”. Ce champ sera vide pour les attributs personnalisés et standard.
- Actions : effectuez les actions suivantes sur l’attribut :
- Modifier l’attribut
- Créer un attribut dérivé
- Supprimer l’attribut
Gestion des groupes d’attributs
Utilisez le bouton à bascule Groupes d’attributs en haut de la page pour afficher vos ensembles d’attributs. Cela vous permet de créer de nouveaux groupes d’attributs et d’en supprimer des existants. Sélectionnez Attributs pour afficher vos attributs individuels.
Attributs système
Un certain nombre d’attributs système, tels que Date du document et ID source, sont automatiquement appliqués à chaque document chargé dans XM Discover. Ces attributs vous aident à gérer le feedback dans XM Discover, ainsi qu’à l’enrichir avec des données XM dérivées par le moteur TLN.
Vous trouverez ci-dessous une table des différents attributs système, regroupés selon les différentes catégories d’attributs. Cette table contient les informations suivantes sur chaque attribut :
- Nom : nom de l’attribut qui apparaît dans les rapports, les filtres, etc.
- Nom du système : nom du système de l’attribut que vous utilisez pour interroger ou filtrer vos données.
- Type : type d’attribut.
- Description : Brève description de la signification et de l’objectif de l’attribut.
- Granularité : niveau de granularité des données associé à un attribut. Par exemple, Nombre de mots de phrase n’est pertinent qu’au niveau d’une phrase, tandis que Date du document est disponible à la fois pour un document et pour chaque phrase de ce document.
ID et références
Nom | Nom du système | Saisir | Description | Granularité |
ID document | _id_document | nombre | ID système unique du document. Contrairement à l’ID naturel, l’ID de document est généré automatiquement par XM Discover. | document et phrase |
ID naturel | ID_naturel | texte | ID naturel unique du document. Contrairement à l’ID de document, l’ID naturel est généré à partir des champs spécifiés lorsque vous téléchargez un document sur le serveur. L’ID naturel est utilisé par la détection des doublons et peut également être utile lors du suivi du document jusqu’à sa source en dehors de XM Discover. | document et phrase |
ID de phrase | _id_phrase | nombre | ID unique de la phrase. Cet ID est généré automatiquement.
|
phrase |
Identifiant de session | _id_batch | nombre | ID unique de la session de chargement au cours de laquelle le document a été chargé dans XM Discover. Cet ID est généré automatiquement. | document et phrase |
ID source | _id_source | texte | Nom de la source de données. Selon la source de données, elle peut être générée automatiquement ou à partir des zones indiquées lors du chargement du document. | document et phrase |
ID de verbatim | _id_verbatim | nombre | ID unique du verbatim. Cet ID est généré automatiquement. | verbatim et phrase |
Type de verbatim | _verbatimtype | texte | Nom de la zone verbatim. Cet attribut vous permet de distinguer les phrases par différentes zones verbatim dans vos données. | verbatim et phrase |
  ;
Date et heure
  ;
Nom | Nom du système | Saisir | Description | Granularité |
Date de création de la facture | cb_date_created_utc | date, heure Epoch en millisecondes | Date à laquelle le document a été ajouté à XM Discover. Cette date est générée automatiquement. | document et phrase |
Date de mise à jour CB | cb_date_update | date, heure Epoch en millisecondes | Date à laquelle le document a été mis à jour pour la dernière fois. Les mises à jour n’incluent pas les modifications de catégorisation. Cette date est générée automatiquement. | document |
Date du document | _doc_time | date, ISO 8601 en secondes | Date principale du document. La date du document est utilisée dans les rapports, les rapports de tendance, les alertes, etc. Cette date est générée à partir des zones spécifiées lors du téléchargement du document. | document et phrase |
Date du document sans heure | _date_doc | format de date, aaaa-mm-jj | Date du document sans horodatage.
Cette date est générée à partir des zones spécifiées lors du téléchargement du document. |
document et phrase |
Heure de la journée | time_of_day | texte, format hh:mm | Heure du document, reportée à l’heure. Par exemple, les commentaires publiés à 9:09 et 9:59 seront tous les deux reportés à 9:00. Cet attribut est généré automatiquement. | document et phrase |
Comptage et position de Word
  ;
Nom | Nom du système | Saisir | Description | Granularité |
Nombre de mots du document CB | cb_document_word_count | nombre | Nombre de mots dans un document. Le nombre de mots du document est la somme de tous les nombres de mots de phrases.
|
document et phrase |
Quartile de phrase CB | cb_sentence_quartile | nombre | La partie du verbatim dans laquelle se trouve une phrase. Cet attribut peut avoir 1 des valeurs suivantes : 1, 2, 3 ou 4. Chaque section représente 25 % de toute la longueur verbatim. | phrase |
Nombre de mots de phrase CB | cb_sentence_word_count | nombre | Nombre de mots dans une phrase. | phrase |