Introducción básica a Atributos
Acerca de la Introducción básica a Atributos
Un atributo es una propiedad de un documento que lo caracteriza de alguna manera. Los ejemplos comunes de atributos incluyen el nombre del autor y la fecha de creación.
Puede crear atributos personalizados para sus proyectos. También hay una variedad de atributos de sistema para que los utilice. También puede configurar entidades inteligentes que detecten automáticamente atributos basados en el texto del documento (por ejemplo, cuando se menciona una marca o un producto en los comentarios de un cliente).
Después de añadir atributos, es posible crear atributos derivados adicionales para comprender mejor sus datos. También puede organizar sus atributos en conjuntos de atributos, lo que facilita la elaboración de informes sobre estos atributos.
Tipos de campo de atributo
Se admiten los siguientes tipos de campo para los atributos:
- Texto
- Número
- Fecha
Acceso a atributos
Los atributos se gestionan a nivel de proyecto. Para acceder a los atributos de un proyecto:
- En Diseñador, vaya a la pestaña Administración y busque el proyecto que le interese.
- Haga clic en la opción Atributos en la columna Acciones.
Esto abre la tabla de atributos que contiene la siguiente información sobre cada atributo del proyecto:
- Nombre: el nombre del sistema del atributo. Consulte Nomenclatura de atributos para requisitos de nombres.
- Nombre de visualización: el nombre de visualización del atributo, que aparece en los informes, filtros, etc. Consulte Nomenclatura de atributos para requisitos de nombres.
- Tipo: El tipo del atributo. Para los atributos estándar, los valores pueden ser Texto, Número o Fecha. Para los atributos derivados, los valores pueden ser Búsqueda dimensional, Acumulación de rango, Puntuación de satisfacción o Derivado de la categoría.
- Grupo: El grupo del atributo que representa su origen y uso previsto. Los valores son uno de los siguientes:
- Categoría derivada: atributos derivados de modelos o categorías.
- Sistema: atributos del sistema.
- Definido por el cliente: todos los atributos personalizados disponibles desde la fuente de datos de su elección (incluidas las búsquedas dimensionales, las acumulaciones de rangos y las puntuaciones de satisfacción).
- Scorecard: atributos utilizados en la puntuación inteligente.
- Activar para reporting: Muestra si un atributo está activado para reporting (On) o no (Off).
- Distingue entre mayúsculas y minúsculas: muestra si un atributo está marcado como sensible a mayúsculas y minúsculas al visualizar valores en el Explorador de documentos, Resaltador de origen, Exportación personalizada y exportación de vista previa de oraciones.
- Ruta de exploración: muestra la ruta de exploración personalizada si se ha definido. Si no hay ninguna ruta de exploración personalizada, este campo estará en blanco.
- Campo Correo electrónico: muestra si un atributo contiene una dirección de correo electrónico.
- Habilitar DocValue: muestra si los valores del documento ElasticSearch se utilizan para este atributo.
- Habilitar valores múltiples delimitados: muestra si hay varios valores habilitados para este atributo.
- Superior: si el atributo es un atributo derivado, este campo mostrará “superior”. Este campo estará en blanco para los atributos personalizados y estándar.
- Acciones: Realice las siguientes acciones en el atributo:
- Editar el atributo
- Crear un atributo derivado
- Borrar el atributo
Gestión de conjuntos de atributos
Utilice el conmutador Conjuntos de atributos en la parte superior de la página para ver sus conjuntos de atributos. Esto le permite crear nuevos conjuntos de atributos y borrar los existentes. Seleccione Atributos para ver sus atributos individuales.
Atributos del sistema
Hay una serie de atributos del sistema, como Fecha de documento e ID de fuente, que se aplican automáticamente a cada documento cargado en XM Discover. Estos atributos le ayudan a gestionar comentarios dentro de XM Discover, así como a enriquecerlos con datos de XM derivados por el motor NLP.
A continuación se muestra una tabla de los diferentes atributos del sistema, agrupados por las diferentes categorías de atributos. Esta tabla contiene la siguiente información sobre cada atributo:
- Nombre: el nombre del atributo que aparece en los informes, filtros, etc.
- Nombre del sistema: El nombre del sistema del atributo que utiliza para consultar o filtrar los datos.
- Tipo: El tipo de atributo.
- Descripción: Una breve descripción del significado y el propósito del atributo.
- Granularidad: El nivel de granularidad de datos asociado con un atributo. Por ejemplo, el Recuento de palabras de frase solo es relevante a nivel de frase, mientras que la Fecha de documento está disponible tanto para un documento como para cada frase de ese documento.
IDs y referencias
Nombre | Nombre de sistema | Tipo | Descripción | Granularidad |
ID de documento | _id_document | número | El ID de sistema unívoco del documento. A diferencia del ID natural, XM Discover genera automáticamente el ID de documento. | documento y frase |
ID natural | natural_id | texto | El ID natural unívoco del documento. A diferencia del ID de documento, el ID natural se genera a partir de los campos especificados al cargar un documento. El ID natural se utiliza en la detección de duplicados y también puede ser útil al rastrear el documento hasta su origen fuera de XM Discover. | documento y frase |
ID de frase | _id_oración | número | El ID único de la frase. Este ID se genera automáticamente.
|
frase |
ID de la sesión | _id_batch | número | El ID único de la sesión de carga durante la cual se cargó el documento en XM Discover. Este ID se genera automáticamente. | documento y frase |
ID de fuente | _id_source | texto | El nombre de la fuente de datos. En función de la fuente de datos, se puede generar automáticamente o a partir de los campos especificados al cargar el documento. | documento y frase |
ID de Verbatim | _id_verbatim | número | El ID único del literal. Este ID se genera automáticamente. | literal y frase |
Tipo de Verbatim | _texbatimtype | texto | El nombre del campo textual. Este atributo le permite distinguir oraciones por diferentes campos textuales en sus datos. | literal y frase |
Fecha y hora
Nombre | Nombre de sistema | Tipo | Descripción | Granularidad |
Fecha de creación de CB | cb_date_created_utc | fecha, Epoch time en milisegundos | La fecha en que se añadió el documento a XM Discover. Esta fecha se genera automáticamente. | documento y frase |
Fecha de actualización CB | cb_date_update | fecha, Epoch time en milisegundos | La fecha en la que se actualizó por última vez el documento. Las actualizaciones no incluyen modificaciones de categorización. Esta fecha se genera automáticamente. | documento |
Fecha de documento | _doc_time | fecha, ISO 8601 en segundos | La fecha principal del documento. La fecha del documento se utiliza en informes, informes de tendencias, alertas, etc. Esta fecha se genera a partir de los campos especificados al cargar el documento. | documento y frase |
Fecha de documento sin hora | _doc_date | fecha, formato aaaa-mm-dd | La fecha del documento sin el cronomarcador.
Esta fecha se genera a partir de los campos especificados al cargar el documento. |
documento y frase |
Hora del día | time_of_day | texto, formato hh:mm | La hora del documento, desplegada a la hora. Por ejemplo, los comentarios publicados a las 9:09 y 9:59 subirán hasta las 9:00. Este atributo se genera automáticamente. | documento y frase |
Recuentos de palabras y posición
Nombre | Nombre de sistema | Tipo | Descripción | Granularidad |
Recuento de palabras de documento CB | cb_document_word_count | número | El número de palabras en un documento. El recuento de palabras del documento es una suma de todos los recuentos de palabras de la oración.
|
documento y frase |
Cuartil de frase CB | cb_sentence_cuartile | número | La parte literal de una frase recae en. Este atributo puede tener 1 de los siguientes valores: 1, 2, 3 o 4. Cada sección representa el 25% de toda la longitud literal. | frase |
CB Recuento de palabras de frase | cb_sentence_word_count | número | El número de palabras en una frase. | frase |