Plantilla de artículo
Acerca de los atributos Descripción general básica
Un atributo es una propiedad de un documento que lo caracteriza de alguna manera. Ejemplos comunes de atributos incluyen el nombre del autor y la fecha de creación.
Puedes crear atributos personalizados Para tus proyectos. También hay una variedad de atributos del sistema para que usted lo use. También puede configurar entidades inteligentes que detecten automáticamente atributos basados en el texto del documento (por ejemplo, cuando se menciona una marca/organización o un producto en los opinión de un cliente).
Después de agregar atributos, es posible crear atributos adicionales. atributos derivados para comprender mejor sus datos. También puede organizar sus atributos en conjuntos de atributo , lo que facilita la generación de informes sobre estos atributos.
Tipos de campos de Atributo
Los siguientes tipos de campos son compatibles con los atributos:
- Texto
- Número
- Fecha
Acceder a los atributos
Los atributos se gestionan a nivel de proyecto. Para acceder a los atributos de un proyecto:
- En el Diseñador, vaya a Administración Pestaña y busque el proyecto que le interese.
- Haga clic en el Atributos Opción en la columna Acciones.
Esto abre la tabla de atributos que contiene la siguiente información sobre cada atributo del proyecto:
- Nombre:El nombre del sistema del atributo. Ver Nombre de Atributo para requisitos de denominación.
- Mostrar nombre:El mostrar nombre del atributo, que aparece en informes, filtros, etc. Ver Nombre de Atributo para requisitos de denominación.
- Tipo:El tipo del atributo. Para los atributos estándar, los valores pueden ser Texto, Número o Fecha. Para los atributos derivados, los valores pueden ser Búsqueda dimensional, Acumulación de rango, Puntuación de satisfacción o Derivado de categoría.
- Grupo:El grupo de atributos que representa su origen y uso previsto. Los valores pueden ser uno de los siguientes:
- Categoría derivada:atributos derivados de modelos o categorías.
- Sistema: atributos del sistema.
- Definido por el cliente:todos los atributos personalizados disponibles en la fuente de datos de su opción (incluidas búsquedas dimensionales, acumulaciones de rangos y puntajes de satisfacción).
- Tarjeta de puntuación: atributos utilizados en la puntuación inteligente.
- Habilitar para informes: Muestra si un atributo está habilitado para informes (Activado) o no (Desactivado).
- Distingue mayúsculas y minúsculas: Muestra si un atributo está marcado como sensible a mayúsculas y minúsculas al mostrar valores en el Explorador de documentos, el Resaltador de origen, la Exportación personalizada y la exportación de vista previa de oraciones.
- Trayectoria de perforación:Muestra la ruta de exploración personalizada si se definió. Si no hay una ruta de exploración personalizada, este campo estará en blanco.
- Campo de correo electrónico:Muestra si un atributo contiene una dirección de correo electrónico.
- Habilitar DocValue: Muestra si se utilizan valores de doc de ElasticSearch para este atributo.
- Habilitar valores múltiples delimitados:Muestra si están habilitados varios valores para este atributo.
- Padre:Si el atributo es un atributo derivado, este campo mostrará “padre”. Este campo estará en blanco para los atributos personalizados y estándar.
- Comportamiento:Realice las siguientes acciones en el atributo:
- Editar el atributo
- Crear un atributo derivado
- Eliminar el atributo
Administrar conjuntos de Atributo
Utilice el Conjuntos de Atributo alterna en la parte superior de la página para ver tus conjuntos de atributo . Esto le permite crear nuevos conjuntos de atributo y eliminar los existentes. Seleccionar Atributos para ver sus atributos individuales.
Atributos del sistema
Hay una serie de atributos del sistema, como la fecha del documento y la identificación de la fuente, que se aplican automáticamente a cada documento cargado en XM Discover. Estos atributos le ayudan a gestionar los opinión dentro de XM Discover, así como a enriquecerlos con datos de XM derivados del motor NLP.
A continuación se muestra una tabla de los diferentes atributos del sistema, agrupados por las diferentes categorías de atributos. Esta tabla contiene la siguiente información sobre cada atributo:
- Nombre:El nombre del atributo que aparece en informes, filtros, etc.
- Nombre del sistema:El nombre del sistema del atributo que utiliza para consultar o filtro sus datos.
- Tipo:El tipo de atributo .
- Descripción:Una breve descripción del significado y el propósito del atributo.
- Granularidad:El nivel de granularidad de datos asociado con un atributo. Por ejemplo, el recuento de palabras de una oración solo es relevante a nivel de oración, mientras que la fecha del documento está disponible tanto para un documento como para cada oración de ese documento.
Identificaciones y referencias
Nombre | Nombre del sistema | Tipo | Descripción | Granularidad |
Identificación del documento | _id_document | número | El identificador único del sistema del documento. A diferencia de Natural ID, Document ID es generado automáticamente por XM Discover. | documento y sentencia |
ID natural | identificación natural | texto | El identificador natural único del documento. A diferencia del ID de documento, el ID natural se genera a partir de los campos especificados cuando carga un documento. La identificación natural se utiliza en la detección de duplicar y también puede ser útil al rastrear el documento hasta su origen fuera de XM Discover. | documento y sentencia |
Identificación de la oración | _id_oración | número | El identificador único de la oración. Esta ID se genera automáticamente.
|
oración |
ID de la sesión | _id_lote | número | El ID único de la sesión de carga durante la cual se cargó el documento en XM Discover. Esta ID se genera automáticamente. | documento y sentencia |
Identificación de la fuente | _id_fuente | texto | El nombre de la fuente de datos. Dependiendo de la fuente de datos, estos pueden generarse automáticamente o a partir de los campos especificados al cargar el documento. | documento y sentencia |
Identificación textual | _id_verbatim | número | El identificador único del texto literal. Esta ID se genera automáticamente. | palabra por palabra y frase |
Tipo Verbatim | _tipo literal | texto | El nombre del campo textual. Este atributo le permite distinguir oraciones por diferentes campos textuales en sus datos. | palabra por palabra y frase |
Fecha y hora
Nombre | Nombre del sistema | Tipo | Descripción | Granularidad |
Fecha de creación del CB | cb_fecha_de_creación_utc | fecha, Tiempo de época en milisegundos | La fecha en que se agregó el documento a XM Discover. Esta fecha se genera automáticamente. | documento y sentencia |
Fecha de actualización del CB | cb_fecha_actualizada | fecha, Tiempo de época en milisegundos | La fecha en que se actualizó el documento por última vez. Las actualizaciones no incluyen cambios de categorización. Esta fecha se genera automáticamente. | documento |
Fecha del documento | _tiempo_doc | fecha, ISO 8601 En segundos | La fecha principal del documento. La fecha del documento se utiliza en informes, informes de tendencias, alertas, etc. Esta fecha se genera a partir de los campos especificados cuando carga el documento. | documento y sentencia |
Fecha del documento sin hora | _fecha_del_doc | fecha, formato aaaa-mm-dd | La fecha del documento sin la marca de tiempo.
Esta fecha se genera a partir de los campos especificados cuando carga el documento. |
documento y sentencia |
Hora del día | hora_del_dia | texto, formato hh:mm | La hora del documento, reducida a la hora. Por ejemplo, los comentarios publicados a las 9:09 y a las 9:59 se acumularán hasta las 9:00. Este atributo se genera automáticamente. | documento y sentencia |
Recuento de palabras y posición
Nombre | Nombre del sistema | Tipo | Descripción | Granularidad |
Recuento de palabras del documento CB | recuento de palabras del documento cb | número | El número de palabras en un documento. El recuento de palabras del documento es la suma del recuento de palabras de todas las oraciones.
|
documento y sentencia |
Cuartil de oración CB | cuartil_de_oración_cb | número | La parte del texto literal en la que se divide una oración. Este atributo puede tener 1 de los siguientes valores: 1, 2, 3 o 4. Cada sección representa el 25% de la longitud total del texto. | oración |
Recuento de palabras de la oración CB | recuento_de_palabras_de_la_oración_cb | número | El número de palabras en una oración. | oración |