Se une (CX)
Acerca de Joins
Las uniones le permiten combinar filas de 2 o más fuentes de datos en función de una columna de datos relacionada que comparten. Al utilizar una unión, puede recopilar y analizar los datos combinados de manera más eficiente y efectiva, creando más información.
El modelador de datos CX solo admite uniones externas izquierdas, uniones internas y uniones externas. Solo uniones externas izquierdas actualizar continuamente.
Comprensión de las uniones externas izquierdas
Para entender cómo funciona una unión externa izquierda, veamos un ejemplo.
Mire la imagen del conjunto de datos a continuación. La primera fuente de datos en la parte superior es nuestra fuente de datos“izquierda”, y la segunda fuente de datos en la parte inferior es nuestra fuente de datos“derecha”.
Digamos que estas tablas representan los datos que puedes encontrar en cada encuesta:
Ubicación de las tiendas (fuente de la izquierda)
ID de ubicación | Nombre de la ubicación |
555 | Miembro del ira provisional |
777 | Dublín |
999 | Seattle |
1000 | Tokio |
Opinión de clientes (fuente correcta)
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
102 | 4 | 777 |
103 | 5 | 999 |
104 | 5 | 222 |
Usted elige unir los datos en función de Identificación de ubicación . Este campo se llama “clave de unión”.
Estos son los datos exclusivos del segundo conjunto de datos. Esto sería remoto:
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
104 | 5 | 222 |
Este es el resultado final, o todos los datos que serían Incluido en sus resultados:
ID de ubicación | Nombre de la ubicación | Identificación del cliente | Satisfacción (1-5) |
555 | Miembro del ira provisional | 101 | 2 |
777 | Dublín | 102 | 4 |
999 | Seattle | 103 | 5 |
1000 | Tokio | Nulo | Nulo |
Observe cómo los resultados de Provo, Dublín y Seattle contienen columnas de datos de las fuentes derecha e izquierda, porque estas filas comparten identificadores de ubicación comunes.
No había datos para Tokio en la fuente derecha, por lo que la fila de Tokio tiene valores nulos en las nuevas columnas de ID de cliente y Satisfacción.
Importancia de las claves de unión únicas
Dado que las claves de unión ayudan a identificar filas que deben combinarse desde las fuentes izquierda y derecha, recomendamos asegurarse de que la clave de unión que utilice actúe como un identificador único. De lo contrario, si hay varios registros en la fuente derecha que coinciden con la clave de unión de la fuente izquierda, solo uno de ellos se extraerá aleatoriamente. .
Ejemplo: Veamos el ejemplo que comentamos anteriormente. Tenemos la misma fuente izquierda. Pero en la fuente correcta, tenemos estas filas:
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
107 | 4 | 555 |
En la unión resultante, solo se guardará una de las 555 filas, pero no ambas.
Si la clave de unión no es única para cada registro en una fuente derecha y desea incluir todos los registros tanto de la fuente derecha como de la izquierda, una unión Debería utilizarse en su lugar. Las uniones extraen cada uno de los registros por separado en lugar de combinar las filas de información.
Comprensión de las uniones internas
Con una unión interna, el conjunto de datos fusionado resultante solo incluye las filas coincidentes que se encuentran en ambos conjuntos de datos. Debido a que las uniones internas excluyen registros de cualquiera de las fuentes que no tienen datos, los conjuntos de datos resultantes tienden a tener menos columnas vacías y el orden de las fuentes (que es izquierda o derecha) importa menos que con otros tipos de uniones.
Digamos que estas tablas representan los datos que puedes encontrar en cada encuesta:
Nivel de recompensa del cliente (fuente izquierda)
Identificación del cliente | Nombre | Nivel de recompensa |
101 | Phil Stein | Esmeralda |
102 | Amir Dar | Oro |
103 | Beth Green | Plata |
104 | Lucía Vásquez | Esmeralda |
Opinión la experiencia en la tienda (Fuente correcta)
Identificación del cliente | Satisfacción (1-5) | Almacenar |
101 | 1 | Miembro del ira provisional |
104 | 3 | Miembro del ira provisional |
113 | 5 | Scranton |
Usted elige unir los datos en función del ID del cliente. Este campo se llama “clave de unión”.
Estos son todos los datos de cada fuente Eso sería excluidos del conjunto de datos final.
Identificación del cliente | Nombre | Nivel de recompensa | Satisfacción (1-5) | Almacenar |
102 | Amir Dar | Oro | Nulo | Nulo |
103 | Beth Green | Plata | Nulo | Nulo |
113 | Nulo | Nulo | 5 | Scranton |
Este es el resultado final, o todo el datos que se incluirían en sus resultados:
Identificación del cliente | Satisfacción (1-5) | Nombre | Almacenar | Nivel de recompensa |
101 | 1 | Phil Stein | Miembro del ira provisional | Esmeralda |
104 | 3 | Lucía Vásquez | Miembro del ira provisional | Esmeralda |
Si bien estas fuentes se unen por ID de cliente, los clientes con ID 102, 103 y 113 quedan excluidos del conjunto de datos final porque les falta demasiada información. Sólo Phil (101) y Lucia (104) tienen datos completos disponibles de ambas fuentes.
Comprensión de las uniones externas completas
Con una unión externa completa, el conjunto de datos fusionado resultante incluye todas las filas de ambos conjuntos de datos. Si bien los registros se combinarán y fusionarán mediante la clave de unión, incluso los registros a los que les faltan datos para la clave de unión se incluirán en el conjunto de datos final.
Digamos que estas tablas representan los datos que puedes encontrar en cada encuesta:
Nivel de recompensa del cliente (fuente izquierda)
Identificación del cliente | Nombre | Nivel de recompensa |
101 | Phil Stein | Esmeralda |
102 | Amir Dar | Oro |
104 | Lucía Vásquez | Esmeralda |
Nulo | Beth Green | Plata |
Opinión la experiencia en la tienda (Fuente correcta)
Identificación del cliente | Satisfacción (1-5) | Almacenar |
101 | 1 | Miembro del ira provisional |
104 | 3 | Miembro del ira provisional |
113 | 5 | Scranton |
Usted elige unir los datos en función del ID del cliente. Este campo se llama “clave de unión”.
Este es el resultado final, o todo el datos que se incluirían en sus resultados.
Identificación del cliente | Satisfacción (1-5) | Nombre | Almacenar | Nivel de recompensa |
101 | 1 | Phil Stein | Miembro del ira provisional | Esmeralda |
102 | Nulo | Amir Dar | Nulo | Oro |
104 | 3 | Lucía Vásquez | Miembro del ira provisional | Esmeralda |
113 | 5 | Nulo | Scranton | Nulo |
Nulo | Nulo | Beth Green | Nulo | Plata |
Observa cómo No se excluye ningún dato. Incluso Beth Green, a quien le faltan datos para la identificación del cliente, está incluida en los resultados. Si hubiera varias filas de ID de cliente nulas, cada una de esas filas se incluiría y permanecerían como registros separados y únicos.
Creando uniones
- Crear un modelo de datos .
- Agregue al menos 2 fuentes a su modelo de datos.
Consejo Q: Asegúrese de incluir todos los campos que necesita en sus fuentes de datos, incluido el campo común que utilizará para unir sus datos (por ejemplo, una identificación única). - Haga clic en el signo más ( + ) siguiente a la fuente de datos que desea que actúe como su Izquierda fuente de datos.
- Seleccionar Unirse .
- Nombra la salida. Esto es útil si planea agregar múltiples uniones a su conjunto de datos.
- Bajo Aporte , seleccione el Bien fuente de datos.
- Crear una condición de unión. Empareja el campo que cada conjunto de datos tiene en común.
Ejemplo: Aquí estamos mapeando nuestro Identificación única campo de cada fuente de datos a los demás.Consejo Q: Casi todo el campo tipos se puede utilizar en condiciones de unión, excepto en los campos de fecha y en los campos de conjunto de texto de respuestas múltiples. Recomendamos encarecidamente utilizar un identificador único que coincide a través ambos fuentes de datos.Consejo Q: No se pueden utilizar recodificaciones en claves de unión.
- Si tiene al menos otra fuente de datos independiente debajo de las fuentes a las que se unió, puede crear otra unión utilizando la unión existente .
- Puedes crear uniones separadas en el mismo conjunto de datos. En esta captura de pantalla, unirías los datos de la Encuesta y la capacidad de acción de 2022, pero no las 2 fuentes de datos principales.
- Finalizar Creando su modelo de datos con un conjunto de datos de salida .
Uso de uniones auxiliares
Las uniones auxiliares le permiten unir múltiples fuentes con la misma condición de unión. Por lo tanto, son útiles cuando desea crear múltiples uniones superpuestas utilizando las mismas fuentes de datos.
Antes, hablamos sobre cómo Las uniones externas izquierdas funcionan con 2 fuentes: una fuente derecha y una fuente izquierda. Las uniones auxiliares le permiten establecer múltiples fuentes izquierdas para la misma fuente derecha en una unión.
Ejemplo de una unión auxiliar
Digamos que tiene una base de datos de ubicaciones de tiendas, con nombres vinculados a identificaciones. Dispones de 2 años de encuestas donde recoges opinión sobre tus tiendas. En el siguiente ejemplo, encontraremos la calificación de satisfacción y el ID del cliente para 2020 y 2021, y los vincularemos a un nombre de ubicación.
Ubicación de las tiendas (fuente de la izquierda)
ID de ubicación | Nombre de la ubicación |
555 | Miembro del ira provisional |
777 | Dublín |
999 | Seattle |
1000 | Tokio |
Opinión de clientes 2020 (Fuente correcta)
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
102 | 4 | 777 |
103 | 5 | 999 |
104 | 5 | 222 |
Opinión de clientes 2021 (Fuente auxiliar derecha)
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
656 | 5 | 1000 |
838 | 4 | 222 |
979 | 3 | 999 |
343 | 5 | 777 |
Usted une los datos en función de Identificación de ubicación .
Este es el resultado final, o todos los datos que serían Incluido en sus resultados:
ID de ubicación | Nombre de la ubicación | ID de cliente 2020 | Satisfacción 2020 | ID de cliente 2021 | Satisfacción 2021 |
777 | Dublín | 102 | 4 | 343 | 5 |
1000 | Tokio | N/C | N/C | 656 | 5 |
999 | Seattle | 103 | 5 | 979 | 3 |
555 | Miembro del ira provisional | 101 | 2 | N/C | N/C |
Observe cómo los datos de 2020 y 2021 se han vuelto separado columnas en el mismo conjunto de datos de salida .
Como en 2020 no había datos para Tokio, pero en 2021 sí, las columnas de 2020 están vacías (N/A) para Tokio. Del mismo modo, 2021 no tuvo datos de Provo.
Los registros con ID de ubicación “222” de cualquiera de los años se excluyeron de la fuente de datos final, ya que el archivo de ubicaciones de tiendas no tenía una ubicación correspondiente para esa ID. Ver Comprensión de las uniones externas izquierdas para obtener una explicación de cómo se excluyen los datos.
Creación de una unión auxiliar
- Haga clic en unirse.
- Ir a Configuraciones de unión .
- Haga clic en el signo más ( + ).
- Seleccione el Entrada derecha .
Ejemplo: Esta es la segunda fuente que deseas unir a tu fuente izquierda. En nuestro ejemplo anterior, esta sería la encuesta de opinión de clientes de 2021. - Establezca la condición de unión de la columna izquierda.
- Establezca la condición de unión de la columna derecha.
Repita los pasos según sea necesario para agregar más uniones auxiliares.
Uniones auxiliares vs. Uniones subsiguientes
Además de las uniones auxiliares, puede hacer clic en el signo más ( + ) siguiente a su unión completada y seleccione Unirse . Llamaremos a este método “unión subsiguiente”.
Generalmente, las uniones auxiliares son útiles cuando desea crear uniones superpuestas múltiples utilizando las mismas fuentes de datos. Las uniones posteriores son mejores si desea crear una unión con 2 fuentes de datos adicionales que no se incluyeron en su primera unión .
Consejo Q: Las uniones posteriores también son útiles si desea realizar uniones múltiples en las que es necesario extraer una segunda clave de unión de otra fuente. Por ejemplo, supongamos que tiene una encuesta con ID de tienda.
- Utilice el ID de la tienda para unir estos datos a una fuente separada con más datos de ubicación.
- La fuente de datos de ubicación también tiene un campo llamado ” Gerente de tienda”.
- En su tercera fuente, tiene información de la jerarquía de la empresa a la que se está uniendo en función del campo ” Gerente de tienda”.
Con este método, los datos de la encuesta , los datos de ubicación y la jerarquía de la empresa se pueden combinar en un solo conjunto de datos.
Sin embargo, hay ocasiones en que las uniones auxiliares y las uniones subsiguientes pueden tener el misma salida.
Ejemplo: Ampliando nuestro ejemplo anterior, obtendría los mismos resultados si creara una unión posterior con Identificación de ubicación de las ubicaciones de las tiendas a la izquierda y el ID de ubicación de 2021 a la derecha.
Sin embargo, cuando se crea la primera unión, no se obtiene como resultado un solo campo de ID de ubicación. Para este ejemplo, obtendrá una columna para las versiones de Ubicaciones de tiendas y Opinión de clientes de 2020 del ID de ubicación. Si intenta unir sus datos mediante el Identificación de ubicación de los Opinión de clientes de 2020 , los resultados serían diferentes a los que obtendríamos con la unión auxiliar.
Así es como se vería esa tabla de resultados . Debido a que 2020 no tiene datos para Tokio, los datos existentes de Tokio de 2021 se excluyen de los resultados finales.
ID de ubicación | Nombre de la ubicación | ID de cliente 2020 | Satisfacción 2020 | ID de cliente 2021 | Satisfacción 2021 |
777 | Dublín | 102 | 4 | 343 | 5 |
1000 | Tokio | N/C | N/C | N/C | N/C |
999 | Seattle | 103 | 5 | 979 | 3 |
555 | Miembro del ira provisional | 101 | 2 | N/C | N/C |