Uniones (CX)
Acerca de las combinaciones
Las combinaciones le permiten combinar filas de 2 o más fuentes de datos basadas en una columna de datos relacionada que comparten. Al utilizar una unión, puede recopilar y analizar los datos combinados de forma más eficiente y eficaz, creando más información estratégica.
El modelador de datos solo admite left outer joins.
Comprensión de las combinaciones externas izquierdas
Para comprender cómo funciona un left outer join, veamos un ejemplo.
Observe la imagen del conjunto de datos a continuación. La primera fuente de datos en la parte superior es nuestra fuente de datos “izquierda”, y la segunda fuente de datos en la parte inferior es nuestra fuente de datos “derecha”.
Supongamos que estas tablas representan los datos que puede encontrar en cada encuesta:
Ubicaciones de las tiendas (fuente izquierda)
ID de ubicación | Nombre de la ubicación |
555 | Provo |
777 | Dublín |
999 | Seattle |
1000 | Tokio |
Opinión del cliente (fuente correcta)
ID de cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
102 | 4 | 777 |
103 | 5 | 999 |
104 | 5 | 222 |
Seleccione unir los datos según el ID de ubicación. Este campo se denomina “clave join”.
Estos son los datos únicos para el segundo conjunto de datos. Esto se eliminaría:
ID de cliente | Satisfacción (1-5) | ID de ubicación |
104 | 5 | 222 |
Esta es la salida final, o todos los datos que se incluirían en sus resultados:
ID de ubicación | Nombre de la ubicación | ID de cliente | Satisfacción (1-5) |
555 | Provo | 101 | 2 |
777 | Dublín | 102 | 4 |
999 | Seattle | 103 | 5 |
1000 | Tokio | Nulo | Nulo |
Observe cómo los resultados de Provo, Dublín y Seattle contienen columnas de datos de las fuentes derecha e izquierda, porque estas filas compartían IDs de ubicación comunes.
No había datos para Tokio en la fuente derecha, por lo que la fila Tokio tiene valores nulos en las nuevas columnas ID de cliente y Satisfacción.
Importancia de claves join unívocas
Dado que las claves de combinación ayudan a identificar las filas que deben combinarse de las fuentes izquierda y derecha, le recomendamos que se asegure de que la clave de combinación que utilice actúe como un identificador único. De lo contrario, si hay varios registros en la fuente derecha que coinciden con la clave join de la fuente izquierda, solo uno de ellos se extraerá aleatoriamente.
Ejemplo: Veamos el ejemplo que analizamos anteriormente. Tenemos la misma fuente izquierda. Pero en la fuente correcta, tenemos estas filas:
ID de cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
107 | 4 | 555 |
En la combinación resultante, solo se guardará una de las 555 filas, pero no ambas.
Si la clave join no es única para cada registro en una fuente derecha y desea incluir todos los registros tanto de la fuente derecha como de la izquierda, se debe utilizar una unión en su lugar. Las uniones extraen cada uno de los registros por separado en lugar de combinar las filas de información.
Crear combinaciones
- Cree un modelo de datos.
- Añada al menos 2 fuentes a su modelo de datos.
Consejo Q: Asegúrese de incluir todos los campos que necesita en sus fuentes de datos, incluido el campo común que utilizará para unir sus datos (por ejemplo, un ID único). - Haga clic en el signo más ( + ) junto a la fuente de datos que desea que actúe como fuente de datos izquierda.
- Seleccione Unir.
- Asigne un nombre a la salida. Esto es útil si planea añadir varias combinaciones a su conjunto de datos.
- En Entrada, seleccione la fuente de datos Derecha.
- Crear una condición de conexión. Haga coincidir el campo que tiene cada conjunto de datos en común.
Ejemplo: Aquí asignamos nuestro campo de ID único de cada fuente de datos entre sí.Consejo Q: Los campos de cualquier tipo se pueden utilizar en condiciones de unión. Recomendamos encarecidamente utilizar un identificador único que coincida en ambas fuentes de datos.Consejo Q : No se pueden utilizar recodificaciones en claves de unión.
- Si tiene al menos 1 fuente de datos separada por debajo de las fuentes a las que se ha unido, puede crear otra combinación utilizando la combinación existente.
- Puede crear combinaciones separadas en el mismo conjunto de datos. En esta captura de pantalla, se uniría a los datos de Encuesta y accionabilidad de 2022, pero no a las 2 fuentes de datos principales.
- Finalice la creación de su modelo de datos con un conjunto de datos de salida.
Uso de combinaciones auxiliares
Las combinaciones auxiliares le permiten unir varias fuentes con la misma condición de combinación. Por lo tanto, son útiles cuando desea crear varias combinaciones que se solapan utilizando las mismas fuentes de datos.
Anteriormente, hablamos de cómo las uniones externas izquierdas funcionan con 2 fuentes: una fuente derecha y una fuente izquierda. Las combinaciones auxiliares le permiten establecer varias fuentes izquierdas para la misma fuente derecha en una combinación.
Ejemplo de un join auxiliar
Supongamos que tiene una base de datos de ubicaciones de tienda, con nombres vinculados a ID. Tiene 2 años de encuestas en las que recopila opiniones sobre sus tiendas. En el siguiente ejemplo, encontraremos la valoración de satisfacción y el ID de cliente para 2020 y 2021, y los vincularemos a un nombre de ubicación.
Ubicaciones de tienda (fuente izquierda)
ID de ubicación | Nombre de la ubicación |
555 | Provo |
777 | Dublín |
999 | Seattle |
1000 | Tokio |
Opinión del cliente de 2020 (fuente correcta)
ID de cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
102 | 4 | 777 |
103 | 5 | 999 |
104 | 5 | 222 |
Opinión del cliente de 2021 (fuente derecha auxiliar)
ID de cliente | Satisfacción (1-5) | ID de ubicación |
656 | 5 | 1000 |
838 | 4 | 222 |
979 | 3 | 999 |
343 | 5 | 777 |
Combine los datos según el ID de ubicación.
Esta es la salida final, o todos los datos que se incluirían en sus resultados:
ID de ubicación | Nombre de la ubicación | ID de cliente de 2020 | Satisfacción 2020 | 2021 ID de cliente | Satisfacción 2021 |
777 | Dublín | 102 | 4 | 343 | 5 |
1000 | Tokio | N/D | N/D | 656 | 5 |
999 | Seattle | 103 | 5 | 979 | 3 |
555 | Provo | 101 | 2 | N/D | N/D |
Observe cómo los datos de 2020 y 2021 se han convertido en columnas separadas en el mismo conjunto de datos de salida.
Debido a que 2020 no tenía datos para Tokio, pero 2021 sí, las columnas de 2020 están vacías (N/A) para Tokio. Del mismo modo, 2021 no tenía datos de Provo.
Los registros con el ID de ubicación “222” de cualquier año se excluyeron de la fuente de datos final, ya que el archivo de ubicaciones de tienda no tenía una ubicación correspondiente para ese ID. Consulte Comprensión de las uniones externas a la izquierda para obtener una explicación de cómo se excluyen los datos.
Crear una unión auxiliar
- Haga clic en la combinación.
- Vaya a Opciones de unión.
- Haga clic en el signo más ( + ).
- Seleccione la entrada derecha.
Ejemplo: Esta es la segunda fuente que desea unir a la fuente izquierda. En nuestro ejemplo anterior, esta sería la encuesta de opinión del cliente de 2021. - Establezca la condición de unión de la columna izquierda.
- Establezca la condición de unión de la columna derecha.
Repita los pasos según sea necesario para agregar más combinaciones auxiliares.
Combinaciones auxiliares vs. Combinaciones subsiguientes
Además de las combinaciones auxiliares, puede hacer clic en el signo más (+ ) junto a la combinación completada y seleccionar Unirse. Llamaremos a este método una “unión posterior”.
Generalmente, las combinaciones auxiliares son útiles cuando desea crear varias combinaciones que se solapan con los mismos orígenes de datos. Las combinaciones subsiguientes son mejores si desea crear una combinación con 2 fuentes de datos adicionales que no se incluyeron en su primera combinación.
Consejo Q: Las combinaciones posteriores también son útiles si desea realizar varias combinaciones en las que se deba extraer una clave de segunda combinación de otra fuente. Por ejemplo, supongamos que tiene una encuesta con ID de tienda.
- Utilice el ID de tienda para unir estos datos a una fuente separada con más datos de ubicación.
- La fuente de datos de ubicación también tiene un campo llamado “Store Manager”.
- En su tercera fuente, tiene información de jerarquía de empresa a la que se une en función del campo “Store Manager”.
Con este método, los datos de la encuesta, los datos de ubicación y la jerarquía de la empresa se pueden combinar en un conjunto de datos.
Sin embargo, hay momentos en los que los joins auxiliares y los joins subsiguientes pueden tener la misma salida.
Ejemplo: Expandiendo en nuestro ejemplo anterior, obtendría los mismos resultados si creara una unión posterior con el ID de ubicación de las ubicaciones de tienda a la izquierda y el ID de ubicación de 2021 a la derecha.
Sin embargo, cuando crea la primera unión, no da como resultado solo un campo ID de ubicación. En este ejemplo, termina con una columna para las versiones Ubicaciones de tienda y Comentarios de cliente de 2020 del ID de ubicación. Si intenta unir sus datos con el ID de ubicación de los comentarios de cliente de 2020, los resultados serían diferentes de los que tendrían con el join auxiliar.
Esta es la tabla de resultados. Debido a que 2020 no tiene datos para Tokio, los datos existentes de Tokio de 2021 se excluyen de los resultados finales.
ID de ubicación | Nombre de la ubicación | ID de cliente de 2020 | Satisfacción 2020 | 2021 ID de cliente | Satisfacción 2021 |
777 | Dublín | 102 | 4 | 343 | 5 |
1000 | Tokio | N/D | N/D | N/D | N/D |
999 | Seattle | 103 | 5 | 979 | 3 |
555 | Provo | 101 | 2 | N/D | N/D |