Plantilla de artículo
Acerca de Joins
Las uniones le permiten combinar filas de 2 o más fuentes de datos en función de una columna de datos relacionada que comparten. Al utilizar una unión, puede recopilar y analizar los datos combinados de manera más eficiente y efectiva, creando más información.
El modelador de datos solo admite uniones externas izquierdas.
Comprensión de las uniones externas izquierdas
Para entender cómo funciona una unión externa izquierda, veamos un ejemplo.
Mire la imagen del conjunto de datos a continuación. La primera fuente de datos en la parte superior es nuestra fuente de datos“izquierda”, y la segunda fuente de datos en la parte inferior es nuestra fuente de datos“derecha”.
Digamos que estas tablas representan los datos que puedes encontrar en cada encuesta:
Ubicación de las tiendas (fuente de la izquierda)
ID de ubicación | Nombre de la ubicación |
555 | Miembro del ira provisional |
777 | Dublín |
999 | Seattle |
1000 | Tokio |
Opinión de clientes (fuente correcta)
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
102 | 4 | 777 |
103 | 5 | 999 |
104 | 5 | 222 |
Usted elige unir los datos en función de Identificación de ubicación . Este campo se llama “clave de unión”.
Estos son los datos exclusivos del segundo conjunto de datos. Esto sería remoto:
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
104 | 5 | 222 |
Este es el resultado final, o todos los datos que serían Incluido en sus resultados:
ID de ubicación | Nombre de la ubicación | Identificación del cliente | Satisfacción (1-5) |
555 | Miembro del ira provisional | 101 | 2 |
777 | Dublín | 102 | 4 |
999 | Seattle | 103 | 5 |
1000 | Tokio | Nulo | Nulo |
Observe cómo los resultados de Provo, Dublín y Seattle contienen columnas de datos de las fuentes derecha e izquierda, porque estas filas comparten identificadores de ubicación comunes.
No había datos para Tokio en la fuente derecha, por lo que la fila de Tokio tiene valores nulos en las nuevas columnas de ID de cliente y Satisfacción.
Importancia de las claves de unión únicas
Dado que las claves de unión ayudan a identificar filas que deben combinarse desde las fuentes izquierda y derecha, recomendamos asegurarse de que la clave de unión que utilice actúe como un identificador único. De lo contrario, si hay varios registros en la fuente derecha que coinciden con la clave de unión de la fuente izquierda, solo uno de ellos se extraerá aleatoriamente. .
Ejemplo: Veamos el ejemplo que comentamos anteriormente. Tenemos la misma fuente izquierda. Pero en la fuente correcta, tenemos estas filas:
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
107 | 4 | 555 |
En la unión resultante, solo se guardará una de las 555 filas, pero no ambas.
Si la clave de unión no es única para cada registro en una fuente derecha y desea incluir todos los registros tanto de la fuente derecha como de la izquierda, una unión Debería utilizarse en su lugar. Las uniones extraen cada uno de los registros por separado en lugar de combinar las filas de información.
Creando uniones
- Crear un modelo de datos .
- Agregue al menos 2 fuentes a su modelo de datos.
Consejo Q: Asegúrese de incluir todos los campos que necesita en sus fuentes de datos, incluido el campo común que utilizará para unir sus datos (por ejemplo, una identificación única). - Haga clic en el signo más ( + ) siguiente a la fuente de datos que desea que actúe como su Izquierda fuente de datos.
- Seleccionar Unirse .
- Nombra la salida. Esto es útil si planea agregar múltiples uniones a su conjunto de datos.
- Bajo Aporte , seleccione el Bien fuente de datos.
- Crear una condición de unión. Empareja el campo que cada conjunto de datos tiene en común.
Ejemplo: Aquí estamos mapeando nuestro Identificación única campo de cada fuente de datos a los demás.Consejo Q: Campos de cualquier tipo se puede utilizar en condiciones de unión. Recomendamos encarecidamente utilizar un identificador único que coincide a través ambos fuentes de datos.Consejo Q: No se pueden utilizar recodificaciones en claves de unión.
- Si tiene al menos otra fuente de datos independiente debajo de las fuentes a las que se unió, puede crear otra unión utilizando la unión existente .
- Puedes crear uniones separadas en el mismo conjunto de datos. En esta captura de pantalla, unirías los datos de la Encuesta y la capacidad de acción de 2022, pero no las 2 fuentes de datos principales.
- Finalizar Creando su modelo de datos con un conjunto de datos de salida .
Uso de uniones auxiliares
Las uniones auxiliares le permiten unir múltiples fuentes con la misma condición de unión. Por lo tanto, son útiles cuando desea crear múltiples uniones superpuestas utilizando las mismas fuentes de datos.
Antes, hablamos sobre cómo Las uniones externas izquierdas funcionan con 2 fuentes: una fuente derecha y una fuente izquierda. Las uniones auxiliares le permiten establecer múltiples fuentes izquierdas para la misma fuente derecha en una unión.
Ejemplo de una unión auxiliar
Digamos que tiene una base de datos de ubicaciones de tiendas, con nombres vinculados a identificaciones. Dispones de 2 años de encuestas donde recoges opinión sobre tus tiendas. En el siguiente ejemplo, encontraremos la calificación de satisfacción y el ID del cliente para 2020 y 2021, y los vincularemos a un nombre de ubicación.
Ubicación de las tiendas (fuente de la izquierda)
ID de ubicación | Nombre de la ubicación |
555 | Miembro del ira provisional |
777 | Dublín |
999 | Seattle |
1000 | Tokio |
Opinión de clientes 2020 (Fuente correcta)
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
101 | 2 | 555 |
102 | 4 | 777 |
103 | 5 | 999 |
104 | 5 | 222 |
Opinión de clientes 2021 (Fuente auxiliar derecha)
Identificación del cliente | Satisfacción (1-5) | ID de ubicación |
656 | 5 | 1000 |
838 | 4 | 222 |
979 | 3 | 999 |
343 | 5 | 777 |
Usted une los datos en función de Identificación de ubicación .
Este es el resultado final, o todos los datos que serían Incluido en sus resultados:
ID de ubicación | Nombre de la ubicación | ID de cliente 2020 | Satisfacción 2020 | ID de cliente 2021 | Satisfacción 2021 |
777 | Dublín | 102 | 4 | 343 | 5 |
1000 | Tokio | N/D | N/D | 656 | 5 |
999 | Seattle | 103 | 5 | 979 | 3 |
555 | Miembro del ira provisional | 101 | 2 | N/D | N/D |
Observe cómo los datos de 2020 y 2021 se han vuelto separado columnas en el mismo conjunto de datos de salida .
Como en 2020 no había datos para Tokio, pero en 2021 sí, las columnas de 2020 están vacías (N/A) para Tokio. Del mismo modo, 2021 no tuvo datos de Provo.
Los registros con ID de ubicación “222” de cualquiera de los años se excluyeron de la fuente de datos final, ya que el archivo de ubicaciones de tiendas no tenía una ubicación correspondiente para esa ID. Ver Comprensión de las uniones externas izquierdas para obtener una explicación de cómo se excluyen los datos.
Creación de una unión auxiliar
- Haga clic en unirse.
- Ir a Configuraciones de unión .
- Haga clic en el signo más ( + ).
- Seleccione el Entrada derecha .
Ejemplo: Esta es la segunda fuente que deseas unir a tu fuente izquierda. En nuestro ejemplo anterior, esta sería la encuesta de opinión de clientes de 2021. - Establezca la condición de unión de la columna izquierda.
- Establezca la condición de unión de la columna derecha.
Repita los pasos según sea necesario para agregar más uniones auxiliares.
Uniones auxiliares vs. Uniones subsiguientes
Además de las uniones auxiliares, puede hacer clic en el signo más ( + ) siguiente a su unión completada y seleccione Unirse . Llamaremos a este método “unión subsiguiente”.
Generalmente, las uniones auxiliares son útiles cuando desea crear uniones superpuestas múltiples utilizando las mismas fuentes de datos. Las uniones posteriores son mejores si desea crear una unión con 2 fuentes de datos adicionales que no se incluyeron en su primera unión .
Consejo Q: Las uniones posteriores también son útiles si desea realizar uniones múltiples en las que es necesario extraer una segunda clave de unión de otra fuente. Por ejemplo, supongamos que tiene una encuesta con ID de tienda.
- Utilice el ID de la tienda para unir estos datos a una fuente separada con más datos de ubicación.
- La fuente de datos de ubicación también tiene un campo llamado ” Gerente de tienda”.
- En su tercera fuente, tiene información de la jerarquía de la empresa a la que se está uniendo en función del campo ” Gerente de tienda”.
Con este método, los datos de la encuesta , los datos de ubicación y la jerarquía de la empresa se pueden combinar en un solo conjunto de datos.
Sin embargo, hay ocasiones en que las uniones auxiliares y las uniones subsiguientes pueden tener el misma salida.
Ejemplo: Ampliando nuestro ejemplo anterior, obtendría los mismos resultados si creara una unión posterior con Identificación de ubicación de las ubicaciones de las tiendas a la izquierda y el ID de ubicación de 2021 a la derecha.
Sin embargo, cuando se crea la primera unión, no se obtiene como resultado un solo campo de ID de ubicación. Para este ejemplo, obtendrá una columna para las versiones de Ubicaciones de tiendas y Opinión de clientes de 2020 del ID de ubicación. Si intenta unir sus datos mediante el Identificación de ubicación de los Opinión de clientes de 2020 , los resultados serían diferentes a los que obtendríamos con la unión auxiliar.
Así es como se vería esa tabla de resultados . Debido a que 2020 no tiene datos para Tokio, los datos existentes de Tokio de 2021 se excluyen de los resultados finales.
ID de ubicación | Nombre de la ubicación | ID de cliente 2020 | Satisfacción 2020 | ID de cliente 2021 | Satisfacción 2021 |
777 | Dublín | 102 | 4 | 343 | 5 |
1000 | Tokio | N/D | N/D | N/D | N/D |
999 | Seattle | 103 | 5 | 979 | 3 |
555 | Miembro del ira provisional | 101 | 2 | N/D | N/D |