タスクをマージ
マージタスクについて
マージタスクでは、複数のデータセットのデータを 1 つのマージ済データセットに結合することができます。これにより、複数のソースからのデータを 1 つの便利な場所で表示し、複数のデータソースにわたってダッシュボードを構築して結果を分析することができます。
最大 3 つのソースから同時にデータをマージすることができます。データのマージは、結合と呼ばれます。マージタスクを設定するときには、データセットに適用される制限に関するタスク制限を参照してください。
利用可能な結合方法
結合方法を選択する前に、どのアンケートを「左入力」、どのアンケートを「右入力」にするかを決定します。これは、使用する結合操作を決定する場合に重要です。
左と右の入力を設定したら、マージされたデータセットを作成するための 3 つの結合オプションがあります。
- 内部: 結合されたデータセットには、両方のデータセットで見つかった一致行のみが含まれます。
- 左外部: 結合されたデータセットには、左入力のすべての行と、右の入力で見つかった一致行が含まれます。
- 右外部: マージされたデータセットには、右の入力のすべての行と、左入力で見つかった一致行が含まれます。
マージタスクの設定
マージするデータセットが少なくとも 2 つある場合は、マージタスクの設定を開始できます。
- 左上隅のナビゲーションメニューをクリックします。
- ワークフローを選択します。
- [ワークフローを作成] をクリックします。
- 特定の時刻に開始を選択します。
- 新たに作成したワークフロー内で、[頻度の選択] をクリックし、プルダウンリストから頻度を選択します。
- ワークフローの頻度の設定を終了します。各頻度で使用可能なオプションの詳細については、スケジュール済ワークフローを参照してください。
- 頻度の下のプラス記号 (+) をクリックします。
- タスクを選択します。
- 選択 マージタスク。
- データセットを選択をクリックし、ドロップダウンメニューを使用してデータセットの 1 つを選択します。自分が作成した、または自分と共有されているアンケートプロジェクトとインポートされたデータプロジェクトのみが利用可能になります。
ヒント:結合タスクからデータセットを削除するには、データセットの右側にある横方向の3つの点をクリックします。 - [Fields] 列の下のドロップダウンをクリックし、各フィールド名の横にあるチェックボックスをクリックして含めるフィールドを選択します。
ヒント:結果のデータセットの最大フィールド数は、500です。結合されたソースに 500 を超える項目がある場合は、最初の 500 項目のみが選択されます。注意: アンダースコア (_) で始まる項目は選択できません - [データセットを追加]をクリックしてアンケートを追加します。最大 3 つの調査を追加できます。
- 追加するデータセットごとにステップ 10 ~ 11 を繰り返します。
- すべてのデータセットを追加したら、次へをクリックします。少なくとも 2 つのデータセットを追加するまで、続行できません。
- 左の[入力]ドロップダウンの下にある[データセットを選択]をクリックし、追加したアンケートのいずれかを選択します。
- ステップ 15 を繰り返し、正しい入力のデータセットを選択します。
- 左入力ドロップダウンと右入力ドロップダウンの間にある結合ボタンをクリックし、データセットの結合方法を選択します。使用可能な結合の種類については、利用可能な結合方法を参照してください。
- 左の “結合条件” ドロップダウンの下にあるフィールドの選択をクリックし、データセットのマッチングに使用する左側の入力フィールドを選択します。選択したフィールドには、他のデータセットに一致する値を持つフィールドが必要です。
ヒント:複数のデータセットを結合する場合、結合できるのは1つのフィールドのみです。 - 正しい入力データセットに対してステップ 18 を繰り返します。
- [次へ] をクリックします。
注意: 3 つのデータセットをマージする場合は、結合の追加をクリックしてステップ 15 ~ 19 を繰り返し、左側のデータセットとして Join 1 を選択し、右側の 3 番目のデータセットを選択する必要があります。ヒント:結合を削除するには、横3つのドットをクリックして[削除]を選択します。 - 結合されたデータセットの名前を入力します。
- マージされたデータを新しくインポートされたデータプロジェクトにロードする場合は、チェックボックスをクリックします。これにより、タスクの初回実行時に、インポートされた新しいデータプロジェクトが作成されます。
注意: このチェックボックスをオフのままにすると、ワークフロー内のデータプロジェクトタスクへのロードを作成する必要があります。このタスク内で、既存のインポートされたデータプロジェクトを、マージされたデータセットの送信先として選択できます。
- マージされたデータを新しくインポートされたデータプロジェクトにロードする場合は、フィールドの 1 つを一意の ID として選択する必要があります。
注意: 一意 ID は文字列である必要があります。非文字列項目は選択できません。ヒント:固有でないため、アンケートの選択肢を一意のIDとして使用することはできません。
- デフォルトでは、各フィールドは最初にアンケート名を追加してデータセットにロードされます。必要に応じて、各項目の項目名をクリックし、項目名を変更することができます。
注意: 項目の先頭をアンダースコア (_) にすることはできませんアンダースコアで始まるフィールドは、マージされたデータセットから除外されます。
- 保存をクリックします。
- ワークフローが有効化されていることを確認します。
実行結果
マージタスクが実行されると、タスク実行結果を表示することができます。結合によって最初の実行の結果データセットの行が生成されない場合、結合されたデータセットは作成されません。
結合されたデータセットの表示
マージタスクが正常に実行されると、結合されたデータセットを表示できるようになります。
- [プロジェクト]ページに移動します。
- インポートしたデータプロジェクトをクリックします。これは、マージタスクの設定時にステップ 22 で使用した名称である必要があります。
- プロジェクトに最初に表示されるのは、マージされたデータです。各列はサーベイ名で始まるため、列が属するデータセットが明確になります。
ヒント:新しいインポートされたデータプロジェクトをマージタスク内に作成することを決定した場合、一意のID列は列名の前に「id」と表示されます。 - 回答の分析を行う場合は、[データ]タブと[分析]内の他のタブをクリックできます。詳細については、以下のページを参照してください。
ヒント:ここに表示されるタブは、個々のユーザー権限によって異なります。
データをQualtricsにインポート
したら、Stats iQ、Text iQ、クロスタブ、回答の重み設定を使用してデータを分析できます。CXダッシュボードのデータソースとしてプロジェクトを使用することもできます。
制限
マージタスクには以下の制限があります。マージタスクの設定時にこれらの制限を超えると、マージタスクは正常に実行されません。
ソースデータセットの制限:
各ソースデータセット内のフィールドの数 | 500 項目 |
ソースデータセット内のレコード数 | 100 万レコード |
行サイズ | 100 KB |
結合されたデータセットに対して選択されたフィールドの数 | 500 項目 |
マージデータセット制限:
結合されたデータセット内のレコード数 | 100 万レコード |
結合データセットのサイズ | 1 GB |
タスク制限:
結合内のデータセット数 | 3 データセット |
マージタスクを含めることができるワークフローの数 | 5 ワークフロー |
マージタスクの実行頻度 | 24 時間ごとに 1 回 |
内部結合
次の制限
は内部ジョインに固有のものです。
ソースデータセット内のフィールド数 | 500 項目 |
ソースデータセット内のレコード数 | 100 万レコード |
マージされたデータセットのサイズ | 100 万レコード |
左結合
次の制限
は左外部結合に固有のものです。
ソースデータセット内のフィールド数 | 250 項目 |
各ソースデータセット内の行数 | 50,000 行 |
トラブルシューティング
マージタスクの設定および実行時に発生する可能性がある問題がいくつかあります。
- 項目名が不明瞭であるため、マージタスクは実行されません。これは、タスク設定のステップ 25 の 2 つのフィールドに同じ名前が指定されていることが原因です。続行するには、フィールドの 1 の名前を変更してください。
- データセットが現在構築中であるため、マージタスクは実行されません。これは、ソースデータセットの 1 つとして古いサーベイを使用してタスクが実行されているために発生します。24 時間後にタスクを再実行して続行します。
- 新しいサーベイがソースデータセットとして選択されている場合、マージタスクは実行されません。これは、タスクの設定中に新しいアンケートを選択できるにもかかわらず、処理できないことが原因です。タスクを再実行する前に、最大 24 時間待機します。
- ソースアンケートデータセットに最近の変更があった場合、マージタスクは実行されません。これは、タスクの設定時に変更が表示されていても、処理に使用できない変更によって発生します。タスクを再実行する前に数時間待機します。
- マージタスクの設定時、またはマージされたデータセット内での新しいアンケート回答は使用できません。これらの回答がタスク内で利用可能になるまで数時間待機します。