異常値の使用 (Studio)
外れ値の使用について
外れ値は、特定のデータポイントに関して一意または異常な単語を迅速に特定する根本原因探索ツールです。
異常値の仕組み
外れ値は、選択したデータ内の単語、関連する単語、またはハッシュタグの普及度を、ウィジェット全体の普及と比較し、それらの単語を最大の格差でランク付けします。予想をはるかに希少だったり、かなり人気のある言葉が最高ランクインしている。
外れ値は、以下の基準のいずれかを満たす単語、関連する単語、およびハッシュタグを示します。
- これらは、データセットの他の部分とは異なり、選択したデータポイントに対して異常に発生します。
- これらは、データセットの他の部分とは異なり、選択したデータポイントでは通常まれにしか発生しません。
ヒント:外れ値は、実際には個々のボリュームが非常に少ない場合があります。なぜなら、これらの用語は、他のデータポイントと比較してデータポイントのボリュームが異常に少ないためです。
外れ値は、Studio で任意のデータポイントの “上位 10 語” を検索する代替手段であり、単独でも有用です。ただし、”上位 10 語” はすべてのデータポイントの上位 10 個の値であることが多く、関心のある特定のデータポイントの背後にある状況を必ずしも区別するわけではありません。
前提条件変更メトリック
先行変化は、ウィジェット全体のデータと比較して、ドリルした項目に対する外れ値の一般的度合いを示します。
外れ値にドリルすると、XM Discoverはドリルされた項目のインタラクションを評価し(これを「前景」と呼びます)、それらのインタラクションをウィジェットのインタラクション全体と比較します(これを「背景」と呼びます)。次に、普及率の格差が最も高い値、つまり普及率で最も珍しい値を提示します。「事前価性」変化指標は、その格差が極限と外れ値の程度をより的確に把握するためのものであることを正確に示しています。
Prevalence Change は、次の式を使用して計算されます。
Prevalence Change = percent pusence foreground – percent pusence background
背景と比較して、ドリルされたグループで単語が異常に珍しい、負の値になることに注意してください。
外れ値を使用するタイミング
外れ値を使用すると、以下のようなメリットがあります。
- 異常なデータ要素 (トレンドグラフ上のスパイクやディップ、パイまたはヒートマップ上の巨大な領域、ワードクラウド上の関連色など) を調査し、その原因を明らかにします。
- ドライバの使用。ドライバーは、単語、関連する単語、ハッシュタグを結果のインジケータとして返しません。異常値の場合、データポイントを選択し、相関関係を導出します。
- 潜在的な新しいトピックを見つけるためにトレンド用語を探す。
外れ値の表示方法
- ダッシュボードを表示モードで開きます。
ヒント:外れ値は表示モードでのみ使用できます。
- 分析するデータポイントをクリックします。
- 異常値をクリックします。
データポイントに関連付けられた単語、関連付けられた単語、およびハッシュタグを示すテーブルが生成されます。これらはいずれも順位別にソートされ、普及率の格差が最も高いものが上位に位置する。