属性概要
属性の概要
属性は、何らかの方法で特徴付けられる文書のプロパティです。属性の一般的な例として、作成者名と作成日付があります。
プロジェクトのカスタム属性を作成できます。また、使用するさまざまなシステム属性もあります。また、文書のテキストに基づいて属性を自動的に検出するインテリジェントエンティティを設定することもできます (たとえば、顧客のフィードバックでブランドまたは製品が言及されたとき)。
属性を追加した後、データの理解を深めるために、追加の派生属性を作成することができます。また、属性を属性セットに編成して、これらの属性について簡単にレポートすることもできます。
属性フィールドタイプ
属性では、以下の項目タイプがサポートされています。
- テキスト
- 数字
- 日付
属性へのアクセス
属性はプロジェクトレベルで管理されます。プロジェクトの属性にアクセスするには、以下の手順に従います。
これにより、プロジェクトの各属性に関する以下の情報を含む属性テーブルが開きます。
- 名前: 属性のシステム名。命名要件については、属性名を参照してください。
- 表示名: 属性の表示名。レポートやフィルタなどに表示されます。命名要件については、属性名を参照してください。
- タイプ: 属性のタイプ。標準属性の場合、値はテキスト、番号、または日付になります。派生属性の場合、値はディメンションルックアップ、範囲ロールアップ、満足度スコア、またはカテゴリから誘導にすることができます。
- グループ: 属性のグループであり、その発生源と用途を表します。値は以下のいずれかです。
- 派生カテゴリ: モデルまたはカテゴリから誘導された属性。
- システム: システム属性。
- カスタマ定義: 任意のデータソースから利用可能なすべてのカスタム属性 (次元ルックアップ、範囲ロールアップ、満足度スコアなど)。
- スコアカード: インテリジェントスコアリングで使用される属性。
- レポートに対して有効化: 属性がレポートに対して有効化されている (オン) か、有効化されていない (オフ) かが表示されます。
- 大文字/小文字区別: 文書エクスプローラ、ソースハイライタ、カスタムエクスポート、および文のプレビューエクスポートで値を表示する際に、属性に大文字/小文字の区別ありフラグが設定されているかどうかが表示されます。
- ドリルパス: 定義されている場合、カスタムドリルパスが表示されます。カスタムドリルパスがない場合、このフィールドは空白になります。
- 電子メールフィールド: 属性に電子メールアドレスが含まれているかどうかを示します。
- Enable DocValue: この属性に ElasticSearch ドキュメント値が使用されるかどうかを示します。
- [区切り文字による複数値の有効化]: この属性で複数の値が有効になっているかどうかを示します。
- 親: 属性が派生属性の場合、このフィールドには “親” が表示されます。カスタム属性および標準属性の場合、このフィールドは空白になります。
- アクション: 属性に対して次のアクションを実行します。
- 属性の編集
- 派生属性の作成
- 属性を削除
属性セットの管理
ページ上部の属性セットトグルを使用して、属性セットを表示します。これにより、新規属性セットを登録し、既存の属性セットを削除することができます。属性を選択して、個別の属性を表示します。
システム属性
XM Discover にアップロードされた各ドキュメントに自動的に適用されるシステム属性(ドキュメント日付やソース ID など)がいくつかあります。これらの属性は、XM Discover内でフィードバックを管理するのに役立つほか、NLPエンジンから派生したXMデータでフィードバックを充実させるのに役立ちます。
以下は、さまざまな属性カテゴリ別にグループ化された、さまざまなシステム属性の表です。このテーブルには、各属性に関する以下の情報が含まれています。
- 名前: レポート、フィルタなどに表示される属性名。
- システム名: データのクエリまたはフィルタリングに使用する属性のシステム名。
- タイプ: 属性タイプ。
- 説明: 属性の意味および目的の簡単な説明。
- 粒度: 属性に関連付けられたデータ粒度のレベル。たとえば、「センテンスワードカウント」は文レベルでのみ関連し、「ドキュメント日付」はドキュメントとそのドキュメントの各文の両方で使用できます。
ID および参照
名前 | システム名 | タイプ | 説明 | 粒度 |
伝票 ID | _id_document | 数値 | ドキュメントの一意のシステム ID。自然IDとは異なり、ドキュメントIDはXM Discoverによって自動的に生成されます。 | 文書および文 |
ナチュラルID | natural_id | テキスト | ドキュメントの一意の Natural ID。伝票 ID とは異なり、Natural ID は、伝票のアップロード時に指定された項目から生成されます。自然IDは重複検出に使用され、XM Discoverの外部でドキュメントをソースにトレースする場合にも役立ちます。 | 文書および文 |
文 ID | _id_sentence | 数値 | 文の一意の ID。この ID は自動的に生成されます。
|
文 |
セッション ID | _id_batch | 数値 | ドキュメントが XM Discover にロードされた間のアップロードセッションの一意の ID。この ID は自動的に生成されます。 | 文書および文 |
ソース ID | _id_source | テキスト | データソースの名前。データソースに応じて、伝票のアップロード時に指定した項目から自動生成するか、または生成することができます。 | 文書および文 |
用語 ID | _id_verbatim | 数値 | 単語の一意の ID。この ID は自動的に生成されます。 | 言葉と文 |
バーベイタムタイプ | _verbatimtype | テキスト | 単語フィールドの名前。この属性を使用すると、データのさまざまな語彙フィールドで文を区別できます。 | 言葉と文 |
日時
名前 | システム名 | タイプ | 説明 | 粒度 |
CB 登録日付 | cb_date_created_utc | date、エポック時間 (ミリ秒) | ドキュメントが XM Discover に追加された日付。この日付は自動的に生成されます。 | 文書および文 |
CB 更新日付 | cb_date_updated | date、エポック時間 (ミリ秒) | ドキュメントが最後に更新された日付。更新には、分類の変更は含まれません。この日付は自動的に生成されます。 | 伝票 |
伝票日付 | _doc_time | date、ISO 8601 (秒) | ドキュメントの主要な日付。ドキュメント日付は、レポート、傾向レポート、アラートなどで使用されます。この日付は、伝票のアップロード時に指定された項目から生成されます。 | 文書および文 |
伝票日付 (時刻なし) | _doc_date | date、yyyy-mm-dd 形式 | タイムスタンプのないドキュメントの日付。
この日付は、伝票のアップロード時に指定された項目から生成されます。 |
文書および文 |
時刻 | time_of_day | テキスト、hh:mm フォーマット | 1 時間にロールダウンされた伝票の時刻。たとえば、9:09 と 9:59 に投稿されたコメントは、どちらも 9:00 にロールアップされます。この属性は自動的に生成されます。 | 文書および文 |
単語数と位置
名前 | システム名 | タイプ | 説明 | 粒度 |
CB 文書ワードカウント | cb_document_word_count | 数値 | ドキュメント内の単語の数。文書ワードカウントは、すべてのセンテンスワードカウントの合計です。
|
文書および文 |
CB 文四分位数 | cb_sentence_quartile | 数値 | 文の一部分が入る。この属性の値は、1、2、3、または 4 のいずれかになります。各セクションは、全長全体の 25% を表します。 | 文 |
CB 文ワードカウント | cb_sentence_word_count | 数値 | 文に含まれる単語の数。 | 文 |