知的エンティティ
XM Discoverのインテリジェントエンティティについて
Intelligent Entitiesは、テキストフィードバックデータ内の様々なプロパティを検出し、構造化属性に変換するのに役立ちます。これらの属性を使用すると、データのさまざまな次元を探索し、これらの要素が測定しているエクスペリエンスにどのような影響を与えているかを確認することができます。
XM Discover NLPエンジンは、すぐにさまざまなエンティティを検出します。各カテゴリーの概要については、「インテリジェント・エンティティのタイプ」のセクションを参照。
知的主体の種類
XM Discoverは、以下のIntelligent Entities属性を自動的に導出します:
- ビジネス・エンティティ:業界、企業、ブランド、製品属性の4階層。
- 識別タグ:顧客エンゲージメントのために個人を特定するのに役立つ属性。
- 文化タグ:祝日や顔文字など、さまざまな文化的要素を検出する属性。
- バイオメディカル・エンティティ:医学的条件、処置、薬剤名を検出する属性。
- CB検出機能:他のすべてのタイプの検出機能を集約した単一の属性。
事業体
Business Entitiesグループには、業界、企業、ブランド、製品属性の4階層があります。
この階層は、(最も一般的なものからより具体的なものへと)エンティティがウォーターフォール構造でつながっている:
レベル | エンティティ | 説明 |
1日 | CB 産業 (cb_bc_industry) | Business Entity階層で特定の業界に割り当てられた製品、ブランド、または企業の言及に基づいて、業界値を入力します。例えば、ボーイングやその製品について言及されるたびに、CBインダストリーは “航空宇宙 “と定義される。 |
2 | CBカンパニー (cb_bc_company) | 特定の企業(たとえば「The Boeing Company」)の言及や、Business Entities階層で特定の企業に割り当てられているブランドや製品の言及を検出します。 |
3 | CBブランド(cb_bc_brand) | 特定のブランド(たとえば「BOEING」)の言及や、Business Entities階層で特定のブランドに割り当てられている製品の言及を検出します。 |
4日 | CB製品 (cb_bc_product) | 特定の製品(例えば「ドリームライナー」)に関する言及を検出する。 |
企業、ブランド、商品、名前のカスタム辞書を定義したり、デフォルトの Business Entities 階層を拡張することで、すぐに使えるエンティティの認知・承認を強化できます。
識別タグ
Identification Tagsグループには、顧客エンゲージメントのために人々の名前、電話番号、メールアドレスを特定するのに役立つ属性が含まれています。
エンティティ | 説明 |
CBパーソン (cb_bc_person) | 人名の言及を検出する。 |
CBメールアドレス (cb_bc_email) | メールアドレスの言及を検出する。 |
CB電話番号 (cb_bc_phone) | 電話番号の言及を検出する。
 ; |
識別タグは、ヒンディー語のCB Person認識を除き、サポートされているすべての言語で処理されたフィードバックに対して機能します。
文化タグ
Cultural Tags グループには、顧客フィードバックのさまざまな文化的要素を検出する属性が含まれます。
エンティティ | 説明 |
CB顔文字 (cb_bc_emoticon) | 絵文字や顔文字に関する言及を検出します。 |
CB イベント (cb_bc_event) | 事前に定義されたリストに基づいて、祝日、文化イベント、季節の行事に関する言及を検出します。 |
絵文字の認識は、サポートされているすべての言語で処理されたフィードバックに対して機能します。イベント認知・承認は、英語、フランス語、ドイツ語、スペイン語で処理されたフィードバックに対して機能する。
バイオメディカル事業体
Biomedical Entitiesグループには、医学的条件、処置、薬剤名を検出する属性が含まれる。Biomedical Entitiesの認識は、英語のみで処理されたフィードバックに対して機能する。
エンティティ | 説明 |
CB 条件 (cb_medical_condition) | 病気や診断(例えば “covid “や “meningitis”)などの医療条件の言及を検出する。 |
CB 医療処置 (cb_medical_procedure) | 医療処置(例えば「マンモグラム」や「背中の手術」)に関する言及を検出する。 |
CB Rx (cb_rx) | 薬品名(例えば “アセトアミノフェン “や “タイレノール”)を検出する。 |
CB 検出機能
CB Detected Features 属性は、検出された各エンティティタイプに対応する値を提供する。ITは、検出された機能のタイプによってデータを識別するが、実際の値ではない。例えば、cb_bc_detected:industryフィルターは、業種が検出されたすべてのレコードを返します。しかし、特定の業種に関連するレコードをフィルターする必要がある場合は、代わりにCB Industry属性を使用してください。
現在、XM Discoverは以下の種類のエンティティを検出します:ビジネス、識別、文化、生物医学、および測定。
エンティティ・タイプ | 説明 |
ブランド (cb_bc_detected:brand) | 少なくとも1つのCBブランドエンティティを含むフィードバックを識別する。 |
会社 (cb_bc_detected:company) | 少なくとも1つのCB Companyエンティティを含むフィードバックを識別する。 |
業種 (cb_bc_detected:industry) | 少なくとも1つのCB Industryエンティティを含むフィードバックを識別する。 |
製品 (cb_bc_detected:product) | 少なくとも1つのCB Productエンティティを含むフィードバックを識別する。 |
メールアドレス (cb_bc_detected: “email address”) | 少なくとも1つのCB Email Addressエンティティを含むフィードバックを識別する。 |
人物 (cb_bc_detected:person) | 少なくとも1つのCB Personエンティティを含むフィードバックを識別する。 |
電話番号 (cb_bc_detected: “phone number”) | 少なくとも一つのCB電話番号エンティティを含むフィードバックを識別する。 |
通貨 (cb_bc_detected:currency) | 例えば、通貨名、記号、略語が異なるなど、通貨量に関する個別の言及を含むフィードバック。通貨認識は、英語、フランス語、日本語、ポルトガル語、スペイン語で処理されたフィードバックに対して機能する。 |
顔文字 (cb_bc_detected:emoticon)
 ; |
少なくとも1つのCB Emoticonエンティティを含むフィードバックを識別する。 |
イベント (cb_bc_detected:event) | 少なくとも一つのCBイベントエンティティを含むフィードバックを識別する。 |
冒涜 (cb_bc_detected:profanity)
 ; |
あらかじめ決められた冒涜的な言葉のセットから値を含むフィードバックをタグ付けする。
冒涜の認知・承認は、英語、フランス語、ドイツ語、日本語、スペイン語で処理されたフィードバックに対して機能する。 |
医療条件
(cb_bc_detected: “medical condition”) |
少なくとも一つのCB Medical Conditionエンティティを含むフィードバックを識別する。 |
医療処置
(cb_bc_detected: “medical procedure”) |
少なくとも1つのCB Medical Procedureエンティティを含むフィードバックを識別する。 |
Rx (cb_bc_detected:rx) | 少なくとも1つのCB Rxエンティティを含むフィードバックを識別する。 |
面積 (cb_bc_detected:area) | 二次元空間測定(平方メートルや平方フィートなど)の言及を検出する。 |
データ (cb_bc_detected:data) |
 . (メガバイトやギガバイトなど) 情報ストレージの測定値に関する言及を検出します; |
エネルギー (cb_bc_detected:energy) | エネルギー関連の測定値(ワットやジュールなど)に関する言及を検出する。 |
距離 (cb_bc_detected:distance) | 長さ(インチやメートルなど)に関する言及を検出する。 |
スピード (cb_bc_detected:speed)
 ; |
移動に関連する測定値(mphやkmphなど)の言及を検出します。 |
温度 (cb_bc_detected:temperature)
 ; |
熱に関する測定値(華氏や摂氏など)の言及を検出する。 |
Volume (cb_bc_detected:volume)
 ; |
3次元空間計測(リットルや立方メートルなど)の言及を検出する。 |
重み設定 (cb_bc_detected:weight)
 ; |
質量に関する測定値(オンスやキログラムなど)を検出する。 |
デフォルト事業体の拡大
このセクションでは、ビジネス・エンティティの階層をカスタマイズする方法について説明します。
- 管理者タブに移動します。
- アカウントのセクションに移動します。
- ビジネスエンティティをカスタマイズするアカウントの次へ編集をクリックします。
- 辞書のセクションへ。
- Intelligent Entities Hierarchyを選択する。
- ダウンロード」をクリックすると、現在の階層がコンピュータにダウンロードされます。
- このファイルを表計算エディタで開く。
- その後、ビジネス階層をカスタマイズすることができます。
ファイルが以下の条件を満たしていることを確認してください:- 新しい列は追加しないでください。デフォルトの4列のみ使用可能。
- 業界値の複製は許されない。
- 業種、企業、ブランドは1行に1つだけにしてください。
- ブランドに関連するすべての製品は、1つのセルに含まれるカンマ区切りのリストに記載する。
- 階層アイテムは子アイテムを持つ必要はありません(例えば、プロダクトがなくてもブランドを持つことができます)が、アイテムには親が必要です(例えば、カンパニーがなければブランドを持つことはできません)。
- ブランドタグには空のプレースホルダ(<BC_EMPTY> )を使用し、企業が製品のみを持ち、ブランドを持たない場合に備える。空のプレースホルダーはブランドに対してのみ許可されます。
- 商品名にカンマやその他の特殊記号が含まれている場合は、ダブルクォーテーションで囲んでください(例:”FarmVille 2: Country Escape”)。
- カスタム企業、ブランド、およびカスタム製品を Business Entities 階層に追加する場合は、対応するlexicon の列 3 で指定されている正規形を使用します。
- 終了したら、CSVまたはXLSXファイルとして保存します。
- XM Discoverで、Uploadをクリックします。
- Choose Fileをクリックし、コンピュータに保存されているファイルを選択します。
- ファイルのアップロードをクリックします。エラーがあれば、それを修正するために表示されます。
- Finishをクリックしてファイルをアップロードします。
再処理階層属性
新しいBusiness Entities階層をプロジェクトに適用するには、階層属性を再処理する必要があります。
階層属性を再処理するデータフローを実行します:
- Categorizeタブに移動します。
- カテゴリーモデルを右クリック
- 実行]、[カスタムデータフロー]の順に選択する。
- 階層属性の再処理を選択する。
- ご希望のプロセスモードを選択します:
- 履歴:このモードを使用して、インテリジェントエンティティによってすでにタグ付けされた履歴データに、製品レベルより上の最新のビジネスエンティティ階層の変更を適用します(たとえば、特定の製品、ブランド、または企業の業種を「航空宇宙」ではなく「重工業」として検出したい場合など)。
- インクリメンタル(Incremental):このモードを使用すると、履歴データを更新せずに、この時点からプロジェクトにアップロードされるデータに最新のビジネスエンティティ階層が適用されます。
- 実行をクリックする。