自然言語生成とは何か?

自然言語生成とは何か?

2022年までに、25%の企業が何らかの形式でビジネスに自然言語生成技術(NLG: Natural Language Generation)を取り入れると予測されています。しかし、アナリティクスの観点から、NLGとは何を意味するのでしょうか。そして、これはユーザーの分析をどのように強化することができるのでしょうか。

 

自然言語生成(NLG)は、人工知能(AI: Artificial Intelligence)のサブタイプとして最もよく表現され、文章と音声の両方において、言語的に豊かなインサイトの説明を分かりやすい言葉を用いて生成します。

これは、データベースやアプリケーションに格納されている構造化されたデータの中から、最も興味深く重要なコンセプトを自動的にスキャンして検索し、それを一般的なビジネスユーザーがアクセスして理解できる、使いやすいテキスト形式の説明に変換することによって実現されます。多くのBIプラットフォームが、ユーザークエリーインターフェースの一部としてNLGを統合しています。

これら動的に生成されたナラティブは、重要な情報を比較または要約し、それを人間のような方法で伝えることで、ユーザーのクエリーにより意味のある回答を提供します。またこれは、ユーザーの使用を潜在的に高める可能性もあります。

最も重要なことは、自然言語は、高レベルで詳細な説明により、複雑なデータポイントに対して、重要な文脈を提供することに焦点を当てていることです。

 

自然言語生成はどのように機能するのか?

自然言語生成は、自然言語処理(NLP: Natural Language Processing)、自然言語理解(NLU: Natural Language Understanding)、自然言語クエリー(NLQ: Natural Language Query)と並ぶ、自然言語技術(NLT: Natural Language Techonology)のひとつの分野です。これらの幅広い分野には、テキスト分析、機械翻訳、テキスト要約、言語知識グラフ、およびさらに高度な技術が含まれています。これは以前からも可能でしたが、データアナリティクスにおけるAIと機械学習(ML: Machine Learning)の台頭により、両者を組み合わせることで大幅な機能向上が可能になりました。

これまでのNLGは、あらかじめ設定された文法や意味のルールに基づいて、ユーザークエリーに対する比較的基本的な回答を生成し、通常は空欄を埋める形式でテキスト出力を生成していました。

ビジネスデータをテキストに変換する基本的なNLGには、日付、単語、時刻などの変数を自動生成された単純な変換に挿入するルールベースの機能を備えたテンプレート形式のシステムを使用する従来の(または便利な)例が数多く存在します。

現在、最新の自然言語生成の多くは、AIプログラミングや計算言語学、ディープニューラルネットワーク法、および機械学習(ML)アルゴリズムを使用して、より会話的で、「人間的な」トーンで表現された、文章または音声形式のナラティブを生成します。またNLGは、APIの呼び出しや、JSON(JavaScript Object Notation)フィード、チャットボットなどのユーザーとのリアルタイムフィードなど、以前よりも複雑に構造化されたデータソースにもアクセスできるようになりました。

これら多くの進歩により、NLGはデータ内の事実を単に変換するだけでなく、論理的に、そしてより確実に、さらに洗練された回答をユーザーに提供できるようになりました。これは、以下の内容を実現できます。

  • 分析されたデータから得られた結果を会話的で、人間のような形式で表現
  • 興味深いニュアンスや隠れたパターンを強調することで、インサイト力を向上
  • 各ユーザーが即座に要求できる要約および詳細レベルの説明を提供

 

NLGは自動化を利用しているため、膨大な量のデータを確認し、ユーザーが手作業で解読して伝えるよりも早く、データからインサイトを生成することができます。

ある種のNLG機能を備えたアナリティクスソリューションによって生成される豊かな言語には、グラフや表など、自動生成されたデータビジュアライゼーションが伴うことも多いです。これらのビジュアライゼーションは、テキスト形式のナラティブのように、ユーザーに有用な文脈を追加で提供し、何が最も実行可能なのかを伝えるのに役立ちます。

 

2021年におけるNLGのビジネス事例

ビジネスデータからテキスト形式のナラティブや、音声コンテンツを生成する必要がある場合には、自然言語生成が役立ちます。そのため、これは数多くのBIツールに導入されています。

NLGは、セルフサービスアナリティクスのための有用な機能強化として、最も一般的に導入されています。例えば、収益実績のダッシュボードを確認しているビジネスユーザーは、理論的には、データを照会してテキスト形式の説明や比較を得ることができ、探索できることも知らなかったかもしれない隠れたパターンや追加のインサイトを導くことができます。

また、NLGを使用することで、通常であれば時間のかかる分析レポートタスクも実行できます。小売業者であれば製品説明の作成に使用し、セールスであれば月次実績のハイレベルなテキスト分析を、手書きに代わって作成することができます。これらの有効性は、NLGの導入に依存します。

最後に、NLGは顧客との人間的な会話の生成において(チャットボットや音声アシスタントのような)仮想会話アシスタントを補完するために頻繁に使用されていますが、音声形式で自然な応答を生成する能力は、現時点ではあまり開発されていません。

 

NLGをアナリティクスに導入することで得られるビジネス上の利点

未だ進化を続け、その価値を証明しつつも、NLG技術がもたらす潜在的なメリットは既に明らかです。

意思決定のサポート:自然言語生成は、アナリティクスツールを使用しながら、一般的なユーザーの意思決定プロセスの効率や有効性を向上させます。これは、答えが必要なデータの要約や詳細な説明および比較を瞬時に生成することで、ユーザーの既存の知識やスキルセットを補完します。

インサイトの解釈:人々が分析を理解するレベルはそれぞれに異なります。一般的なユーザーにとっては、NLGのような機能を使用して重要な質問に対するテキスト形式のナラティブを生成できるオプションがあれば、データをより確実に正確に解釈し、手作業では見つけられない隠れたパターンやニュアンスへ導くことができます。ユーザーがデータの視覚的な伝達よりも読解を好む場合、自然言語生成は、統計的な関係など、複雑なデータをはるかに簡単に解釈するサポートを提供します。

時間の短縮:ビジネスデータの要約作成など、ユーザーが手作業で完了させる場合は多くの時間を要する、繰り返し行われるレポート作成作業が数多く存在します。自然言語生成は、ユーザーが手作業でデータを分析したり、IT部門やアナリストからの支援を求めるために多くの時間を費やすことなく、特定の情報を素早く生成することで効率性を高めることができます。

 

なぜNLGはアナリティクスプラットフォームに使用されているのか?

多くのユーザーにとって、必要な答えを探しているときには、グラフィカルなインターフェースや豊かなビジュアライゼーションよりも、自然言語生成によるテキスト形式のナラティブの方が好ましい場合があります。文脈的アナリティクスのような機能と組み合わせることで、ダッシュボードやレポートに表示されたデータをツールが説明してくれるため、より簡単に理解することができます。

誰もが物事を数値的に考えているわけではないのが現実です。例えば、読書を好む傾向の人も数多く存在します。このような人々は、数値が詰め込まれた可視化されたグラフを解釈しなくてはいけない場合、イライラしたり、データから必要な答えを導くことができないかもしれません。

弁護士は、その役割において多くの読み書きを行うため、これの良い例です。このような人々に状況を説明するために、数字やグラフ、高度に統計的なレポートを提示することはないでしょう。このような場合に、自然言語により生成された説明が大いに役立ちます。

例えば、Yellowfin 自動インサイトは、幅広い範囲の様々なBIユーザーに対応するのに役立ちます。これはNLG技術を使用して、提示された多くのメトリックを解釈するために高レベル、または詳細な情報を必要とするユーザーのために、有用なビジュアライゼーションと読みやすいテキスト形式のナラティブの両方を生成します。ユーザーはデータの一部をクリックするだけで、提示された内容を「自動分析」することができ、システムはテキスト形式のインサイトの説明や比較を即座に生成し、より優れた解釈の形成をサポートします。

 

アナリティクスにおけるNLGの現状の制限

Business questions ideas and creativity

NLGは、人々がレポートを作成するために、より優れた方法を求めたことで生まれました。コンセプトとして、その目的には説得力がありますが、その可能性を最大限に引き出すためには、技術をさらに洗練させる必要があります。また、より広く採用されるまでには、いくつかの障害に対処する必要もあります。

既存の特定のBIソリューション内の自然言語生成アプリケーションは、ユーザークエリーに対応するために、簡素化された検索ボックスに落ち着く場合が多いです。しかし、ユーザーが回答を得るためには、何を質問したいのか、どのような回答を求めているのかを正確に把握していなければならず、これは理想的ではありません。これはまた、ユーザーが尋ねることのできる質問の種類を簡素化するため、その潜在能力を制限します。

例えば、データがどのように整理されているのか、どのように質問をすればよいのかを理解していないビジネスユーザーは、検索ボックスを使用してアナリティクスプラットフォームに回答を問い合わせることができません。アナリティクスソリューションが回答として生成できる結果の数も、ユーザークエリーに対して何千もの関連する結果を提示できるGoogleのような主要な検索エンジンと比較すると限られています。このような数の結果を返すことのできるBIベンダーは存在しません。これは非常に非効率的であり、ユーザーがデータベースに何度もデータを問い合わせることで、データベースのリソースを消費してしまうからです。

また、ユーザークエリーに対して自然言語生成を機能させるためには、膨大な量の設定が必要であり、マシンモデルを教えるための時間や労力には専門家の関与を必要とします。問題は、多くのベンダーがこのプロセスの一環として、アナリストではなく言語の専門家を採用し、クエリーに対して最も関連性が高く、理解しやすい回答を提供する方法など、分析的な問題の解決ではなく、ユーザーがアナリティクスに入力する言語を理解する方法など、言語的な問題に多くの時間を費やしていることです。

 

ガイド付きアナリティクス:自然言語生成の次なるステップ

Yellowfinは、アナリティクスにおいて、自然言語生成や自然言語クエリー(NLQ: Natural Language Query)など、その他の自然言語技術を最大限に活用するための次なるステップは、ユーザーを積極的にガイドする新しいクエリーインターフェースの開発であると考えています。

ユーザーが質問を入力しなくてはいけない通常の検索ボックスに代わり、システムはユーザーが次に求めることを動的に尋ね、データに対して本当に質問したいことを絞り込むのに役立つ特定の検索フィルターの一覧を提供します。

例えば、請求書レポートからデータを照会する場合などです。システムは、NLGを使用して、商品の一覧、請求金額、予測、傾向など、質問を始めるための様々な方法を検索したいかどうか尋ねます。

ユーザーは、今年の請求書と昨年の請求書を比較したいかもしれません。その場合は、クエリーボックスに比較と入力することで、システムは何を比較したいのかを尋ね、メトリックを提示します。ユーザーは、どれが何のレポートか、実行したい分析がどのような名称であるか(今回の場合は差異分析)を把握したり、覚えたりする必要がありません。

これがガイド付きアナリティクスと呼ばれるものであり、ここでの重要な違いは、ユーザーがこれらの質問を事前に把握する必要がないことです。依然として質問を入力することはできますが、推測や無関係な結果の多くは回避され、ユーザーの問い合わせプロセスをさらに簡略化します。このタイプのパーソナライズされたNLG機能は非常に有用で、想定しているよりもはるかに現実に近づいています。さらに詳細な内容については、次回のブログにて紹介していきます。

アナリティクスへのNLGの導入とはどのようなものか?

Yellowfin 自動インサイトを使用することで、自動生成されたビジュアライゼーションや、詳細なテキストによる説明や比較を、どのように活用できるのかご確認いただけます。

最新記事一覧

Thanks for trying Yellowfin

Please complete the form below to request your copy of Yellowfin today.