自然言語クエリが普及しなかった理由
アナリティクスユーザーを正しい答えに導けるのであれば、データに質問する機能の提供は役に立ちます。
ここ2、3年、市場では自然言語クエリ(Natural Language Query)が注目を集めています。多くのベンダーが製品を市場に投入し、アナリストコミュニティでは、NLQがBI分野で長い間問題視していた点を解決するのではと考えられていました。しかし、まだそれを実現するには至っていません。
このブログでは、YellowfinのCEOであるGlen Rabieが、検索ベースアプローチの自然言語クエリについてと、Yellowfinの新しいガイド付きのアプローチについて説明します。
目次
今日の自然言語クエリの問題
アナリティクスベンダーが解決しようとしている主な問題は、ビジネスユーザーが簡単にデータについて質問できるようにし、すぐに回答を得られるようにすることです。現在の解決策は、ユーザーが質問を入力できるGoogleのような検索バーを提供することでしたが、これでは核となる問題を解決できません。
ビジネスユーザーが、「ヨーロッパの今年の売り上げは昨年と比べてどうだったか?」という非常にシンプルな質問をする場合、テキストボックスではすべてが解釈に委ねられている為、従来のUI環境では非常に難しいものでした。質問には曖昧な部分が多く、何を言いたいのか正確に把握するのが難しい場合があります。システムは、どのデータを照会したいのか、データのコンテキストは何か、使われている可能性のある同義語が何かを判断することができません。
このような典型的なNLQのアプローチだと、ベンダーとしては、分析上の問題を解決するのではなく、意味上の問題を解決することに時間を費やすことになります。その結果、多くのベンダーは、検索ツールを使ってできることや、アクセスできるデータの範囲を限定してしまいました。これは、自然言語ソリューションの価値が限られていることを意味し、この種のツールの普及と成功がみられない理由となっています。もう一方では、ドロップダウンメニューやドラッグ&ドロップがあります。これらはユーザーがUIを操作し、特定の結果を選択してレポートを作成する典型的な分析ツールです。このソリューションでは、データの構造上、広い予備知識が必要であったり、ツールの専門家でなければならないということがあり、ビジネスユーザーが答えを得るには非常に困難なものです。
検索ベースNLQの3つの課題
検索ベースNLQのアプローチの3つのチャレンジの実例を紹介します。
1.高価:Googleや検索エンジンを使ったことがある方なら、コンセプトに馴染みがあるかと思いますが、検索ベースのNLQは、クエリに含まれるキーワードを解析し、関連するデータベースと照合します。しかし、回答をビジネスデータにマッピングするのは難しく、コストもかかります。Gartner社の2021年のアナリティクス&ビジネスインテリジェンスのHype Cycleでは、検索ベースのNLQでは、データのマッピングとモデル化に多大な労力を要するが、その結果サポートされる質問が基本的すぎて役に立たなかったり、不正確な結果をもたらすとされています。
2.統合機能の欠如:市場に出回っているNLQを搭載したアナリティクスソリューションは、分析に必要な複雑なクエリ、データサイズやデータタイプをサポートしていません。また、自然言語クエリ(NLQ)と連動して、発見した内容をユーザーフレンドリーな方法で提供したり、関連する発見をユーザーに素早く表示する自動化インサイトもありません。
3.未完成さ:多くのNLQは、英語以外の言語をサポートしておらず、ユーザーが検索を進める上で役立つ次の質問の例も提供しません。また、どの程度の情報を事前に定義したり、どの程度の情報を作成する必要があるのかも分からず、必要なバランスを調整している段階のようです。
このような障害があるからこそ、YellowfinはNLQの素晴らしい技術とその可能性を活用し、アナリティクスを分析者や専門家だけではなく、すべてのユーザーに広めるために、検索ベースではなくガイド付きのクエリが最適であると考えています。
Yellowfinがガイド付きアナリティクスでNLQを変える方法
Yellowfinは、自然言語に対して根本的に異なるアプローチをとりました。ユーザーがデータに対して正しい質問をして、正しい答えを得るようにガイドするアプローチです。
私たちは、複雑なUIと検索をどう融合させ、新しいパラダイムにもっていく方法を考えました。ビジネスユーザーが自由にデータの調査をし、簡単に回答を得る方法を実現したいと思っています。私たちのソリューションは、アナリストのサポートを必要とせず、自分でデータにアクセスできるようにします。そしてこれが、スキルのレベルに関係なく、セルフサービスユーザーがインサイトを得るための方法の一つになるということが重要なのです
手作業でデータを掘り下げていったり、従来のダッシュボードやグラフから回答を見つけるのではなく、NLQを使って直接システムに質問をしていくことで、適切な回答を得ることが出来るのです。
NLQが注目されるようになったのは、アナリティクスのベンダー達が、データストーリーテリングや自動ビジネスモニタリングなど、分析プロセスを効率化させる最新のツールを提供し始めたことが背景にあります。
NLQがソフトウェア企業やエンタープライズのアナリティクスユーザーに与えるものとは?
セルフサービスアナリティクスは、ユーザーのニーズに合ったものでなければなりません。多くのBIソフトウェアベンダーは、優れたユーザーインターフェースと効率化されたプロセスにより、セルフサービス分析を容易にしていますが、これらのツールを使うには、技術的知識、データリテラシー、スキルが必要となります。
例えば、セルフサービスのダッシュボードツールがあるからといって、営業チームがレポートやグラフを作成することは恐らくないでしょう。時間もなければスキルもないかもしれません。これらのオプションは、日々複雑なレポートを作成するデータアナリストや、技術を持ち合わせたダッシュボード作成者向けです。
NLQはこのような状況を変え、従来のBIソリューションの知識が浅い(または時間に余裕のない)非技術系ユーザーや、ダッシュボードやグラフから同レベルの理解を得られないユーザーにとって、コンテンツを作成する第3の手段となることができます。
私たちが用意しているものは、既に市場に出回っているものとは大きく異なります。ガイド付きNLQを導入し、インサイトの発見の仕方が変わることを楽しみにしています。
自然言語クエリ(Natural Language Query)とは?
2022年までに、25%の企業が何らかの自然言語技術をビジネスに取り入れるとされています。私たちのブログガイドから、NLQの知識を深め、ガイド付きNLQと検索ベースNLQの違いについて知ってください。