BIとアナリティクスに関するChatGPTのハイプと現実を読み解く
ChatGPTのパワーは驚異的で、さらに重要なのは、信じられないほどの速さで成長していることです。ほぼすべてのBIおよびアナリティクスベンダーがこの分野での取り組みを始めており、いくつかのベンダーは統合を実装していますが、そのアプリケーションはまだ実験的なものが中心です。ChatGPTに対する期待値は非常に高いですが、もちろん正当な理由から懐疑的な人も大勢います。
本ブログでは、ChatGPTがビジネスインテリジェンスの取り組みに役立つ分野を紹介し、今のところ現実よりもハイプが大きいかもしれない分野について議論します。
ChatGPTとは何か?
まずは、ChatGPTとは何か、これは何に使えるのかを考えてみましょう。
ChatGPTを定義するのに最適な方法は、実際にこれに尋ねてみることではないでしょうか。
*以下実際にChatGPTに質問をした際の回答です。
「ChatGPTは、OpenAIが開発した大規模な言語モデルです。GPTは「Generative Pre-trained Transformer」の略で、自然言語処理タスクにおいて非常に高い精度を発揮するニューラルネットワークモデルの一つです。ChatGPTは、このGPTモデルをベースに、多数のトレーニングデータを用いて学習されたモデルであり、人工知能チャットボットの一種です。ChatGPTは、自然な言語で人と対話することができ、さまざまなトピックについての質問や会話に対応することができます。
ChatGPTは、人工知能チャットボットとして様々な用途に使用することができます。例えば、カスタマーサポート、オンライン教育、情報提供、エンターテイメント、コンシューマーアプリなどがあります。
以下にChatGPTが使用される可能性のあるいくつかの用途をいくつか挙げてみます。
- カスタマーサポート:ChatGPTは、企業が提供する製品やサービスに関する問い合わせに対応するカスタマーサポートボットとして活用することができます。
- オンライン教育:ChatGPTは、学生が質問や疑問を解決するために利用できる教育用のチャットボットとしても利用できます。
- 情報提供:ChatGPTは、ユーザーが必要な情報を得るために利用できる情報提供ボットとして利用できます。例えば、天気予報、ニュース、交通情報などがあります。
- エンターテイメント:ChatGPTは、人々が遊ぶために利用できるエンターテインメント用のチャットボットとしても利用できます。例えば、ジョークやクイズ、ゲームなどがあります。
- コンシューマーアプリ:ChatGPTは、様々な種類のコンシューマーアプリに統合することができます。例えば、健康管理アプリ、食事管理アプリ、ショッピングアプリなどがあります。
ChatGPTは、多くの用途において、人間による対話やサポートの代替手段として、またはその補完として活用されることが期待されます。」
本ブログでは、現在の知名度からChatGPTに注目していますが、Google DeepMindなどによる同様の強力な取り組みもあり、これらにも注目すべきでしょう。
ChatGPTはデータアナリティクスにどのようなメリットをもたらすのか?
ChatGPTは、説明の中でデータ分析をこっそり取り入れていましたが、その能力の中核は、ほとんどすべてのトピックについて人間のような文章を生成する非常に正確な確率的方法に基づいています。生成モデルのバリエーションは、画像や音楽を扱うことができます。ただ、この小さなブログでこれらのツールを正当化するのは難しいので、背景の紹介はこの辺にしておきます。
ChatGPTは、テキスト分析 (インサイトや感情の抽出など)、視覚分析のテキスト解釈、コンテンツの生成に関しては、人間からコンピュータ言語まで様々に対応できる素晴らしい能力を持っています。しかし、ChatGPTは、実際の計算による予測やその他の定量的なデータを実行するように設計されていません。その代わり、テキストデータを分析し、予測モデルに情報を提供するためのインサイトを生成することで、予測プロセスをサポートすることができます。
それでは、BIやアナリティクスでChatGPTを活用できる分野をいくつか見ていきましょう。
1. データおよびグラフの文脈的な「テキスト」への解釈
BIツールはデータの可視化に優れています。これは、様々なバリエーションの美しいグラフを生成することができますが、データを解釈し、傾向を特定して、それを効果的に伝えるためには人間が必要です。
旧来のExcelからの主な進歩のひとつは、BIソリューションによってデータをより効果的に視覚化し、ビジュアライゼーションを動的に変更できるようになったことです。ChatGPTを使用することで、まったく別の角度から、平均値や外れ値などの重要な発見を含むデータを平易な文章で説明することができます (自然言語クエリツールと類似) 。以下は、ChatGPTから生成した例です。
「休暇中には売上が20%増加し、その中でも電気機器、玩具、家庭用品の売上が最も高い割合を示しています。北東および西部地区は、中西部および南部地域と比べ、それぞれ25%と30%という高い販売量を示しています。オンラインセールスは15%の割合で伸びています。休暇中に業績の高いカテゴリーと地域に焦点を当てることで、最大20%の売上増加が見込まれます。オンラインセールスチャネルとプロモーションキャンペーンに投資し、売上拡大を目指しましょう。」
これは確かにたくさんのグラフを読み解くよりも分かりやすいです。
しかし、モデルを正確にトレーニングするには、データ構造をよく理解し、高いレベルの一貫性を持たせる必要があります。セールス分析など比較的狭い分野では使いやすいかもしれませんが、膨大な数のアナリティクスユースケースでは、BIベンダーによる単一の実用的なソリューションは考えられません。
今日これを確実に実現する、よりシンプルで実用的なAI対応ツールがあります。それがYellowfinの自動インサイトです。これは、ChatGPTで可能になる確率的アプローチではより困難な、データの整合性を維持するドリルダウングラフが混在するナレーションを提供することができます。
ChatGPTは、革新的なドメイン固有のアナリティクスソリューションのために多くの新しい機会を生み出すでしょう。従来のBIプラットフォームを活用して既存のソリューションに統合または組み込みができる新しいベンダーが多数出現することが予想されます。これにより、差別化を図りつつ、提供を加速し、リソースを最適化することができます。これは、組み込みBIおよびアナリティクスの機会が今後も拡大するというわたしたちの予想と一致します。
2. コード生成と「プログラミング」
BIツールは、データにアクセスし対話するためにプログラミング言語を使用します。ビジュアルインターフェースでさえ、入力の組み合わせをコードに変換します。データベースへのアクセスや操作で最もよく使われる言語はSQLです。
前述の通り、ChatGPTはLLM (大規模言語モデル: Large Language Models) と呼ばれるツールの一種であり、翻訳を含む言語タスクに優れています。英語のプロンプトを入力し、対応するSQLコード (またはPython、JSなど) を生成することは十分に可能です。多くのベンダーがこのアプローチを試しており、ThoughtspotやTelliusのように、正式な製品統合を行なっている企業もあります。しかし、結果は一様ではありません。生成されたコードが本番に使えることはほとんどありませんが、アイデアや生産性の向上に役立つことは間違いないでしょう。モデルトレーニングに適したプログラミングデータの世界ははるかに限られているため、この分野の進歩のペースを判断するのは困難です。
こうした限界を認識したYellowfinでは、ガイド付きNLQ (自然言語クエリ) という少し異なるアプローチを採用しました。これは自然言語処理 (NLP) モデルとは一線を画すものですが、何層にもネストしたクエリを必要とするかなり複雑なユースケースにもうまく対応できる、より実用的なアプローチを提供します。ガイド付きNLQを使用すると、ユーザーは有効なデータ要素を提示され、英語のプロンプトに従ったクエリの生成を支援できます。
ガイド付きNLQは、正確さと実用性のために、完全に自由なテキスト入力の優雅さの一部を引き換えにしています。ChatGPTのようなツールの進歩によってNLQが進化するにつれて、ガイド付きNLQをNLPに拡張または置き換えることが可能になるでしょう。実際のところ、Yellowfinが生成するトレーニングデータのリポジトリは非常に有用です。
3. AI中心のアナリティクスプラットフォーム
ここまで述べてきたアイデアは、すべてのBIおよびアナリティクスベンダーに適用可能であり、今後数年で重要な機能になる可能性が高いです。このような機能は、APIを中心としたデプロイアプローチを考えると、比較的容易に製品に統合できることに留意してください。一般的に、ベンダーにとって重要な問題は、プラットフォームがAPI (アプリケーションプログラミングインターフェース: Application Programming Interface) に対して、どの程度フレンドリーであるかということです。
こうした新しいAPIアーキテクチャの実装の容易さは、seek.aiやolli.aiのような新しい興味深いプレイヤーを生み出しています。彼らは、BIやアナリティクスプラットフォームの構築に、完全にAI中心のアプローチを採用しています。分析を推進するために自然言語によるプロンプトにのみ依存することは革新的ではありますが、大規模な実装では恐らく実績がありません。ソリューションには多くの制限がありますが、より簡単で安価な実験方法を提供するAuto-Analyst (https://github.com/aadityaubhat/auto-analyst) のような、複数のオープンソースプロジェクトがあります。ここでも、LLM対応のAI中心アナリティクスプラットフォームで成功するためには、ドメイン中心主義が鍵となる可能性があります。
Yellowfinでは、ChatGPTを実装することが実用的で有用となるあらゆる側面を調査しています。BIツール、特にSaaSツールは、それなりのパワーを必要とします。Yellowfinでは、データがかなり一貫している傾向にある社内のユースケースも検討しました。しかし、そのようなユースケースには、既存の従来の統計モデルや機械学習モデルの方が適していると思われます。LLMモデルはテキスト分析に最適であるため、現時点では上記にまとめたユースケースが最も最適であると思われます。
実際にYellowfinを体験してみましょう
Yellowfinが既存のビジネス独自のユースケースに対応し、AIにより強化されたアナリティクスエクスペリエンスを、顧客やユーザーに提供する方法を紹介します。
「デモをリクエスト」