アメリカ大統領選挙における世論調査は信頼できるのか
組織や企業がよりAIを利用するようになるにつれて、世界はますますモデルに依存するようになってきていることは明らかです。わたしたちは消費者行動を理解し、その情報を使用して成果をあげようとしています。しかし、これらのモデルを使用し、構築する方法には大きな問題もあります。その非常に良い例が、アメリカ大統領選挙の世論調査です。
2016年を振り返ってみると、世論調査ではヒラリー・クリントンが勝利するだろうと言われていましたが、実際の結果は異なりました。これには、3つのシナリオが考えられます。当時トランプはまったく知られておらず、投票率は予想を遥かに上回り、多くの浮動票がありました。これは、世論調査機関が使用していたモデルが誤った仮定に基づいて構築されていたため、根本的に間違っていたことを意味しています。選挙前に使用されていた世論調査モデルは理にかなっていましたが、実際に現場で起こっていたことについての仮定は更新されていませんでした。その結果、世論調査は間違っていたのです。
2020年の現在、世論調査はバイデンがリードしていると伝えています。今回の選挙には根本的な要因がいくつかありますが、これらは世論調査モデルには組み込まれていません。前回と比較して浮動票は非常に少なく、トランプは今や広く知られており、彼の資金は減少しています。そこに来て、新型コロナウイルスの影響もあります。トランプの新型コロナへの相対的な対応は、今回の選挙での人々の投票方法に大きな影響を与えるでしょう。結局のところ、今まで世界的なパンデミックの最中にアメリカ大統領選挙が行われたことはないからです。しかし、これらの要因は世論調査モデルに考慮されておらず、これらのことが有権者の行動にどの程度影響を与えるのか誰も分かりません。
世論調査のために作成されたモデルは、有権者の居住場所、社会経済的背景、投票の傾向など、様々なことを想定しています。調査された個人をプロファイル化し、それをコミュニティ全体に外挿していくモデルの背後には、多くの科学が存在しています。もし、あなたが作成した仮定が実際には間違っていた場合、モデル内の誤差は非常に大きくなります。
今年見てきたように、物事は非常に早く劇的に変化する可能性があり、このような変化に対応するようモデルを更新しなければ、これは正確ではなくなります。これらすべてを考慮したとしても、投票日当日に人々がどのように投票するかを本質的に理解するためのデータは十分ではないため、大統領選挙の世論調査は信頼に足るものとは言えないでしょう。
ここには、モデル化やデータサイエンスを使用する際に学べる本質的な教訓があります。AIアルゴリズムは自己学習ですが、実際には、モデルを構築する基礎となる前提は変化します。そのため、これらのタイプのモデルに依存する分析を構築している場合は、モデルが誤りやすいことに注意する必要があります。
AIは単に実装するだけでなく、これを継続的に確認し、管理していかなくてはいけません。それは、現在のビジネスの構築方法や、その前提条件は変化するからです。AIを使用している場合は、モデルや基礎となる前提条件を常に更新し、維持していることを確認してください。これにより、求める成果が達成できるようになります。
拡張アナリティクスとは何か
拡張アナリティクスは、多くの企業がBI機能を最新化するために重要な促進剤です。これが何であり、なぜ重要なのか、そしてそれがもたらすデータの価値について紹介します