データビジュアライゼーションの強化に必要な忘れやすい1ステップ
ビジネスにおける最高の意思決定は、最も正確なデータの成果であり、そのデータは全体像の中で形作られる必要があります。そのためには文脈が必要です。
目次
わたしは最近家を購入しました。
聞くところによると、これは人生で最もストレスの溜まるイベントトップ10のうちのひとつだそうです。なぜでしょうか。その理由は意思決定にあります。
そして、これらの意思決定は、「はい」「いいえ」で単純に決めることができません。選択肢は様々です。最高の住宅投資をするには、膨大なデータが必要です。そして、データには文脈が必要です。これは、ひとつの要素の変化が、その他すべてのオプションに変化を与える可能性があるからです。
不動産会社が提供する素晴らしい広告写真は、何の文脈も提供しません。そこに住みたいと思うかどうかは、実際に家が立っている通りを見る必要があります。Googleストリートビューでさえ、日が昇っているときであれば意外ときれいに見えるでしょう。そして、恐らく不動産会社は、家の裏に放課後騒ぎまわる学生で埋め尽くされる公園があることを教えてくれないでしょう。しかしこれは、実際に放課後の状況を見ることで確認できます。また、道路の突き当りでは開発工事が行われており、終日トラックが行き交う音が鳴り響いていることに気付かないかもしれません。これを把握するには、その地域一体を回り、工事現場があるかどうかを確認しなくてはいけません。
文脈は重要です。そしてこれは、ビジネスデータにも同じことが言えます。
文脈の無いデータビジュアライゼーションでは、ビジネスにおいて最高の意思決定を行うことができません。
これは、非常に多くのアナリストが忘れている要素のひとつです。
既存のデータビジュアライゼーションが誰の役にも立っていない理由
紛らわしい情報を示すデータビジュアライゼーションに、どの程度の頻度で遭遇するでしょうか。これは意図的に視点を歪めようとしているわけではなく、文脈を省略して絶対値を比較する場合です。このような状況では、関連するデータや注釈の追加が、異なるストーリーを伝える可能性があります。
こちらの例を見てみましょう。ニューヨーク地下鉄の駅の犯罪マップには、重罪犯の数、対象となる期間、詳細の測定方法、などが注意深く注釈されています。見たところ、最も犯罪数が多い大きな赤丸で示された地域である、タイムズスクエア、14番街 - ユニオンスクエア、125番街は避けた方が良さそうです。
それでは次に、以下のマップを見てみましょう。こちらのマップは、上記のマップとまったく同じデータセットを使用しています。しかし今回は、(画像の上部にある) フィルターを使用して、駅通過10万回ごとの犯罪件数を示しています。こちらのマップを見ることで、どの駅を避けるべきかという考えは変化するでしょうか。わたしの考えは変わります。特に危険だと思っていた地域が、実は最も安全に見えます。125番街には未だに注意が必要ですが、東143番街 - セント・メリー通りも注意した方が良さそうです。
最初のマップに欠けていた文脈のひとつは、各駅を通過する回数である駅の利用率です。人が増えるほどに、犯罪の可能性は高まります。そのため、最も忙しい駅の犯罪件数が、最も高いのは当たり前です。しかし、これらの犯罪を10万人当たりで測定すると、ストーリーは変化します。
同様に、アメリカにあるマクドナルドの店舗数は14,267店で、ヨーロッパの店舗数は7,920店と伝えたら、アメリカのマクドナルドの収益の方が多いと思うでしょう。しかし、実際は違います。インベストペディアによると、アメリカのマクドナルドの収益は、全体のたった31.5%であり、これはヨーロッパ全体の収益よりも少ないです。これを把握するには、収益の値を示す文脈が必要であり、店舗数の絶対値のみでは不十分です。
それでは、データに文脈を追加するには、どのようにすればよいでしょうか。
全体像を描く
ビジネスにおける最高の意思決定は、最も正確なデータの成果であり、そのデータは全体像の中で形作られる必要があります。そのためには文脈が必要です。
文脈はテキスト形式で提供されます。一番基礎的な軸のラベル付けやカラーキーの提供から、データポイントラベルの使用やビジュアライゼーション上の注釈、説明用の段落を記事に追加など、文脈は重要です。これら無しでは、最悪の場合、データビジュアライゼーションはまったく意味のない無用なものになり、良い場合でも、有益なインサイトを得ることはできないでしょう。
文脈はデータの有効な解釈を提供し、全体像を具体化して、強調を追加し、読み手を正確な推論へと誘導し、比較を可能にします。また、外れ値や傾向に関する読み手の好奇心を先取りすることもできます。
2つの選択肢
Nicholas Diakopoulos著「The Tow Centre for Digital Journalism: デジタルジャーナリズムのためのけん引センター」では、観測と付加という2つのタイプの文脈を定義しています。
以下は、ニューヨークタイムズ紙からの例で、観測タイプの文脈は、既にあるデータにさらなる情報を追加しないことを示しています。値を自分で計算することもできますが、データ提供者が注目してほしい点を明確にし、強調しています。右側のテキストは、2050年に推計される65歳以上の国民の数、という特定の数字を強調しています。また、文脈を明確にするために、この数字をアメリカの予測人口に占める割合で示しています。これは、グラフを閲覧すれば分かるため新しい情報ではありませんが、役に立つ正確な文脈です。
他のタイプの観測文脈として、正確な値を示すデータポイントラベルがあります。以下は、FTSE100グラフです。データポイントにマウスオーバーすることで、データポイントの特定の値と正確な日付を提供します。これは、より明確に事実を確認する役に立ち、詳細を見やすくします。
反対に、付加文脈は、データビジュアライゼーションを閲覧するだけでは知ることのできない追加情報を提供します。
データビジュアライゼーションにさらなる文脈を提供する条件付きキャンバスウィジェット
条件付きキャンバスウィジェットを使用することで、Yellowfin内で付加文脈を提供できる新しい方法があります。これは、条件を付けてウィジェットの書式を設定することで、データに合わせた変更が可能になります。以下の例で矢印のウィジェットは、目標に対するパフォーマンスを示しています。値は収益を示していますが、これが良いのか悪いのかを把握するためには、目標というさらなる情報が必要です。
矢印のウィジェットに条件を設定することで、値が特定の数字である1億ドルを超えた場合に上を指し、緑で表示させることができます。それでは、5000万ドルを下回った場合はどうなるでしょうか。矢印は下を指し、赤く表示されるでしょう。
値と合わせて付加文脈を提供するこの矢印は、「目標と比較してどうであるか?」という質問に即座に答えを提供します。これは、収益のひとつのデータポイントを閲覧するだけでは把握できない外部情報です。反対に、収益の隣に目標を記載した場合、矢印は観測文脈になるでしょう。
付加文脈を使用したその他の例として、こちらの整然として分かりやすいガーディアン紙からのグラフを見てみましょう。これは、世界中の書籍販売売上の上昇と下降を示しています。グラフから、ブラジルの売上は2013年 - 2014年に2倍近くになっていますが、2015年 - 2016年に最大の落ち込みを見せていることが分かります。これはなぜでしょうか。このグラフを見るだけでは分かりません。そして、イギリスとアメリカが、過去3年間で毎年書籍販売の売上を伸ばし続けている理由も分かりません。
しかし、ガーディアン紙は、イギリスとアメリカの政治的混乱により、子供時代の古典を題材にした風刺的な本が過去数年間で人気を博すようになったことを説明し、テキスト形式の段落で数字に文脈を追加しました。ブラジルにおける2014年の驚くべきパフォーマンスは、司祭からシェフに転向したPadre Marcelo Rossiによる、料理本の大成功に完全に依存していました。時には長文形式のテキストが、文脈の追加に最適な場合があります。これは、より完全なイメージを提供できるからです。
グラフに直接注釈を表示するのはどうでしょうか。以下の線グラフに注釈を表示しない場合、2016年6月23日にS&P 500が劇的に減少した理由を知ることができません。これは通常の下落とは異なるように見えますが、イギリスがEU離脱を決定した国民投票の直後に暴落が発生しており、これが市場に衝撃を与えたことがラベルにより説明されています。この付加文脈は、外部データを使用することで、「なぜ」の説明をサポートしています。
次回優れたデータビジュアライゼーションを提供する際には、以下について検討しましょう。
- ポイントを強調することで提供しているデータに明確さを追加することができるか
- 閲覧するだけでは分かりにくい詳細を説明する必要があるか
- 外部データを使用することで説明できる外れ値や傾向はあるか
- 最も重要なことは、読み手がビジネスにおいて最高の意思決定をするために、どのようなサポートができるかを考えることです。
文脈は重要であり、見た目にきれいなだけのビジュアライゼーションと、読み手をアクションに導く真のデータインサイトとの間に違いを生み出します。