Yellowfinでデータ品質をコントロール
組織を構築し、運営する際には、データを信頼することが重要です。最近わたしは、84%のCEO(リンク先は英語)が意思決定の基になるデータを信頼していない、というデータに驚かされました。これはよくある問題ですが、実際には容易に修正することが可能です。
※動画は英語です。
これは当たり前に聞こえるかもしれませんが、データを信頼するためには、データ品質をコントロールできなくてはいけません。これは、みなさんが想像するよりも簡単なプロセスです。Yellowfinでは、データの整合性を確保するために、以下の4つの重要なステップを踏んでおり、これはどのような組織でも採用することができます。
1.データソースを理解する
データ品質のコントロールは、すべてのデータソースを理解することから始まります。どこからデータを取得しているのか。どのようなデータが保存されているのか。自分自身とチームのメンバーが、データのルールとその仕組みを理解していることを確認しましょう。
2.データを集約する
データソースを理解したら、これを抽出して集約します。Yellowfinでは、データを中央集約されたデータウェアハウス環境に保存しています。このプロセスを担当するチームは、運用データの所有者と密接に連携します。ファイナンスを例にあげてみましょう。ファイナンスチームとデータウェアハウスチームは、ファイナンスシステムから取り出している数字に関して、常に会話をしています。
3.継続的に整合性を確認する
わたしたちは、毎月データの整合性を確認します。これは、データウェアハウス内の数字と、運用システム内の数字が、まったく同じであることを確認する作業です。再びファイナンスを例にあげてみましょう。ファイナンスチームはデータウェアハウスチームと協力して、すべての数字が揃い、正確で、説明できるようにしています。
4.単一の真実のソースを維持する
中央集約された環境から理解できるソースを得ると、これが真実のソースになります。わたしたちがYellowfinで行うすべての分析は、このデータウェアハウスのデータを利用しています。つまり、わたしたちが作成したり、内部プレゼンテーションやストーリーに使用したり、外部に送信するすべての数字がこのデータウェアハウスをから来ていることを意味します。ですので、わたしたちはこのデータを信頼できるのです。
これが、わたしたちがデータ品質を確保しているプロセスの全体像です。このプロセスは大規模組織でも取り入れることが可能ですし、小規模組織でも哲学やプロセスは同様に機能します。
これは魔法でも何でもなく、ただプロセスに専念しているだけです。このプロセスを遂行するために必要なツールは既に存在しています。それはデータを検証するプロセスを確実に導入し、データカルチャーの一部としてデータ品質を強調し続けるだけのことです。数字が信頼できることが分かれば、組織がどのように機能しているのかを分析し、理解して、データを基にした意思決定を行うことができます。これは、みなさんのビジネスに劇的な変化をもたらすことでしょう。