オープンデータの活用

オープンデータの活用

今回は、様々なオープンデータを活用して、Yellowfinで分析を行ってみました。まずは、そもそも、オープンデータとはどのようなデータなのか解説いたします。

 

オープンデータとは?

オープンデータとは、特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、全ての人が望むように利用・再掲載できるような形で入手できるべきであるというアイデアのことです(出所:Wikipedia)。

近年では政府や地方自治体も積極的にデータを公開して、多くの人たちの分析に役立ててもらおうとしている様子です。オープンデータとして公開されているデータを活用して、データを分析してみようと思います。

 

日本の人口データ

日本の人口推移

まずは、政府統計の総合窓口である、統計局e-stat(https://www.e-stat.go.jp/)で公開されているデータを活用して、日本の人口推移を分析してみましょう。

e-statで公開されている2000年~2045年の性別および年齢層別の人口データ(推計値含む)を使って、人口ピラミッドを作成しました。5年に一度実施される国勢調査の結果が元データです。古い順に並べて、ピラミッドの形状が変化する様子を見てみます。

 

  • 2000年

つぼ型と呼ばれる形状で、50歳代前半と20歳代後半の年齢層の前後が突起した形状です。生産年齢人口の割合が多く、高齢者層を社会で支えられています。しかし、10歳代以下の年齢層で人口が減少し始めており、少子高齢化社会を迎えつつあることが分かります。

 

  • 2020年

2000年時点と同様につぼ型ではあるのですが、つぼの突起が徐々に上部に移動してきています。若年層に関しては、年齢層が下がるにつれ、人口が減少していることが明確です。高齢化社会が急速に進みつつある姿が確認できます。

  • 2045年

推計値を元にしたものではありますが、2045年には人口のボリュームが上部に集中していることが分かります。NHKの「縮小ニッポンの衝撃」では棺桶型と表現していたそうです。社会構造的に、生産年齢人口が高齢者層を支え切れないように、見受けられます。

ちなみに、いずれの年の人口ピラミッドを見ても、女性の方が長生きなのが分かります。特に80歳以上の年齢層を見てみると、男女の人口に大きな差が出ています。

少子化対策の重要なKPIとして合計特殊出生率を参考にします。合計特殊出生率とは、人口統計上の指標で、15~49歳までの既婚・未婚問わない全女性の年齢別出生率を合計したもので、女性人口の年齢構成の違いを除いた「その年の出生率」を意味します(出所:Wikipedia)。同じくe-statで公開されているデータを元に、合計特殊出生率の推移を可視化しました。

一般的に、人口を維持するためには、2.07以上の合計特殊出生率が必要と言われています。しかし、日本の合計特殊出生率は1970年代半ば以降、人口維持に必要な数値を下回り続けているのが分かります。2020年代に入ると、コロナ禍の影響もあり、数値が更に減少傾向に向かっています。

このように、データを可視化することで、急激に進む少子高齢化社会をより実感することができます。少子化対策を急がないと、日本の社会が構造的に成り立たなくなってしまいます。同時に、外国人労働者の受け入れを積極的にするなど、生産年齢人口の増加に関わる対策も強化する必要があります。

 

走行履歴データの分析

公用車の走行履歴

会津若松市が公用車の走行履歴をオープンデータとして公開しています(【提供:会津若松市】公用車・公共交通車両走行情報)。時間と緯度経度の情報で、公用車の位置情報を管理しています。とはいえ、緯度経度の数値情報を見て、車がどこを走っているかが分かる人はかなり稀だと思われます。

そこで、地図チャートを使って、走行履歴を可視化してみます。

GPSのおかげでこのような分析も可能になりましたが、寄り道などしたら、一発でバレてしまいますね。ある意味恐ろしい世の中になったものです。

 

気象情報の活用

那覇市の気温推移

気象庁がオープンデータとして、各都市の過去の気象情報(https://www.data.jma.go.jp/gmd/risk/obsdl/)を提供してします。那覇市の月別平均気温・最高気温のデータをダウンロードして、気温の推移を可視化してみました。

下の線グラフは、那覇市の8月の平均気温と最高気温の推移です。平均・最高気温ともに、年を追って徐々に上がりつつあるように見受けられます。また、1990年代後半以降、最高気温が34度を超える年が増えているのが分かります。

同じく那覇市の1月の平均気温と最高気温の推移を見てみても、8月のものと類似の傾向が見られます。

他の都市の気温の推移を見ても、実は同じような傾向が見受けられました。地球温暖化の影響が大きいと思われます。将来の世代のためにも、地球温暖化対策は避けて通れない課題です。我々も日頃から気を付けられることは気を付けたいものです。

 

最後に

以上、オープンデータの活用例をご紹介差し上げました。今回取り上げた内容以外にも、産業や消費など、豊富なデータが一般公開されています。これらを分析に活用することで、業務の幅を広げることができるでしょう。

一方で、まだまだ課題も多いように思います。過去の蓄積データをまとめて公開していることも一因かと思われますが、類似のデータであっても粒度が異なることが多くあります。例えば、データによって単位が国・都道府県・市町村などでばらばらであるため、複数データの組み合わせが難しい場面にしばしば遭遇します。データ形式や提供方法もまちまちです。今後収集するデータに関しては、分析に活用することを前提にすることも考慮すべきかも知れません。いずれにしても、オープンデータの活用は政府も推進しており、今後我々もその活用方法を検討していくべきです。

 

チャートの作成方法や本記事に関する詳しい説明を聞きたい方はお気軽にお問い合わせください。

[お問い合わせ]

 

Yellowfinを試してみたい方はこちらから。

[無料評価版]

最新記事一覧

Thanks for trying Yellowfin

Please complete the form below to request your copy of Yellowfin today.