読者です 読者をやめる 読者になる 読者になる

journalism mania

ジャーナリズムを研究している者の備忘録です

自治体のサイトには「東日本大震災」というワードがどれくらい登場しているか?

ジャーナリズムの世界では、数年前から「データジャーナリズム」が話題になっています。最近では、どちらかというと「データビジュアライゼーション」という名前で関連イベントがよく行われていますね。

 

というわけで、だいぶ時間が経ってしまいましたが、先日、とあるデータビジュアライゼーションのハッカソンに参加し、勉強してきました。

 

「NDLデータ利活用ワークショップ~ウェブ・アーカイブの自治体サイトを可視化しよう~」を開催します | NDLラボ

 

私はツールの使い方を教えてもらえる超初心者コースに参加。使ったのは「CARTO」というツールです。

 

carto.com

これは平たく言うと、いろいろなデータを地図上にマッピングできるツールです。これに国会図書館のデータベースからもってきたデータを置いてみよう、というわけです。

 

国会図書館では、自治体をはじめとする公的なサイトを、定期的に保存し、アーカイブする「WARP」と呼ばれる事業を行っています。これを使ってデータをビジュアライズせよ、というのが今回のお題です。(以下がそのデータベースです)

 

WARP自治体サイト検索API-簡易検索

 

イベントから時間が経っているので、復習がてら作品を作成。各自治体のサイトを都道府県別に見た時、「東日本大震災」というワードがどれくらい出現するかを調べてみました。

 

2013年の結果は以下。色が濃いほど、ワードの出現数が高くなっています。石川県、愛知県、神奈川県、東京都、千葉県のほか、熊本県がもっとも濃い色になっていますね。

 

f:id:journalism-mania:20160815185812p:plain

2年後の2015年の結果は以下。北海道以下、太平洋沿岸に位置する都道府県がもっとも色が濃くなっています。

f:id:journalism-mania:20160815185832p:plain

先ほどのデータベースでひとつひとつのサイトにあたっていけば、なぜ2年でこのような変化が生じたかわかるはず。

 

やってみて思ったのですが、こういうデータを利用したコンテンツでは、読み解きの能力が問われますよね。精進しよう……。

 

というわけで「やってみたよ」という報告でした。