石田修二のホームページ > 日本都市学会・中部都市学会メモ >    (サイト内検索

自治体等の公表する統計データの電子形式に関する一考察

四日市大学非常勤講師 石田 修二

このページは,2013年10月27日の日本都市学会での研究発表のサポートページです。

発表スライド

発表要旨

2013年8月31日に事務局に提出したものです。

はじめに

現在,統計学,「ビッグデータ」ブームなど,数値データに対する関心がこれまで以上に高まっている。また,それに並行して数値を処理するコンピュータソフト,システムへの関心も高まっている。

都市に関する情報を数値化するにあたって,私たちは政府,自治体Webサイト,NPOから統計資料を得て,それを目的に応じて編集,加工する。

ではその数値データの公開方式について問題は無いのか,具体的には利用しやすいものなのか,問題の解決にどういった手段がありうるかを考察する。

現状と課題

現在,多くの自治体が,自分たちの町の統計資料をWeb上で公開している。量,内容に差こそあれ,数値資料が公開されていない自治体はほとんど見られない。

では,それらはどういった形で公開されているだろうか。ざっと分類するとHTMLのページに数値を出す,PDFファイルで公開するなどあるが, Microsoft社の表計算ソフトExcelに最適化されたXLS形式で公開されていることが多い。

問題は,そこから得られるデータは私たちが編集,加工しやすい形かどうかである。言い換えると,ストレスなく処理できるデータであるかである。残念ながら,現状ではその点についてまだまだ不十分と言わざるとえない。

例えば,XLS形式ファイルは,Excelで開くには問題ない。しかし,そのシートに「セルの結合」,不要なところに空白を入れる,1つのセルの中に数字を文字が混在されていると,データを抽出,並び替えをする,綺麗なグラフを作成する際,手間をかけてデータをクレンジングしなければならない。また,他のソフトウェアに読み込ませる時も,うまく読み込ませることができず,結局,手間をかけてクレンジングすることになる。

行政,住民が問題点や情報を共有するためには,データの公開は当然である。しかし,同時にそれらは編集,加工しやすいものでなければならない。そのためにも,ただ公開すればいいというのではなく,その出し方についても今後は議論する必要がある。

CSV形式のススメ

ここでファイルの提供形式として有力なフォーマットなのが,CSV(あるいはTSV)と呼ばれるテキスト形式である。テキスト形式なので,基本的にはテキストエディタで閲覧や編集が可能であり,また当然,多くの統計ソフトでも読み込みが可能である。政策の展開にあたっては,効率性もさることながら,公平性も求められる。その点から見ても,多くのソフトで読み込み,編集が可能というのは評価すべき提供形式ではないだろうか。

政府も「国民へ発信する重要情報のファイル形式について」というWebページで,具体的なファイルの公開方法としてCSV形式ファイルでの提供を推奨している。また,著名なWeb研究者であるTim Berners-Leeは,5 star Open Dataというサイトの中で,データの公開の理想的な形を5段階に分類し,特定のソフトウェアの機能に限定されることのない形式としてCSV形式を提案している。

おわりに

以上のように利用しやすいデータの提供の第一歩として本発表ではCSV形式の使用を推奨した。しかし,自治体によっては簡単にできるわけではないだろう。本論では触れなかったが,データをどのように配置するかも,使いやすいデータのためには重要な問題である。こういった残された問題解決のためには,技術者と自治体を結びつける仕組みも今後検討していきたい。

参考文献

  1. 朝日崇『実践アーカイブ・マネジメント 自治体・企業・学園の実務』(出版文化社, 2011年)
  2. 市口恒雄「ガバメント 2.0 − データガバメントと住民参加型行政の2つの方向性」(『科学技術動向』2013年7月号(136号, pp.18-pp.23)
  3. 5 star Open Data (http://5stardata.info/)
  4. 地方自治情報センター「国民へ発信する重要情報のファイル形式について」(https://www.lasdec.or.jp/cms/12,22060,84.html)

リンクはご自由にどうぞ。

【石田修二トップページ】  【日本都市学会メモ】

Last modified: 2013-09-01 03:09:29