RESAS ハッカソン2017 応募用
RESAS の省庁間のデータの横断分析し、そこから結論を「明日の新聞記事」にできるような結論を導き出すこと、が目標です。
分析例: 結婚出産に関する地域間格差と、その要因についての分析
*この分析例は 2017/02/04 に開催されたRESAS x Japan Hackathon 〜地域の連鎖をデザインしよう!〜で作られました。製作者の所属する団体やRESASデータ提供元の主義主張を反映するものではありません。
RESASオープンデータをより使ってもらうフックとしての「こんな面白い情報が含まれている」ことを明らかにしました。
また、本プロジェクトの結果の再現性を高める&分析方法の共有のために、分析過程もすべて見える状態で配置しました。 jupyter notebook ファイル
さらに、RESAS の省庁間のデータの横断分析を容易にするためのスクリプト作成し、その成果物もレポジトリ内に配置してあります。本プロジェクトのPython以外でも、例えば MS Office Excel でも十分に分析が可能な状態になっています。
- 省庁間横断データ分析用CSV作成スクリプト
-
- preprocess フォルダにあります
-
- 省庁間横断データの成果物はcsv形式(文字コード sjijs)でdata/city_bigData2012.csv(4MB以上あるので注意)に配置してあります。このファイルはMS Excel でも分析可能な状態です。
- 分析サンプル1: 20代男女比の地域間格差と出生率について
-
- 結婚出産に関する分析 フォルダにあります
- Python 3 系
- Jupyter notebook を利用
- requriments
-
- 各フォルダ参照
RESAS API ではデータの取得件数に限界があったため、https://resas.go.jpから直接ダウンロード