diff --git a/README.rst b/README.rst index 54306dfb..d12a5884 100644 --- a/README.rst +++ b/README.rst @@ -14,8 +14,8 @@ Overview - 言語によっては向かない設問もあるが、「この言語のときはこう書けば実現できる」という技術習得を目指すことを優先 - 個人情報のように見える項目は全てダミーデータを利用 - 大学、企業など組織でのご利用にあたっては、「データサイエンティスト協会スキル定義委員」の「データサイエンス100本ノック(構造化データ加工編)」を利用していることを明示いただければ自由に利用してOK -- データサイエンス100本ノック(構造化データ加工編)の解説本はこちら - - https://www.amazon.co.jp/dp/4802613563 +- データサイエンス100本ノック(構造化データ加工編)の解説本はこちら + - https://www.amazon.co.jp/dp/4802613563 - データサイエンス100本ノック(構造化データ加工編)の利用に関するご質問等について、個別での対応は受けかねますので予めご了承ください - データサイエンス100本ノック(構造化データ加工編)の利用により生じるいかなる問題についても、当協会は一切の責任を負いかねますのであらかじめご了承ください @@ -35,15 +35,16 @@ Requirement Install ==== + :: - git clone git@github.com:The-Japan-DataScientist-Society/100knocks-preprocess.git - cd 100knocks-preprocess - docker-compose up -d --build + + git clone git@github.com:The-Japan-DataScientist-Society/100knocks-preprocess.git + cd 100knocks-preprocess + docker-compose up -d --build ※ macOSでユーザーのホームディレクトリ配下以外にファイル群を配置する場合、Dockerの共有設定が別途必要となります -※ Windowsでgitを利用する場合、デフォルト設定でのインストールを行うとスクリプトの改行コードを変えられてしまい、データベースを正しく構築できないことがあります -- https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess/issues/1#issue-640590032 +※ Windowsでgitを利用する場合、デフォルト設定でのインストールを行うとスクリプトの改行コードを変えられてしまい、データベースを正しく構築できないことがあります https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess/issues/1#issue-640590032 ※ 改行を変えないよう設定するか、ZIPをダウンロードして利用してください @@ -56,9 +57,6 @@ Usage - ブラウザで以下のURLにアクセスします http://localhost:8888 -- Docker Toolboxの場合 -http://192.168.99.100:8888 - Document ==== - doc配下にデータサイエンス100本ノック(構造化データ加工編)の説明資料と設問PDF、設問HTML、解答例HTMLを配置 @@ -70,18 +68,23 @@ Link ==== 本コンテンツの内容やセットアップ手順について解説いただいているサイト、Dockerについて基本から学べるサイト -- 【データサイエンスを学ぶあなたへ】100本ノック - 構造化データ処理編 - 最速レビュー動画!【データサイエンティスト協会】#062 - - https://www.youtube.com/watch?v=fAyj0V2iAc4 -- データサイエンス100本ノック(構造化データ加工編)を試してみた - - https://qrunch.net/@hanar/entries/kSZfFS1MXK8H7U7x -- Macでデータサイエンス100本ノックを動かす方法 - - https://qiita.com/karaage0703/items/1b18b1f4ab65d35afb5f -- さくらのナレッジ - - https://knowledge.sakura.ad.jp/13265/ -- データサイエンス100本ノックを、Google ColabとAzure Notebooksで気軽に行いたい! - - https://qiita.com/noguhiro2002/items/de49db61b69c3dbc9282 -- データサイエンス初学者にむけた、データサイエンス100本ノックを実装する方法(windows10 Home向け) - - https://qiita.com/syuki-read/items/714fe66bf5c16b8a7407#comment-394d2f7656bd5b977e11 +- 【データサイエンスを学ぶあなたへ】100本ノック - 構造化データ処理編 - 最速レビュー動画!【データサイエンティスト協会】#062 + - https://www.youtube.com/watch?v=fAyj0V2iAc4 + +- データサイエンス100本ノック(構造化データ加工編)を試してみた + - https://qrunch.net/@hanar/entries/kSZfFS1MXK8H7U7x + +- Macでデータサイエンス100本ノックを動かす方法 + - https://qiita.com/karaage0703/items/1b18b1f4ab65d35afb5f + +- さくらのナレッジ + - https://knowledge.sakura.ad.jp/13265/ + +- データサイエンス100本ノックを、Google ColabとAzure Notebooksで気軽に行いたい! + - https://qiita.com/noguhiro2002/items/de49db61b69c3dbc9282 + +- データサイエンス初学者にむけた、データサイエンス100本ノックを実装する方法(windows10 Home向け) + - https://qiita.com/syuki-read/items/714fe66bf5c16b8a7407#comment-394d2f7656bd5b977e11 Author ==== diff --git a/docker/doc/100knocks_ER.pdf b/docker/doc/100knocks_ER.pdf index 414df3d4..39f8ac75 100644 Binary files a/docker/doc/100knocks_ER.pdf and b/docker/doc/100knocks_ER.pdf differ diff --git a/docker/doc/100knocks_guide.pdf b/docker/doc/100knocks_guide.pdf index 6ef94d41..e8719061 100644 Binary files a/docker/doc/100knocks_guide.pdf and b/docker/doc/100knocks_guide.pdf differ diff --git a/docker/doc/100knocks_questions.pdf b/docker/doc/100knocks_questions.pdf index cec13174..3588cca2 100644 Binary files a/docker/doc/100knocks_questions.pdf and b/docker/doc/100knocks_questions.pdf differ diff --git a/docker/doc/answer/ans_preprocess_knock_Python.html b/docker/doc/answer/ans_preprocess_knock_Python.html index 12b678f9..e63463d1 100644 --- a/docker/doc/answer/ans_preprocess_knock_Python.html +++ b/docker/doc/answer/ans_preprocess_knock_Python.html @@ -14545,9 +14545,12 @@

はじめにimport psycopg2 from sqlalchemy import create_engine from sklearn import preprocessing +from sklearn.impute import SimpleImputer from sklearn.model_selection import train_test_split +from sklearn.model_selection import TimeSeriesSplit from imblearn.under_sampling import RandomUnderSampler + pgconfig = { 'host': 'db', 'port': os.environ['PG_PORT'], @@ -14581,7 +14584,7 @@

演習問題