Jupyter notebookのTop-10検索を行う検索システムです.
ブラウザインタフェースでクエリを入力し,クエリに類似したJupyter n�otebookを10件出力します.
-
DBMS: PostgreSQL, Neo4j, SQLite
-
Jupyter Notebook
-
当検索システム
検索前に,あらかじめ加工されたJupyter notebookが保存されている必要があります.
以下を実行し,本システムをクローンします.
git clone https://github.com/OnizukaLab/Similarity_Search_on_Computational_Notebooks.git
主要なファイルで構成したファイルツリーを以下に示します.
Similarity_Search_on_Computational_Notebooks/
├── retrieval_system/
│ ├── manage.py
│ ├── interface/
│ └── retrieval_system/
└── sample_dataset/
│ ├── neo4j_sample.zip
│ ├── data1.zip
│ ├── data2.zip
│ └── data3.zip
└── README.md
-
postgres_sample.sqlをpostgresにインポートする.
-
sample_dataset/neo4j_sample.zip
を解凍したものをneo4jのデータディレクトリ(e.g./usr/local/var/neo4j/data
)に移す. -
notebooks_data
というディレクトリを場所不問で作成し,そこにSimilarity_Search_on_Computational_Notebooks/sample_dataset/
以下のzipファイルを解凍したものを入れる.
ディレクトリnotebooks_data
に移動し,以下を指定のポートでそれぞれを起動します.
-
PostgreSQL
-
Neo4J (localhost:7474)
-
Jupyter Notebook (localhost:8888)
ディレクトリSimilarity_Search_on_Computational_Notebooks/retrieval_system/
に移動し,以下のコマンドを実行してサーバを起動します.
python manage.py runserver <port>
http://127.0.0.1:/interface/
でインタフェースにアクセスできます.
たとえばポートを8080にする場合は,
python manage.py runserver 8080
で起動し,
http://127.0.0.1:8080/interface/
にアクセスします.