Skip to content

Latest commit

 

History

History
106 lines (56 loc) · 2.78 KB

File metadata and controls

106 lines (56 loc) · 2.78 KB

English

計算ノートブックの類似検索

概要

スクリーンショット

Jupyter notebookのTop-10検索を行う検索システムです.

ブラウザインタフェースでクエリを入力し,クエリに類似したJupyter n�otebookを10件出力します.

デモ

デモ動画

Demo1(old version)

Demo2(old version)

評価実験

評価実験

システムの構成要素

  • DBMS: PostgreSQL, Neo4j, SQLite

  • Jupyter Notebook

  • 当検索システム

検索前に,あらかじめ加工されたJupyter notebookが保存されている必要があります.

システムの準備

以下を実行し,本システムをクローンします.

git clone https://github.com/OnizukaLab/Similarity_Search_on_Computational_Notebooks.git

主要なファイルで構成したファイルツリーを以下に示します.

Similarity_Search_on_Computational_Notebooks/

├── retrieval_system/

│ ├── manage.py

│ ├── interface/

│ └── retrieval_system/

└── sample_dataset/

│ ├── neo4j_sample.zip

│ ├── data1.zip

│ ├── data2.zip

│ └── data3.zip

└── README.md

データセットの準備

  • postgres_sample.sqlをpostgresにインポートする.

  • sample_dataset/neo4j_sample.zipを解凍したものをneo4jのデータディレクトリ(e.g. /usr/local/var/neo4j/data)に移す.

  • notebooks_dataというディレクトリを場所不問で作成し,そこにSimilarity_Search_on_Computational_Notebooks/sample_dataset/以下のzipファイルを解凍したものを入れる.

検索Webアプリケーションの起動

ディレクトリnotebooks_dataに移動し,以下を指定のポートでそれぞれを起動します.

  • PostgreSQL

  • Neo4J (localhost:7474)

  • Jupyter Notebook (localhost:8888)

ディレクトリSimilarity_Search_on_Computational_Notebooks/retrieval_system/に移動し,以下のコマンドを実行してサーバを起動します.

python manage.py runserver <port>

http://127.0.0.1:/interface/

でインタフェースにアクセスできます.

たとえばポートを8080にする場合は,

python manage.py runserver 8080

で起動し,

http://127.0.0.1:8080/interface/

にアクセスします.