使い方

1. 準備

データを以下のパスに置いてください:

jamdas/data/batch_0.csv
jamdas/data/batch_1.csv

2. 実験

以下のコマンドで実験を回せます:

python solve_with_llm.py [options]

例:

CUDA_VISIBLE_DEVICES=0 python solve_with_llm.py \
  --experiment-name="my_experiment" \
  --model-name="meta-llama/Meta-Llama-3-8B-Instruct" \
  --temperature=0.0 \
  --sampling-mode="comprehensive" \
  --random-state=42 \
  --iter-random-state \
  --4bit

2-1. Few-shot in-context learning

--sampling-mode などで Few-shotのサンプルの選び方を指定します.

--sampling-mode="first" -n=5
- データフレームの上から5サンプルを取得します.
- ただし推論対象と同一のサンプルは選ばれないようにします.
--sampling-mode="comprehensive" --random-state=42 --iter-random-state
- どのカラムも最低1サンプルはラベルが「1」になるまでサンプルを取得します.
- ただし推論対象と同一のサンプルは選ばれないようにします.
- また, 抽選を10回行った時点で条件が満たされない場合はそこでサンプル取得を終了します.
- random-state でサンプル時の乱数シードをコントロールします.
- iter-random-state を渡すと iサンプル目の推論時の乱数シードを random-state + i に変更します.

2-2. 量子化

--4bit を渡すとモデルを4bit量子化します.

--8bit を渡すとモデルを8bit量子化します (ただし --4bit が優先されます).

2-3. 実験管理

--experiment-name で実験名を指定できます. 過去に同一の実験名がある場合, 途中から再開します.

仕様上, 同一の実験名に使用するモデルは1種類だけにしてください.

また, 途中から再開された場合, コマンドライン引数はすべて無視され, 過去の実験と同一のconfigが適用されます.

python solve_with_llm.py --experiment-name="my_experiment"
python solve_with_llm.py --experiment-name="my_experiment" --overwrite # 最初からやり直す場合

3. 結果の保存先

実験結果はリアルタイムで1サンプル推論ごとに保存されます.

出力先ディレクトリ:

--experiment-name を指定した場合, jamdas/result/{experiment-name}
--experiment-name を指定しない場合, jamdas/result/{yyyymmddhhmmss}

出力内容:

config.json
outputs.csv: モデルの応答文字列.
pred.csv: パージングした推論結果.
metrics.csv: ラベルごとの性能.
reference_sample_indexes.csv: iサンプル目のときのfew-shot例にどのサンプルが選ばれたか. --sampling-mode="first" のときは保存されません.

Name		Name	Last commit message	Last commit date
Latest commit History 42 Commits
src		src
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
README.md		README.md
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
setup.cfg		setup.cfg
solve_with_llm.py		solve_with_llm.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

使い方

1. 準備

2. 実験

2-1. Few-shot in-context learning

2-2. 量子化

2-3. 実験管理

3. 結果の保存先

About

Releases

Packages

Languages

yutanakamura-tky/jamdas

Folders and files

Latest commit

History

Repository files navigation

使い方

1. 準備

2. 実験

2-1. Few-shot in-context learning

2-2. 量子化

2-3. 実験管理

3. 結果の保存先

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages