bnbkchagama

What is this?

LLMを使って、入力されたユーザー名に似合いそうなグラブルの称号を検索できるWebアプリです。

この機能は、Transformers.jsを使って、入力されたユーザー名のベクトル表現を得たうえで、あらかじめ作成しておいた称号のベクトル表現との類似度が高い称号を検索することによって実現しています。

feature-extractionには、次のモデル（Q8で量子化されているもの）を利用しています。

また、ベクトル検索は、WebRを使って、Rのコードを評価することでおこなっています。称号のベクトル表現をPCAによって次元削減した後、RcppHNSWでインデックスを作成し、ユーザー名のベクトル表現を同様にして次元削減したベクトルをクエリとして、近似最近傍探索しています。具体的には、だいたい次のような感じのことをしています。

dat <- arrow::read_parquet("scripts/gbf-title-emb.parquet")

pri <- prcomp(dat[, -1], center = TRUE, scale. = TRUE)

library(RcppHNSW)
idx <- hnsw_build(pri$x[, 1:50], distance = "l2", M = 24, ef = 100)
query <- predict(pri, as.matrix(dat[452, -1]))
suggestions <- hnsw_search(matrix(query[, 1:50], nrow = 1), idx, k = 8)

dat[452, "title"] # 仮のユーザー名
#> [1] "レヴィオンの英雄"
dat[as.integer(suggestions[["idx"]]), "title"] # 類似度が高い称号
#> [1] "レヴィオンの英雄"     "ダルモアの英雄"       "再起の英雄"          
#> [4] "ジェレミアの好敵手"   "ロンリーウルフ"       "レヴィオン王国騎士団"
#> [7] "アビス・リベレータ"   "エンシェントヒーロー"

Limitations

モデルをダウンロードするのに非常に時間がかかります（onnx/model_quantized.onnxという570MBのモデルがダウンロードされる）
日本語版の称号しか収録していません。また、収録している称号には漏れがある可能性があります

Future plans?

これはもともと、WebRを利用しているWebアプリの例としてつくりはじめたものです。Tauriを使ってデスクトップアプリに固めたいと考えていましたが、Tauriは、WebRのようなスクリプトを外部から取得して実行する必要があるライブラリとは相性が悪そうだったので、そのあたりは放置しています。

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.devcontainer		.devcontainer
.github/workflows		.github/workflows
docs		docs
public		public
scripts		scripts
src-tauri		src-tauri
src		src
.gitignore		.gitignore
LICENSE.md		LICENSE.md
README.md		README.md
README.qmd		README.qmd
index.html		index.html
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json
tsconfig.node.json		tsconfig.node.json
vite.config.ts		vite.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

bnbkchagama

What is this?

Limitations

Future plans?

About

Releases

Contributors 2

Languages

License

paithiov909/bnbkchagama

Folders and files

Latest commit

History

Repository files navigation

bnbkchagama

What is this?

Limitations

Future plans?

About

Resources

License

Stars

Watchers

Forks

Releases

Contributors 2

Languages