Skip to content

yutanakamura-tky/DNorm-J

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

64 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DNorm-J

概要

日本語の病名を正規化するツールです

手法

DNormの日本語実装になります.
Tf-idfベースのランキング手法により病名を正規化します。

詳細はリンク先の論文をご参照ください.

環境

python>=3.6.1
MeCab>=0.996.5

インストール

pip install git+https://github.com/sociocom/DNorm-J.git

使い方

  • -i:入力ファイル
  • -o:出力ファイル
  • -n:正規化先の病名リスト(デフォルト設定では指定する必要はありません)
  • -d:略語展開辞書(デフォルト設定では指定する必要はありません)

python -m dnorm_j -i sample.txt -o output.txt

コマンドから

入力(sample.txt)

腸閉塞症状
高Ca尿症
二次性副腎不全

出力(output.txt)

イレウス
高カルシウム尿症
副腎クリーゼ

スクリプトから

from dnorm_j import DNorm

model = DNorm.from_pretrained()
result = model.normalize('AML')
print(result)

性能

image

About

Japanese version of DNorm

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 99.4%
  • Makefile 0.6%