Skip to content

Commit

Permalink
add pack
Browse files Browse the repository at this point in the history
  • Loading branch information
fkxxyz committed Jun 17, 2020
1 parent 83c2e01 commit 29e959a
Show file tree
Hide file tree
Showing 2 changed files with 18 additions and 2 deletions.
10 changes: 8 additions & 2 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -31,7 +31,7 @@
- 由百度搜索到某个人基于大数据做过的[360万中文词库+词性+词频](https://download.csdn.net/download/xmp3x/8621683),该词库是用ansj分词对270G新闻语料进行分词统计词频获得
- [清华大学开源词库](https://github.com/thunlp/THUOCL),统计来自各大主流网站如CSDN博客、新浪新闻、搜狗语料
- 搜狗细胞词库 [网络流行新词【官方推荐】](https://pinyin.sogou.com/dict/detail/index/4)

2. 词库本身基于简体,并且加入繁简切换,包括自定义词库也能切换繁体(朙月拼音输入简体时的需要经过opencc转换,而且自定义词库也得手动转换成繁体才能繁简切换,而袖珍簡化字拼音不支持繁体)

3. 默认加入 emoji 表情输入支持
Expand Down Expand Up @@ -364,7 +364,7 @@ sudo mkfontdir

其它常见问题看[官方文档的常见问题](https://github.com/rime/home/wiki/CustomizationGuide#diy-%E8%99%95%E6%96%B9%E9%9B%86)吧。

## 自己构建词库
## 构建

一般情况下,我在发布页提供的是已经生成好的词库和部署好的二进制文件,直接使用即可。

Expand Down Expand Up @@ -405,7 +405,13 @@ rime基础库: [librime](https://github.com/rime/librime)

minfreq 代表360万词里面指定的最小词频,频率低于该值的词语会被筛选掉,达到精简词库的目的,默认是100,该值越小,最终生成的词库越大,为 0 表示不精简词库(会生成大约 100 兆左右的词库)。

构建完成后,可以打包,在 data 目录生成压缩包

```
./pack [ver]
```

ver 表示版本号,例如 1.1.2

---

Expand Down
10 changes: 10 additions & 0 deletions pack
Original file line number Diff line number Diff line change
@@ -0,0 +1,10 @@
#!/bin/bash

ver="$1"

cd data
rm -rf clover.schema-$ver.zip
rm -rf clover.schema-build-$ver.zip
zip -5 clover.schema-$ver.zip *.yaml opencc/*
zip -5 clover.schema-build-$ver.zip *.yaml opencc/* build/*

0 comments on commit 29e959a

Please sign in to comment.