Skip to content

fubuki/Lucene-example

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Lucene

練習Lucene的切詞,基於Lucene 6.1 下測試的範例。

  1. Cjktokenizer 測試lucene本身對CJK(中文日文韓文)下的預設切詞方式。
  2. CommonAnalyzersDemo 列出lucene一些內建分詞方式。
  3. DocBoost 對搜尋的文件加上權重,讓Lucene在搜尋時可以調整排序。
  4. FieldIndex
  5. HelloLucene
  6. Ikanalyzer 使用ikanalyzer中文分詞器。
  7. IndexDoc 對文件作索引並測試hightLight功能。
  8. loadPdf 使用tika載入PDF
  9. ParserTxt
  10. SpellCheck 測試Lucene的拼字檢查功能,給lucene一個詞表,可以給你與你輸入的的字串最接近的詞彙。
  11. TikaLoadFile 測試tika載入ms-doc 和tike語言偵測功能。

About

練習Lucene的切詞

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages