123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127 |
- #
- # This file defines a stopword set for Japanese.
- #
- # This set is made up of hand-picked frequent terms from segmented Japanese Wikipedia.
- # Punctuation characters and frequent kanji have mostly been left out. See LUCENE-3745
- # for frequency lists, etc. that can be useful for making your own set (if desired)
- #
- # Note that there is an overlap between these stopwords and the terms stopped when used
- # in combination with the JapanesePartOfSpeechStopFilter. When editing this file, note
- # that comments are not allowed on the same line as stopwords.
- #
- # Also note that stopping is done in a case-insensitive manner. Change your StopFilter
- # configuration if you need case-sensitive stopping. Lastly, note that stopping is done
- # using the same character width as the entries in this file. Since this StopFilter is
- # normally done after a CJKWidthFilter in your chain, you would usually want your romaji
- # entries to be in half-width and your kana entries to be in full-width.
- #
- の
- に
- は
- を
- た
- が
- で
- て
- と
- し
- れ
- さ
- ある
- いる
- も
- する
- から
- な
- こと
- として
- い
- や
- れる
- など
- なっ
- ない
- この
- ため
- その
- あっ
- よう
- また
- もの
- という
- あり
- まで
- られ
- なる
- へ
- か
- だ
- これ
- によって
- により
- おり
- より
- による
- ず
- なり
- られる
- において
- ば
- なかっ
- なく
- しかし
- について
- せ
- だっ
- その後
- できる
- それ
- う
- ので
- なお
- のみ
- でき
- き
- つ
- における
- および
- いう
- さらに
- でも
- ら
- たり
- その他
- に関する
- たち
- ます
- ん
- なら
- に対して
- 特に
- せる
- 及び
- これら
- とき
- では
- にて
- ほか
- ながら
- うち
- そして
- とともに
- ただし
- かつて
- それぞれ
- または
- お
- ほど
- ものの
- に対する
- ほとんど
- と共に
- といった
- です
- とも
- ところ
- ここ
- ##### End of file
|