stopwords_ru.txt 7.6 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241
  1. | From svn.tartarus.org/snowball/trunk/website/algorithms/russian/stop.txt
  2. | This file is distributed under the BSD License.
  3. | See http://snowball.tartarus.org/license.php
  4. | Also see http://www.opensource.org/licenses/bsd-license.html
  5. | - Encoding was converted to UTF-8.
  6. | - This notice was added.
  7. | a russian stop word list. comments begin with vertical bar. each stop
  8. | word is at the start of a line.
  9. | this is a ranked list (commonest to rarest) of stopwords derived from
  10. | a large text sample.
  11. | letter `ё' is translated to `е'.
  12. и | and
  13. в | in/into
  14. во | alternative form
  15. не | not
  16. что | what/that
  17. он | he
  18. на | on/onto
  19. я | i
  20. с | from
  21. со | alternative form
  22. как | how
  23. а | milder form of `no' (but)
  24. то | conjunction and form of `that'
  25. все | all
  26. она | she
  27. так | so, thus
  28. его | him
  29. но | but
  30. да | yes/and
  31. ты | thou
  32. к | towards, by
  33. у | around, chez
  34. же | intensifier particle
  35. вы | you
  36. за | beyond, behind
  37. бы | conditional/subj. particle
  38. по | up to, along
  39. только | only
  40. ее | her
  41. мне | to me
  42. было | it was
  43. вот | here is/are, particle
  44. от | away from
  45. меня | me
  46. еще | still, yet, more
  47. нет | no, there isnt/arent
  48. о | about
  49. из | out of
  50. ему | to him
  51. теперь | now
  52. когда | when
  53. даже | even
  54. ну | so, well
  55. вдруг | suddenly
  56. ли | interrogative particle
  57. если | if
  58. уже | already, but homonym of `narrower'
  59. или | or
  60. ни | neither
  61. быть | to be
  62. был | he was
  63. него | prepositional form of его
  64. до | up to
  65. вас | you accusative
  66. нибудь | indef. suffix preceded by hyphen
  67. опять | again
  68. уж | already, but homonym of `adder'
  69. вам | to you
  70. сказал | he said
  71. ведь | particle `after all'
  72. там | there
  73. потом | then
  74. себя | oneself
  75. ничего | nothing
  76. ей | to her
  77. может | usually with `быть' as `maybe'
  78. они | they
  79. тут | here
  80. где | where
  81. есть | there is/are
  82. надо | got to, must
  83. ней | prepositional form of ей
  84. для | for
  85. мы | we
  86. тебя | thee
  87. их | them, their
  88. чем | than
  89. была | she was
  90. сам | self
  91. чтоб | in order to
  92. без | without
  93. будто | as if
  94. человек | man, person, one
  95. чего | genitive form of `what'
  96. раз | once
  97. тоже | also
  98. себе | to oneself
  99. под | beneath
  100. жизнь | life
  101. будет | will be
  102. ж | short form of intensifer particle `же'
  103. тогда | then
  104. кто | who
  105. этот | this
  106. говорил | was saying
  107. того | genitive form of `that'
  108. потому | for that reason
  109. этого | genitive form of `this'
  110. какой | which
  111. совсем | altogether
  112. ним | prepositional form of `его', `они'
  113. здесь | here
  114. этом | prepositional form of `этот'
  115. один | one
  116. почти | almost
  117. мой | my
  118. тем | instrumental/dative plural of `тот', `то'
  119. чтобы | full form of `in order that'
  120. нее | her (acc.)
  121. кажется | it seems
  122. сейчас | now
  123. были | they were
  124. куда | where to
  125. зачем | why
  126. сказать | to say
  127. всех | all (acc., gen. preposn. plural)
  128. никогда | never
  129. сегодня | today
  130. можно | possible, one can
  131. при | by
  132. наконец | finally
  133. два | two
  134. об | alternative form of `о', about
  135. другой | another
  136. хоть | even
  137. после | after
  138. над | above
  139. больше | more
  140. тот | that one (masc.)
  141. через | across, in
  142. эти | these
  143. нас | us
  144. про | about
  145. всего | in all, only, of all
  146. них | prepositional form of `они' (they)
  147. какая | which, feminine
  148. много | lots
  149. разве | interrogative particle
  150. сказала | she said
  151. три | three
  152. эту | this, acc. fem. sing.
  153. моя | my, feminine
  154. впрочем | moreover, besides
  155. хорошо | good
  156. свою | ones own, acc. fem. sing.
  157. этой | oblique form of `эта', fem. `this'
  158. перед | in front of
  159. иногда | sometimes
  160. лучше | better
  161. чуть | a little
  162. том | preposn. form of `that one'
  163. нельзя | one must not
  164. такой | such a one
  165. им | to them
  166. более | more
  167. всегда | always
  168. конечно | of course
  169. всю | acc. fem. sing of `all'
  170. между | between
  171. | b: some paradigms
  172. |
  173. | personal pronouns
  174. |
  175. | я меня мне мной [мною]
  176. | ты тебя тебе тобой [тобою]
  177. | он его ему им [него, нему, ним]
  178. | она ее эи ею [нее, нэи, нею]
  179. | оно его ему им [него, нему, ним]
  180. |
  181. | мы нас нам нами
  182. | вы вас вам вами
  183. | они их им ими [них, ним, ними]
  184. |
  185. | себя себе собой [собою]
  186. |
  187. | demonstrative pronouns: этот (this), тот (that)
  188. |
  189. | этот эта это эти
  190. | этого эты это эти
  191. | этого этой этого этих
  192. | этому этой этому этим
  193. | этим этой этим [этою] этими
  194. | этом этой этом этих
  195. |
  196. | тот та то те
  197. | того ту то те
  198. | того той того тех
  199. | тому той тому тем
  200. | тем той тем [тою] теми
  201. | том той том тех
  202. |
  203. | determinative pronouns
  204. |
  205. | (a) весь (all)
  206. |
  207. | весь вся все все
  208. | всего всю все все
  209. | всего всей всего всех
  210. | всему всей всему всем
  211. | всем всей всем [всею] всеми
  212. | всем всей всем всех
  213. |
  214. | (b) сам (himself etc)
  215. |
  216. | сам сама само сами
  217. | самого саму само самих
  218. | самого самой самого самих
  219. | самому самой самому самим
  220. | самим самой самим [самою] самими
  221. | самом самой самом самих
  222. |
  223. | stems of verbs `to be', `to have', `to do' and modal
  224. |
  225. | быть бы буд быв есть суть
  226. | име
  227. | дел
  228. | мог мож мочь
  229. | уме
  230. | хоч хот
  231. | долж
  232. | можн
  233. | нужн
  234. | нельзя