stopwords_pt.txt 4.7 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253
  1. | From svn.tartarus.org/snowball/trunk/website/algorithms/portuguese/stop.txt
  2. | This file is distributed under the BSD License.
  3. | See http://snowball.tartarus.org/license.php
  4. | Also see http://www.opensource.org/licenses/bsd-license.html
  5. | - Encoding was converted to UTF-8.
  6. | - This notice was added.
  7. |
  8. | NOTE: To use this file with StopFilterFactory, you must specify format="snowball"
  9. | A Portuguese stop word list. Comments begin with vertical bar. Each stop
  10. | word is at the start of a line.
  11. | The following is a ranked list (commonest to rarest) of stopwords
  12. | deriving from a large sample of text.
  13. | Extra words have been added at the end.
  14. de | of, from
  15. a | the; to, at; her
  16. o | the; him
  17. que | who, that
  18. e | and
  19. do | de + o
  20. da | de + a
  21. em | in
  22. um | a
  23. para | for
  24. | é from SER
  25. com | with
  26. não | not, no
  27. uma | a
  28. os | the; them
  29. no | em + o
  30. se | himself etc
  31. na | em + a
  32. por | for
  33. mais | more
  34. as | the; them
  35. dos | de + os
  36. como | as, like
  37. mas | but
  38. | foi from SER
  39. ao | a + o
  40. ele | he
  41. das | de + as
  42. | tem from TER
  43. à | a + a
  44. seu | his
  45. sua | her
  46. ou | or
  47. | ser from SER
  48. quando | when
  49. muito | much
  50. | há from HAV
  51. nos | em + os; us
  52. já | already, now
  53. | está from EST
  54. eu | I
  55. também | also
  56. só | only, just
  57. pelo | per + o
  58. pela | per + a
  59. até | up to
  60. isso | that
  61. ela | he
  62. entre | between
  63. | era from SER
  64. depois | after
  65. sem | without
  66. mesmo | same
  67. aos | a + os
  68. | ter from TER
  69. seus | his
  70. quem | whom
  71. nas | em + as
  72. me | me
  73. esse | that
  74. eles | they
  75. | estão from EST
  76. você | you
  77. | tinha from TER
  78. | foram from SER
  79. essa | that
  80. num | em + um
  81. nem | nor
  82. suas | her
  83. meu | my
  84. às | a + as
  85. minha | my
  86. | têm from TER
  87. numa | em + uma
  88. pelos | per + os
  89. elas | they
  90. | havia from HAV
  91. | seja from SER
  92. qual | which
  93. | será from SER
  94. nós | we
  95. | tenho from TER
  96. lhe | to him, her
  97. deles | of them
  98. essas | those
  99. esses | those
  100. pelas | per + as
  101. este | this
  102. | fosse from SER
  103. dele | of him
  104. | other words. There are many contractions such as naquele = em+aquele,
  105. | mo = me+o, but they are rare.
  106. | Indefinite article plural forms are also rare.
  107. tu | thou
  108. te | thee
  109. vocês | you (plural)
  110. vos | you
  111. lhes | to them
  112. meus | my
  113. minhas
  114. teu | thy
  115. tua
  116. teus
  117. tuas
  118. nosso | our
  119. nossa
  120. nossos
  121. nossas
  122. dela | of her
  123. delas | of them
  124. esta | this
  125. estes | these
  126. estas | these
  127. aquele | that
  128. aquela | that
  129. aqueles | those
  130. aquelas | those
  131. isto | this
  132. aquilo | that
  133. | forms of estar, to be (not including the infinitive):
  134. estou
  135. está
  136. estamos
  137. estão
  138. estive
  139. esteve
  140. estivemos
  141. estiveram
  142. estava
  143. estávamos
  144. estavam
  145. estivera
  146. estivéramos
  147. esteja
  148. estejamos
  149. estejam
  150. estivesse
  151. estivéssemos
  152. estivessem
  153. estiver
  154. estivermos
  155. estiverem
  156. | forms of haver, to have (not including the infinitive):
  157. hei
  158. havemos
  159. hão
  160. houve
  161. houvemos
  162. houveram
  163. houvera
  164. houvéramos
  165. haja
  166. hajamos
  167. hajam
  168. houvesse
  169. houvéssemos
  170. houvessem
  171. houver
  172. houvermos
  173. houverem
  174. houverei
  175. houverá
  176. houveremos
  177. houverão
  178. houveria
  179. houveríamos
  180. houveriam
  181. | forms of ser, to be (not including the infinitive):
  182. sou
  183. somos
  184. são
  185. era
  186. éramos
  187. eram
  188. fui
  189. foi
  190. fomos
  191. foram
  192. fora
  193. fôramos
  194. seja
  195. sejamos
  196. sejam
  197. fosse
  198. fôssemos
  199. fossem
  200. for
  201. formos
  202. forem
  203. serei
  204. será
  205. seremos
  206. serão
  207. seria
  208. seríamos
  209. seriam
  210. | forms of ter, to have (not including the infinitive):
  211. tenho
  212. tem
  213. temos
  214. tém
  215. tinha
  216. tínhamos
  217. tinham
  218. tive
  219. teve
  220. tivemos
  221. tiveram
  222. tivera
  223. tivéramos
  224. tenha
  225. tenhamos
  226. tenham
  227. tivesse
  228. tivéssemos
  229. tivessem
  230. tiver
  231. tivermos
  232. tiverem
  233. terei
  234. terá
  235. teremos
  236. terão
  237. teria
  238. teríamos
  239. teriam