stopwords_es.txt 5.9 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356
  1. | From svn.tartarus.org/snowball/trunk/website/algorithms/spanish/stop.txt
  2. | This file is distributed under the BSD License.
  3. | See http://snowball.tartarus.org/license.php
  4. | Also see http://www.opensource.org/licenses/bsd-license.html
  5. | - Encoding was converted to UTF-8.
  6. | - This notice was added.
  7. |
  8. | NOTE: To use this file with StopFilterFactory, you must specify format="snowball"
  9. | A Spanish stop word list. Comments begin with vertical bar. Each stop
  10. | word is at the start of a line.
  11. | The following is a ranked list (commonest to rarest) of stopwords
  12. | deriving from a large sample of text.
  13. | Extra words have been added at the end.
  14. de | from, of
  15. la | the, her
  16. que | who, that
  17. el | the
  18. en | in
  19. y | and
  20. a | to
  21. los | the, them
  22. del | de + el
  23. se | himself, from him etc
  24. las | the, them
  25. por | for, by, etc
  26. un | a
  27. para | for
  28. con | with
  29. no | no
  30. una | a
  31. su | his, her
  32. al | a + el
  33. | es from SER
  34. lo | him
  35. como | how
  36. más | more
  37. pero | pero
  38. sus | su plural
  39. le | to him, her
  40. ya | already
  41. o | or
  42. | fue from SER
  43. este | this
  44. | ha from HABER
  45. sí | himself etc
  46. porque | because
  47. esta | this
  48. | son from SER
  49. entre | between
  50. | está from ESTAR
  51. cuando | when
  52. muy | very
  53. sin | without
  54. sobre | on
  55. | ser from SER
  56. | tiene from TENER
  57. también | also
  58. me | me
  59. hasta | until
  60. hay | there is/are
  61. donde | where
  62. | han from HABER
  63. quien | whom, that
  64. | están from ESTAR
  65. | estado from ESTAR
  66. desde | from
  67. todo | all
  68. nos | us
  69. durante | during
  70. | estados from ESTAR
  71. todos | all
  72. uno | a
  73. les | to them
  74. ni | nor
  75. contra | against
  76. otros | other
  77. | fueron from SER
  78. ese | that
  79. eso | that
  80. | había from HABER
  81. ante | before
  82. ellos | they
  83. e | and (variant of y)
  84. esto | this
  85. mí | me
  86. antes | before
  87. algunos | some
  88. qué | what?
  89. unos | a
  90. yo | I
  91. otro | other
  92. otras | other
  93. otra | other
  94. él | he
  95. tanto | so much, many
  96. esa | that
  97. estos | these
  98. mucho | much, many
  99. quienes | who
  100. nada | nothing
  101. muchos | many
  102. cual | who
  103. | sea from SER
  104. poco | few
  105. ella | she
  106. estar | to be
  107. | haber from HABER
  108. estas | these
  109. | estaba from ESTAR
  110. | estamos from ESTAR
  111. algunas | some
  112. algo | something
  113. nosotros | we
  114. | other forms
  115. mi | me
  116. mis | mi plural
  117. tú | thou
  118. te | thee
  119. ti | thee
  120. tu | thy
  121. tus | tu plural
  122. ellas | they
  123. nosotras | we
  124. vosotros | you
  125. vosotras | you
  126. os | you
  127. mío | mine
  128. mía |
  129. míos |
  130. mías |
  131. tuyo | thine
  132. tuya |
  133. tuyos |
  134. tuyas |
  135. suyo | his, hers, theirs
  136. suya |
  137. suyos |
  138. suyas |
  139. nuestro | ours
  140. nuestra |
  141. nuestros |
  142. nuestras |
  143. vuestro | yours
  144. vuestra |
  145. vuestros |
  146. vuestras |
  147. esos | those
  148. esas | those
  149. | forms of estar, to be (not including the infinitive):
  150. estoy
  151. estás
  152. está
  153. estamos
  154. estáis
  155. están
  156. esté
  157. estés
  158. estemos
  159. estéis
  160. estén
  161. estaré
  162. estarás
  163. estará
  164. estaremos
  165. estaréis
  166. estarán
  167. estaría
  168. estarías
  169. estaríamos
  170. estaríais
  171. estarían
  172. estaba
  173. estabas
  174. estábamos
  175. estabais
  176. estaban
  177. estuve
  178. estuviste
  179. estuvo
  180. estuvimos
  181. estuvisteis
  182. estuvieron
  183. estuviera
  184. estuvieras
  185. estuviéramos
  186. estuvierais
  187. estuvieran
  188. estuviese
  189. estuvieses
  190. estuviésemos
  191. estuvieseis
  192. estuviesen
  193. estando
  194. estado
  195. estada
  196. estados
  197. estadas
  198. estad
  199. | forms of haber, to have (not including the infinitive):
  200. he
  201. has
  202. ha
  203. hemos
  204. habéis
  205. han
  206. haya
  207. hayas
  208. hayamos
  209. hayáis
  210. hayan
  211. habré
  212. habrás
  213. habrá
  214. habremos
  215. habréis
  216. habrán
  217. habría
  218. habrías
  219. habríamos
  220. habríais
  221. habrían
  222. había
  223. habías
  224. habíamos
  225. habíais
  226. habían
  227. hube
  228. hubiste
  229. hubo
  230. hubimos
  231. hubisteis
  232. hubieron
  233. hubiera
  234. hubieras
  235. hubiéramos
  236. hubierais
  237. hubieran
  238. hubiese
  239. hubieses
  240. hubiésemos
  241. hubieseis
  242. hubiesen
  243. habiendo
  244. habido
  245. habida
  246. habidos
  247. habidas
  248. | forms of ser, to be (not including the infinitive):
  249. soy
  250. eres
  251. es
  252. somos
  253. sois
  254. son
  255. sea
  256. seas
  257. seamos
  258. seáis
  259. sean
  260. seré
  261. serás
  262. será
  263. seremos
  264. seréis
  265. serán
  266. sería
  267. serías
  268. seríamos
  269. seríais
  270. serían
  271. era
  272. eras
  273. éramos
  274. erais
  275. eran
  276. fui
  277. fuiste
  278. fue
  279. fuimos
  280. fuisteis
  281. fueron
  282. fuera
  283. fueras
  284. fuéramos
  285. fuerais
  286. fueran
  287. fuese
  288. fueses
  289. fuésemos
  290. fueseis
  291. fuesen
  292. siendo
  293. sido
  294. | sed also means 'thirst'
  295. | forms of tener, to have (not including the infinitive):
  296. tengo
  297. tienes
  298. tiene
  299. tenemos
  300. tenéis
  301. tienen
  302. tenga
  303. tengas
  304. tengamos
  305. tengáis
  306. tengan
  307. tendré
  308. tendrás
  309. tendrá
  310. tendremos
  311. tendréis
  312. tendrán
  313. tendría
  314. tendrías
  315. tendríamos
  316. tendríais
  317. tendrían
  318. tenía
  319. tenías
  320. teníamos
  321. teníais
  322. tenían
  323. tuve
  324. tuviste
  325. tuvo
  326. tuvimos
  327. tuvisteis
  328. tuvieron
  329. tuviera
  330. tuvieras
  331. tuviéramos
  332. tuvierais
  333. tuvieran
  334. tuviese
  335. tuvieses
  336. tuviésemos
  337. tuvieseis
  338. tuviesen
  339. teniendo
  340. tenido
  341. tenida
  342. tenidos
  343. tenidas
  344. tened