stopwords_es.txt 5.5 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354
  1. | From svn.tartarus.org/snowball/trunk/website/algorithms/spanish/stop.txt
  2. | This file is distributed under the BSD License.
  3. | See http://snowball.tartarus.org/license.php
  4. | Also see http://www.opensource.org/licenses/bsd-license.html
  5. | - Encoding was converted to UTF-8.
  6. | - This notice was added.
  7. | A Spanish stop word list. Comments begin with vertical bar. Each stop
  8. | word is at the start of a line.
  9. | The following is a ranked list (commonest to rarest) of stopwords
  10. | deriving from a large sample of text.
  11. | Extra words have been added at the end.
  12. de | from, of
  13. la | the, her
  14. que | who, that
  15. el | the
  16. en | in
  17. y | and
  18. a | to
  19. los | the, them
  20. del | de + el
  21. se | himself, from him etc
  22. las | the, them
  23. por | for, by, etc
  24. un | a
  25. para | for
  26. con | with
  27. no | no
  28. una | a
  29. su | his, her
  30. al | a + el
  31. | es from SER
  32. lo | him
  33. como | how
  34. más | more
  35. pero | pero
  36. sus | su plural
  37. le | to him, her
  38. ya | already
  39. o | or
  40. | fue from SER
  41. este | this
  42. | ha from HABER
  43. sí | himself etc
  44. porque | because
  45. esta | this
  46. | son from SER
  47. entre | between
  48. | está from ESTAR
  49. cuando | when
  50. muy | very
  51. sin | without
  52. sobre | on
  53. | ser from SER
  54. | tiene from TENER
  55. también | also
  56. me | me
  57. hasta | until
  58. hay | there is/are
  59. donde | where
  60. | han from HABER
  61. quien | whom, that
  62. | están from ESTAR
  63. | estado from ESTAR
  64. desde | from
  65. todo | all
  66. nos | us
  67. durante | during
  68. | estados from ESTAR
  69. todos | all
  70. uno | a
  71. les | to them
  72. ni | nor
  73. contra | against
  74. otros | other
  75. | fueron from SER
  76. ese | that
  77. eso | that
  78. | había from HABER
  79. ante | before
  80. ellos | they
  81. e | and (variant of y)
  82. esto | this
  83. mí | me
  84. antes | before
  85. algunos | some
  86. qué | what?
  87. unos | a
  88. yo | I
  89. otro | other
  90. otras | other
  91. otra | other
  92. él | he
  93. tanto | so much, many
  94. esa | that
  95. estos | these
  96. mucho | much, many
  97. quienes | who
  98. nada | nothing
  99. muchos | many
  100. cual | who
  101. | sea from SER
  102. poco | few
  103. ella | she
  104. estar | to be
  105. | haber from HABER
  106. estas | these
  107. | estaba from ESTAR
  108. | estamos from ESTAR
  109. algunas | some
  110. algo | something
  111. nosotros | we
  112. | other forms
  113. mi | me
  114. mis | mi plural
  115. tú | thou
  116. te | thee
  117. ti | thee
  118. tu | thy
  119. tus | tu plural
  120. ellas | they
  121. nosotras | we
  122. vosotros | you
  123. vosotras | you
  124. os | you
  125. mío | mine
  126. mía |
  127. míos |
  128. mías |
  129. tuyo | thine
  130. tuya |
  131. tuyos |
  132. tuyas |
  133. suyo | his, hers, theirs
  134. suya |
  135. suyos |
  136. suyas |
  137. nuestro | ours
  138. nuestra |
  139. nuestros |
  140. nuestras |
  141. vuestro | yours
  142. vuestra |
  143. vuestros |
  144. vuestras |
  145. esos | those
  146. esas | those
  147. | forms of estar, to be (not including the infinitive):
  148. estoy
  149. estás
  150. está
  151. estamos
  152. estáis
  153. están
  154. esté
  155. estés
  156. estemos
  157. estéis
  158. estén
  159. estaré
  160. estarás
  161. estará
  162. estaremos
  163. estaréis
  164. estarán
  165. estaría
  166. estarías
  167. estaríamos
  168. estaríais
  169. estarían
  170. estaba
  171. estabas
  172. estábamos
  173. estabais
  174. estaban
  175. estuve
  176. estuviste
  177. estuvo
  178. estuvimos
  179. estuvisteis
  180. estuvieron
  181. estuviera
  182. estuvieras
  183. estuviéramos
  184. estuvierais
  185. estuvieran
  186. estuviese
  187. estuvieses
  188. estuviésemos
  189. estuvieseis
  190. estuviesen
  191. estando
  192. estado
  193. estada
  194. estados
  195. estadas
  196. estad
  197. | forms of haber, to have (not including the infinitive):
  198. he
  199. has
  200. ha
  201. hemos
  202. habéis
  203. han
  204. haya
  205. hayas
  206. hayamos
  207. hayáis
  208. hayan
  209. habré
  210. habrás
  211. habrá
  212. habremos
  213. habréis
  214. habrán
  215. habría
  216. habrías
  217. habríamos
  218. habríais
  219. habrían
  220. había
  221. habías
  222. habíamos
  223. habíais
  224. habían
  225. hube
  226. hubiste
  227. hubo
  228. hubimos
  229. hubisteis
  230. hubieron
  231. hubiera
  232. hubieras
  233. hubiéramos
  234. hubierais
  235. hubieran
  236. hubiese
  237. hubieses
  238. hubiésemos
  239. hubieseis
  240. hubiesen
  241. habiendo
  242. habido
  243. habida
  244. habidos
  245. habidas
  246. | forms of ser, to be (not including the infinitive):
  247. soy
  248. eres
  249. es
  250. somos
  251. sois
  252. son
  253. sea
  254. seas
  255. seamos
  256. seáis
  257. sean
  258. seré
  259. serás
  260. será
  261. seremos
  262. seréis
  263. serán
  264. sería
  265. serías
  266. seríamos
  267. seríais
  268. serían
  269. era
  270. eras
  271. éramos
  272. erais
  273. eran
  274. fui
  275. fuiste
  276. fue
  277. fuimos
  278. fuisteis
  279. fueron
  280. fuera
  281. fueras
  282. fuéramos
  283. fuerais
  284. fueran
  285. fuese
  286. fueses
  287. fuésemos
  288. fueseis
  289. fuesen
  290. siendo
  291. sido
  292. | sed also means 'thirst'
  293. | forms of tener, to have (not including the infinitive):
  294. tengo
  295. tienes
  296. tiene
  297. tenemos
  298. tenéis
  299. tienen
  300. tenga
  301. tengas
  302. tengamos
  303. tengáis
  304. tengan
  305. tendré
  306. tendrás
  307. tendrá
  308. tendremos
  309. tendréis
  310. tendrán
  311. tendría
  312. tendrías
  313. tendríamos
  314. tendríais
  315. tendrían
  316. tenía
  317. tenías
  318. teníamos
  319. teníais
  320. tenían
  321. tuve
  322. tuviste
  323. tuvo
  324. tuvimos
  325. tuvisteis
  326. tuvieron
  327. tuviera
  328. tuvieras
  329. tuviéramos
  330. tuvierais
  331. tuvieran
  332. tuviese
  333. tuvieses
  334. tuviésemos
  335. tuvieseis
  336. tuviesen
  337. teniendo
  338. tenido
  339. tenida
  340. tenidos
  341. tenidas
  342. tened