pattern__premier-essai~20171216-163317.py 1.3 KB

123456789101112131415161718192021222324252627282930313233343536
  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. #from __future__ import unicode_literals
  4. from pattern.fr import parse, split
  5. texte_brut = u"Le petit chat rugit alors que l'esclave humain tarde à accomplir sa tâche de nourrissage du maître et seigneur."
  6. texte_traite = parse( texte_brut )
  7. def imprimer_structure_mot ( mot ):
  8. '''imprime la structure de la phrase'''
  9. print 'index : ' + str( mot.index )
  10. print 'string : ' + str( mot.string )
  11. print '_custom_tags : ' + str( mot._custom_tags )
  12. print 'sentence : ' + str( mot.sentence )
  13. print 'pnp : ' + str( mot.pnp )
  14. print 'chunk : ' + str( mot.chunk )
  15. print 'lemma : ' + str( mot.lemma )
  16. print 'type : ' + str( mot.type )
  17. for phrase in split( texte_traite ):
  18. print "——————————"
  19. print "mots :"
  20. print phrase.words
  21. print "——————————"
  22. print "groupes de mots :"
  23. print phrase.chunks
  24. print "——————————"
  25. print "structure, phrase :"
  26. print phrase.__dict__.keys()
  27. print "——————————"
  28. print "structure, mot :"
  29. print phrase.words[0].__dict__.keys()
  30. print "——————————"
  31. print "structure, chunk (groupe de mots) :"
  32. print phrase.chunks[0].__dict__.keys()