pattern__premier-essai~20171216-163559.py 1.6 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051
  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. #from __future__ import unicode_literals
  4. from pattern.fr import parse, split
  5. texte_brut = u"Le petit chat rugit alors que l'esclave humain tarde à accomplir sa tâche de nourrissage du maître et seigneur."
  6. texte_traite = parse( texte_brut )
  7. def imprimer_structure_mot ( mot ):
  8. '''imprime la structure de la phrase'''
  9. print 'index : ' + str( mot.index )
  10. print 'string : ' + str( mot.string )
  11. print '_custom_tags : ' + str( mot._custom_tags )
  12. print 'sentence : ' + str( mot.sentence )
  13. print 'pnp : ' + str( mot.pnp )
  14. print 'chunk : ' + str( mot.chunk )
  15. print 'lemma : ' + str( mot.lemma )
  16. print 'type : ' + str( mot.type )
  17. for phrase in split( texte_traite ):
  18. print "——————————"
  19. print "mots :"
  20. try:
  21. print phrase.words
  22. except Exception as e:
  23. print 'erreur : ' + str(e)
  24. print "——————————"
  25. print "groupes de mots :"
  26. try:
  27. print str(phrase.chunks)
  28. except Exception as e:
  29. print 'erreur : ' + str(e)
  30. print "——————————"
  31. print "structure, phrase :"
  32. try:
  33. print phrase.__dict__.keys()
  34. except Exception as e:
  35. print '💩 erreur : ' + str(e)
  36. print "——————————"
  37. print "structure, mot :"
  38. try:
  39. print phrase.words[0].__dict__.keys()
  40. except Exception as e:
  41. print 'erreur : ' + str(e)
  42. print "——————————"
  43. print "structure, chunk (groupe de mots) :"
  44. print phrase.chunks[0].__dict__.keys()