pattern__premier-essai.py 1.6 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152
  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. from pattern.fr import parse, split
  4. texte_brut = u"Le petit chat rugit alors que l'esclave humain tarde a accomplir sa tache de nourrissage du maitre et seigneur.".encode('utf-8')
  5. texte_traite = parse( texte_brut )
  6. def imprimer_erreur ( erreur ):
  7. print '💩 erreur : ' + str( erreur )
  8. def imprimer_structure_mot ( mot ):
  9. '''imprime la structure de la phrase'''
  10. print 'index : ' + str( mot.index )
  11. print 'string : ' + str( mot.string )
  12. print '_custom_tags : ' + str( mot._custom_tags )
  13. print 'sentence : ' + str( mot.sentence )
  14. print 'pnp : ' + str( mot.pnp )
  15. print 'chunk : ' + str( mot.chunk )
  16. print 'lemma : ' + str( mot.lemma )
  17. print 'type : ' + str( mot.type )
  18. for phrase in split( texte_traite ):
  19. print "——————————"
  20. print "mots :"
  21. try:
  22. print phrase.words
  23. except Exception as erreur:
  24. imprimer_erreur( erreur )
  25. print "——————————"
  26. print "groupes de mots :"
  27. try:
  28. print str(phrase.chunks)
  29. except Exception as erreur:
  30. imprimer_erreur( erreur )
  31. print "——————————"
  32. print "structure, phrase :"
  33. try:
  34. print phrase.__dict__.keys()
  35. except Exception as erreur:
  36. imprimer_erreur( erreur )
  37. print "——————————"
  38. print "structure, mot :"
  39. try:
  40. print phrase.words[0].__dict__.keys()
  41. except Exception as erreur:
  42. imprimer_erreur( erreur )
  43. print "——————————"
  44. print "structure, chunk (groupe de mots) :"
  45. print phrase.chunks[0].__dict__.keys()