pattern__premier-essai~20171216-162642.py 1.5 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546
  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. #from __future__ import unicode_literals
  4. from pattern.fr import parse, split
  5. texte_brut = u"Le petit chat rugit alors que l'esclave humain tarde à accomplir sa tâche de nourrissage du maître et seigneur."
  6. texte_brut.encode('utf-8')
  7. texte = parse( texte_brut )
  8. def imprimer_structure_mot ( mot ):
  9. '''imprime la structure de la phrase'''
  10. print 'index : ' + str( mot.index )
  11. print 'string : ' + str( mot.string )
  12. print '_custom_tags : ' + str( mot._custom_tags )
  13. print 'sentence : ' + str( mot.sentence )
  14. print 'pnp : ' + str( mot.pnp )
  15. print 'chunk : ' + str( mot.chunk )
  16. print 'lemma : ' + str( mot.lemma )
  17. print 'type : ' + str( mot.type )
  18. for phrase in split( texte ):
  19. print "——————————"
  20. print "mots :"
  21. print phrase.words
  22. print "——————————"
  23. print "groupes de mots :"
  24. print phrase.chunks
  25. print "——————————"
  26. print "structure, phrase :"
  27. print phrase.__dict__.keys()
  28. print "——————————"
  29. print "structure, mot :"
  30. print phrase.words[0].__dict__.keys()
  31. print "——————————"
  32. print "structure, chunk (groupe de mots) :"
  33. print phrase.chunks[0].__dict__.keys()
  34. '''
  35. for mot in phrase.words:
  36. # print mot.__dict__.keys()
  37. print "---"
  38. imprimer_structure_mot( mot )
  39. # imprimer_la_structure_de_la_phrase( phrase.words[0] )
  40. '''