pattern__phrases-vers-dot--2-label-pos-abbr~20171216-190238.py 1.3 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445
  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. from pattern.fr import parse, split
  4. texte_brut = u"Suivez les flèches, attention aux trous.".encode('utf-8')
  5. texte_traite = parse( texte_brut )
  6. numero_mot = -1
  7. def imprimer_erreur ( erreur ):
  8. print '💩 erreur : ' + str( erreur )
  9. def demarrer_graphe () :
  10. print 'digraph G {'
  11. print ' graph [ rankdir=LR ];'
  12. def ajouter_noeud_mot ( word, numero ):
  13. print ' ' + str( numero ) + ' [label="' + word.string + '"];'
  14. def ajouter_noeud_type ( word, numero ):
  15. type_pos = word.type.replace( '.', 'point' ).replace( ',', 'virgule' )
  16. print ' type__' + str( numero ) + '__' + type_pos + ' [label="' + word.type + '"];'
  17. print ' ' + str( numero ) +' -> type__' + str( numero ) + '__' + type_pos;
  18. def lier_a_noeud_precedent ( numero ):
  19. if ( numero_mot > 0 ):
  20. print ' ' + str( numero - 1 ) + ' -> ' + str ( numero )
  21. def clore_graphe () :
  22. print '}'
  23. demarrer_graphe ()
  24. # pour chaque phrase
  25. for phrase in split( texte_traite ):
  26. # pour chaque mot
  27. for word in phrase.words:
  28. # on incrément le numéro du mot
  29. numero_mot = numero_mot + 1
  30. ajouter_noeud_mot ( word, numero_mot )
  31. ajouter_noeud_type ( word, numero_mot )
  32. lier_a_noeud_precedent ( numero_mot )
  33. clore_graphe ()