#!/usr/bin/env python # -*- coding: utf-8 -*- #from __future__ import unicode_literals from pattern.fr import parse, split texte_brut = u"Le petit chat rugit alors que l'esclave humain tarde à accomplir sa tâche de nourrissage du maître et seigneur." texte_traite = parse( texte_brut ) def imprimer_structure_mot ( mot ): '''imprime la structure de la phrase''' print 'index : ' + str( mot.index ) print 'string : ' + str( mot.string ) print '_custom_tags : ' + str( mot._custom_tags ) print 'sentence : ' + str( mot.sentence ) print 'pnp : ' + str( mot.pnp ) print 'chunk : ' + str( mot.chunk ) print 'lemma : ' + str( mot.lemma ) print 'type : ' + str( mot.type ) for phrase in split( texte_traite ): print "——————————" print "mots :" print phrase.words print "——————————" print "groupes de mots :" try: print str(phrase.chunks) except Exception as e: print 'erreur : ' + str(e) print "——————————" print "structure, phrase :" print phrase.__dict__.keys() print "——————————" print "structure, mot :" print phrase.words[0].__dict__.keys() print "——————————" print "structure, chunk (groupe de mots) :" print phrase.chunks[0].__dict__.keys()