Nous sommes le Dim 20 Juil, 2025 13:33
Supprimer les cookies

analyse lexicale

Pour une tâche précise, pour remplacer un logiciel propriétaire donné...

Jeu 05 Avr, 2007 11:46

Bonjour,
je cherche un logiciel libre en français, qui fonctionne sous Windows, pour effectuer des analyses de discours et lexicales (type Sphinx Lexica ou Tropes, mais libre !).
Si cela n'existe pas encore et que quelqu'un de motivé et compétent souhaite se pencher sur le sujet, il aura mon éternelle reconnaissance :)
Merci par avance pour vos réponses.

Axl.
Axl

Messages : 2

Jeu 05 Avr, 2007 13:48

Il n'y a à ma connaissance pas de logiciel libre se consacrant à l'analyse lexicale, hormis pour une maigre partie, le logiciel TextStat. Cela manque grandement à la panoplie du chercheur et de l'étudiant et j'avoue que j'aurais apprécié en trouver pour mes recherches en thèse, notamment sur les occurences de certaines phrases ou expressions.
Maintenant, je ne te cache que cela reste pour ma part en projet. Je n'ai pas encore véritablement le temps de m'y mettre, mais trois solutions se profilent :
  • via le langage Rebol, non libre mais extrêmement fonctionnel et compact, il possède de plus des fonctions de parsage assez poussées, le format retenu pour les textes étant le txt, avec
  • en Python où là aussi le parsage peut être poussé assez loin, le format utilisé étant le même que précédemment
  • enfin en PHP via des fichiers XML, mais cela demande un balisage préalable des textes.

L'avantage de ces 3 solutions est qu'elles fonctionnent sur tous les systèmes et peuvent être intégrées à un site web. J'attends d'avoir un peu plus de temps libre pour pouvoir m'y attaquer de nouveau.
Qu'attends-tu d'un tel logiciel ? Cela peut être intéressant de confronter nos approches.
Tux, il a eu ton âme... Il aura ta femme !

Hadopi Hadoptée ? Et Haprès ?
kaneda_aka_tetsuoka

Avatar de l’utilisateur
Messages : 1749
Géo : Lille

Ven 06 Avr, 2007 07:16

Je ne suis pas un spécialiste en la matière, l'article Wikipedia sur l'analyse lexicale renvoie vers un logiciel appelé flex ...

A part ça, est-ce qu'un logiciel de "fouille de textes" (Text Mining) ne pourrait pas convenir? Je pense notamment à R avec le package tm. R peut être interfacé facilement avec d'autres langages de programmation, dont Python ... Je viens d'ailleurs de trouver un article intéressant à ce sujet.

Je connais un peu la "fouille de données" (data mining), et dans ce domaine il y a un excellent logiciel (libre) appelé Weka. A la base, ce logiciel ne fait pas du text mining, mais ils mentionnent sur leur wiki un outil appelé "Weka on Text" ...
moron

Messages : 366

Ven 06 Avr, 2007 07:53

moron a écrit:Je ne suis pas un spécialiste en la matière, l'article Wikipedia sur l'analyse lexicale renvoie vers un logiciel appelé flex ...

flex n'a rien à voir : C'est un outil pour créer des compilateurs :
Il permet de générer le squelette d'un compilateur, d'après la description formelle d'un langage de programmation.
serged

Avatar de l’utilisateur
Messages : 1300
Géo : Montrouge (92)

Ven 06 Avr, 2007 08:13

Merci pour cette précision.
moron

Messages : 366

Sam 07 Avr, 2007 12:17

Donnez une arme à quelqu'un et il s'en servira.
Donnez du pouvoir à quelqu'un et il en abusera.
sirakawa

Messages : 633
Géo : Orléans

Dim 08 Avr, 2007 09:30

Bonjour,
merci pour ces premières réponses :) Je dois dire cependant que vous me semblez être des informaticiens chevronnés, puisque vous parlez tous d'interfacer et de programmer ! Pour ma part, je ne suis qu'une simple utilisatrice. Mes besoins sont plus du genre "produits finis" !
Je suis allée sur le site de GNU pour flex, mais il n'est pas compatible avec Windows et il est en anglais. Ce n'est, en outre, pas exactement ce que je recherche. Quelque chose du genre :
" * la classification automatique des mots du texte ;
* la contraction du texte (automatique et réglable) ;
* la détection du contexte global du document ;
* la catégorisation des mots-outils (analyse qualitative) ;
* la localisation de séries chronologiques (analyse du discours) ;
* le calcul des relations entre thèmes (lexicométrie) ;
* des dictionnaires sémantiques personnalisables, appelés Scénarios, conçus pour fabriquer rapidement des outils d'interprétation ou des thesaurus automatiques ;
* l'extraction terminologique (couplée à l'analyse sémantique) ;
* l'affichage sélectif par thème ou par catégorie linguistique ;
* le filtrage des thèmes en fonction de leur pertinence ;
* des graphes hypertextes permettant d'analyser et de naviguer dans les documents."

... serait plus approprié. Bref un logiciel (libre) d'analyse sémantique, lexical.
Apparemment, cela n'existe pas encore.

Merci quand même :)

Axl.
Axl

Messages : 2

Mar 10 Avr, 2007 05:49

Justement WefQDA est destiné à un public de non-spécialistes
Donnez une arme à quelqu'un et il s'en servira.
Donnez du pouvoir à quelqu'un et il en abusera.
sirakawa

Messages : 633
Géo : Orléans

Ven 13 Avr, 2007 20:41

Si la notice de WEFTQDA n'a pas inspiré l'auteur de la question, c'est qu'on s'est planté dans la réaction. Je dis "on" pour avoir proposé trois lignes, mais je pense qu'il fat promouvoir un tel logiciel dont l'uilité est évidente AUSSI dans les études littéraires.
En particulier, adresse à ELRIK et aux vrais auteurs de la notice
Donnez une arme à quelqu'un et il s'en servira.
Donnez du pouvoir à quelqu'un et il en abusera.
sirakawa

Messages : 633
Géo : Orléans

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit