Nous sommes le Sam 21 Juin, 2025 14:22
Supprimer les cookies

Analyse statistique de texte ?

Pour une tâche précise, pour remplacer un logiciel propriétaire donné...

Lun 21 Mars, 2011 14:18

Bonjour à tous et à chacun.

Pour exploiter les réponses à la question ouverte d'un sondage, j'aimerais pouvoir disposer d'un outil qui permettre de lister et calculer les occurences des mots les plus utilisés, tout en court-circuitant les mots "vides" de genre "de", "le", "la" etc.
L'idéal serait que cet outil puisse effectuer ces statistiques par réponse, puis sur la somme des réponses...

Merci par avance de vos lumières.
daniel-16

Messages : 2

Lun 21 Mars, 2011 21:21

Es-tu un peu développeur ?
cheval_boiteux

Avatar de l’utilisateur
Messages : 1531
Géo : Dole (39) - Strasbourg (67)

Lun 21 Mars, 2011 21:59

J'utilise TextStat, simple, efficace libre et gratuit. http://www.lunerouge.org/spip/article.php3?id_article=364
Bertrand Verstraete

Messages : 22
Géo : Ardennes

Lun 21 Mars, 2011 22:51

Bertrand Verstraete a écrit:J'utilise TextStat, simple, efficace libre et gratuit. http://www.lunerouge.org/spip/article.php3?id_article=364


et sa fiche Framasoft : http://www.framasoft.net/article1005.html

Texstats est la 1e idée qui m'est venue en tête car je l'ai utilisé pour le même genre de travail mais il y a aussi KGen http://kgen.elitwork.com/accueil.html, une extension pour Firefox. Je ne l'ai jamais utilisé de manière approfondie mais peut-être conviendra t'elle.
Cordialement,
fiuzzy
fiuzzy

Messages : 39

Ven 25 Mars, 2011 10:40

Bonjour et merci pour vos pistes. Je viens d'essayer TextStat ; il dégrossit bien la question ; mais ne traite pas le cas des mots "vides".
Je vous remercie encore.
daniel-16

Messages : 2

Ven 25 Mars, 2011 11:22

Si je comprends bien ce que tu entends par "mots vides", il s'agit des mots que tu souhaites exclure de l'analyse. Si c'est bien le cas, il te suffit de compléter la liste d'exclusion (en bas de la partie gauche de l'interface). cf. aide du logiciel : "Vous pouvez aussi demander une recherche de répétitions de mots. Ceci dans le but d'éviter l'utilisation d'un même mot dans un court intervalle de texte. Pour cela, vous devez cocher la case et définir le nombre de mots d'écarts pour l'intervalle. Vous pouvez aussi définir une liste de mots à ignorer dans cette recherche car sinon le résultat risque de devenir inutilisable."
Bertrand Verstraete

Messages : 22
Géo : Ardennes

Dim 05 Juin, 2011 17:40

salut,

je n'ai jamais utilisé mais il y a Cassandre. Au départ, il s'agit d'analyse qualitative mais je pense qu'il gère également le nombre d’occurrence.


Texquest :


il y a pas mal de logiciel dans ce domaine là squash ulg ac be logiciels

désolé mais mon statuts ne me permet pas de poster de liens....
passagerclandestin

Messages : 1

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit