Nous sommes le Dim 22 Juin, 2025 21:16
Supprimer les cookies

Page 1 sur 21, 2 SuivantConnaître nb de signes d'un site web

Pour une tâche précise, pour remplacer un logiciel propriétaire donné...

Lun 31 Mai, 2010 11:04

Bonjour à tous,

tout est dans mon titre: pour un projet de traduction de site, j'aurais besoin de savoir quel est le nombre de signes à faire traduire. Connaissez-vous un moyen d'identifier le nombre de signes compris sur un site (et pas seulement sur une page isolée)?

Merci d'avance pour tout tuyau!
Criquet

Messages : 40

Lun 31 Mai, 2010 16:01

Bonjour,

euh... qu'appelles tu un signe?
FaustXVI

Messages : 14

Lun 31 Mai, 2010 16:52

Je voulais dire: le nombre de caractères (c'est généralement comme ça qu'on évalue le travail à fournir pour un traducteur).
Criquet

Messages : 40

Mar 01 Juin, 2010 08:02

Salut,

Si le site ne comporte pas trop de pages, le plus simple est de faire un copie-coller du texte (Ctrl+A pour sélectionner tout le texte de la page) dans un éditeur de texte.

Ensuite, tu enregistres ton fichier texte et tu regardes son poids en octets (1 octet = 1 caractère).

Reste ensuite à affiner le nombre de caractères en ajoutant les textes cachés (titre, description de la page, légendes des images) et en enlevant les texte communs à toutes les pages.

@+

Fred
http://leblogdundsi.lesprost.fr, propulsé par PluXML, blog open source à la sauce XML
frederic45

Messages : 52

Mar 01 Juin, 2010 08:44

Bonjour,

Si possède les sources du site et que tu es sous linux, dans un terminal :
Code: Tout sélectionner
find /chemin/vers/dossier/source -type f | xargs wc

La dernière ligne te donne les totaux dans l'oridre : lignes | mots | caractères

@+
FaustXVI

Messages : 14

Mar 01 Juin, 2010 08:46

frederic45 a écrit:Salut,

Si le site ne comporte pas trop de pages, le plus simple est de faire un copie-coller du texte (Ctrl+A pour sélectionner tout le texte de la page) dans un éditeur de texte.

Ensuite, tu enregistres ton fichier texte et tu regardes son poids en octets (1 octet = 1 caractère).

Reste ensuite à affiner le nombre de caractères en ajoutant les textes cachés (titre, description de la page, légendes des images) et en enlevant les texte communs à toutes les pages.

@+

Fred


C'est effectivement une option possible (mais dans ce cas, n'est-il pas plus simple de recourir directement à l'outil "statistiques" d'un bon logiciel de traitement de textes?), mais dans les cas auxquels je pense, se pose le problème que tu évoquais: le nombre de pages est très élevé.

Du coup, je suis toujours à la recherche d'un logiciel qui irait explorer les entrailles du site pour y compter le nombre de caractères. Il y a bien des outils qui sillonnent des sites pour en vérifier les liens hypertextes, il y en a peut-être aussi qui, en passant, comptent les signes...
Criquet

Messages : 40

Mar 01 Juin, 2010 08:57

FaustXVI a écrit:Bonjour,

Si possède les sources du site et que tu es sous Linux, dans un terminal :
Code: Tout sélectionner
find /chemin/vers/dossier/source -type f | xargs wc

La dernière ligne te donne les totaux dans l'ordre : lignes | mots | caractères

@+


Ah? Ça, par contre, je ne connaissais pas. Mais y a-t-il moyen d'effectuer cette commande pour plusieurs pages d'un coup?
Et autre problème: si je dois renvoyer vers un dossier en local, je ne gagnerai pas beaucoup de temps car ça suppose de télécharger les pages en question une à une (j'ai les droits sur elles, mais pas de copie facile à exploiter: que des archives). Or si je dois faire ça, j'aurai aussi vite fait d'en copier le contenu vers un logiciel de traitement de textes et de faire appel à l'outil "statistiques". L'idéal serait donc une commande qui renvoie vers un dossier déjà présent sur un serveur (peut-on faire ça sous Linux? Je ne connais presque rien aux lignes de commande...), avec un filtre du genre "prends en compte tous les sites qui commencent par http://monsite/rubriqueMachin/sousRubriqueBidule/".

Merci pour vos tuyaux: ça ne règle pas encore parfaitement mon problème, mais on approche, me semble-t-il...
Criquet

Messages : 40

Mar 01 Juin, 2010 09:01

Si tu as accès au serveur web peut-être que tu peux mettre la ligne de commande en question dans un script shell, l'uploader sur le serveur, et l'exécuter depuis là-bas. Pour lui ce sera du local…
joan

Avatar de l’utilisateur
Messages : 886
Géo : France, Aquitaine, Bordeaux

Mar 01 Juin, 2010 09:18

Aie! Je suis dépassé. Je ne sais pas faire un script shell, ni l'exécuter depuis quelque part. Peux-tu m'en dire plus?

Cela dit, ça ne règle pas tout à fait les problèmes que je décrivais à l'instant: nombre de pages multiples, notamment...
Criquet

Messages : 40

Mar 01 Juin, 2010 09:25

FaustXVI a écrit:Bonjour,
find /chemin/vers/dossier/source -type f | xargs wc


Cette commande exclue-t'elle le code html de la page (à ne pas prendre en compte, sinon ton clienyt risque de faire des bons :D )?
http://leblogdundsi.lesprost.fr, propulsé par PluXML, blog open source à la sauce XML
frederic45

Messages : 52

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit