Nous sommes le Jeu 25 Avr, 2024 02:18
Supprimer les cookies

StarDict : comment créer un dictionnaire balisé?

Sur le logiciel libre en général ou un logiciel libre en particulier

Sam 06 Jan, 2007 05:59

Bonjour,

J'utilise Windows XP et la version portable de StarDict. C'est moi qui ai rédigé la dernière mouture de l'article sur Wikipédia. Je désirerais apprendre à créer des dictionnaires pour ce logiciel. Les dictionnaires en format texte à numériser se trouvent sur Project Gutenberg (Nutall Encyclopaedia, Dictionnaire des idées reçues, 1811 Dictionary of the Vulgar Tongue, Glossaire franco-canadien, etc.) et sur Ebooks libres et gratuits. Je suis bénévole chez ces deux éditeurs de livres électroniques. Je ne sais pas comment faire la conversion, le balisage. L'un de mes objectifs est de publier The French and English Dictionary de James Boïelle. Ce dictionnaire bilingue est bien plus complet que tout ce qui existe pour le moment sous StarDict et je sais que la demande pour ce genre de dictionnaires est très forte (de là l'existence de logiciels comme Babylon).

Je suis plus compétent que l'utilisateur d'ordinateur moyen, mais beaucoup moins compétent que n'importe quel programmeur. J'ai fait des recherches sur Internet pour voir s'il existait un tutoriel, mais je n'ai rien trouvé. J'ai aussi écrit à François Gannaz, auteur de XMLittré, dictionnaire qui existe aussi en format StarDict et à Hu Zheng, créateur de StarDict. Aucun des deux ne m'a répondu.

Pour quelle raison voudrais-je créer des dictionnaires libres? Pour démocratiser l'accès aux dictionnaires, tout simplement, et pour faciliter le travail de recherche des linguistes.

Hugo V.

P.-S.

Ma grande crainte est que le balisage soit trop compliqué pour quelqu'un ayant mes connaissances. Si c'était le cas, il serait merveilleux que quelqu'un soit prêt à créer un programme me facilitant la tâche.
hiogui

Messages : 6

Sam 06 Jan, 2007 11:56

Salut, excellente initiative que la tienne, je te souhaite bien du courage :p

J'ai trouvé ça : http://stardict.sourceforge.net/HowToCreateDictionary
et ça : http://stardict.sourceforge.net/DICTFILE_FORMAT

sur le site de stardict, j'ai trop mal au crâne pour lire alors je sais pas si c'est suffisant...
Merci de faire une recherche avant de poster : sur le site et Image sur le forum
Lisez aussi la charte et la méthode à suivre pour poster.
JoKoT3

Messages : 1350
Géo : Paris

Sam 06 Jan, 2007 18:36

Merci du conseil,

J'ai regardé attentivement les liens que tu m'as proposés et je constate qu'il existe bien un tutoriel pour créer des dicos pour StarDict, mais vraiment, il est à des kilomètres d'être convivial comme le Babylon Builder (http://www.babylon.com/display.php?id=15&tree=3&level=2).

J'aurais préféré que mes glossaires fonctionnent sous StarDict, mais il me faudrait probablement des jours de bidouillage, qui pourraient bien ne pas aboutir (en fait, je suis convaincu qu'il n'aboutiraient pas). La seule solution qui s'offre à moi est donc de créer des glossaires pour Babylon (logiciel propriétaire). Je souhaite qu'il sera possible techniquement de convertir les glossaires Babylon au format StarDict.

Je dois avouer que je suis assez frustré que ce soit la seule solution qui s'offre à moi. J'ai souvent eu l'impression d'être un laissé-pour-compte du logiciel libre quand je voulais apporter ma pierre à l'édifice, et c'est encore une fois le sentiment que j'ai. :-(

J'ai commencé à travailler le Dictionnaire des idées reçues de Flaubert.

Hugo V.
hiogui

Messages : 6

Lun 08 Jan, 2007 23:12

Tu peux peut-être demander sur le forum ou sur la ml.

Apparemment la doc court pas les rues, mais ceux qui ont déjà créé des dicos doivent bien avoir quelques astuces/scripts dans un coin pour rendre ça plus agréable.
Merci de faire une recherche avant de poster : sur le site et Image sur le forum
Lisez aussi la charte et la méthode à suivre pour poster.
JoKoT3

Messages : 1350
Géo : Paris

Jeu 15 Nov, 2007 09:38

Bonjour,
Fais-moi signe si tu lis encore ce post (depuis 10 mois ...)
Je suis très intéressé par ce que tu fais ...
Nous (quelques membres du forum ubuntu-fr) essayons depuis quelques temps de mettre des dictionnnaires sous un format libre (en l'occurence stardict). On a une petite expérience dans le domaine, je pense qu'on serait très complémentaire :P

cf la page de notre wiki: http://doc.ubuntu-fr.org/stardict
a+
hector

Messages : 9

Jeu 15 Nov, 2007 20:31

Bonjour,

Oui. Je suis encore cette conversation et je suis bien heureux que tu me répondes. Les dictionnaires libres sont de plus en plus nombreux sur Internet, et mes recherches m'ont permis de trouver quelques perles rares ici et là depuis que j'ai écrit ce message (comme le dictionnaire de cuisine d'Alexandre Dumas).

Je connais également quelqu'un (un informaticien) qui pourrait être intéressé par ce que vous faites et désirer faire de la programmation. De mon côté, je me mets à votre disposition et je mets mes modestes compétences à votre disposition. La question de la linguistique informatique et de l'informatique m'intéresse assez pour que je désire étudier dans le domaine, moi qui suis déjà bardé de diplômes. :-)

J'ai rédigé un dictionnaire des régionalismes québécois avec traduction en français standard (le plus complet et le plus sérieux sur le Web). J'ai discuté avec de nombreuses personnes qui se disaient intéressées ou début, et qui m'ont toutes abandonné (sauf peut-être une).

Hugo V.

Modification: En passant, le XMLittré pour StarDict comporte quelques bogues (direction vers la mauvaise définition), mais François Gannaz ne désire pas corriger le problème (je lui ai écrit). Par exemple, l'entrée de "palafitte" vous redirige vers la définition d'"uretère". Une chose qui me semble aussi agaçante est la distinction que StarDict fait entre majuscules et minuscules.
hiogui

Messages : 6

Jeu 15 Nov, 2007 23:39

Bonsoir,
Depuis quelques mois nous essayons de dénicher des dictionnaires libres, mêmes modestes, sur la toile et de les convertir au format stardict. Par exemple, nous avons pu ajouter un dictionnaire latin-français, japonais-français, corse-français, breton-français: mêmes si certains d'entre eux sont modestes, c'est déjà ça!

Je viens de mettre votre dictionnaire flaubertien au format stardict, sans mise en forme et avec des maladresses (répétition des mots, mots en majuscule). En attendant mieux, Il faut que je trouve un moyen pour vous l'envoyer, envoyez moi si vous le souhaitez votre courriel par MP.

Sinon, je suis très intéressé par le dictionnaire de cuisine d'Alexandre Dumas, miam! Et je suis preneur de tout dictionnaire pour les mettre au format stardict.

Au plaisir,

hector

nb: pour le Littré, j'avais aussi remarqué quelques erreurs. Mais la première chose à faire si on désire le corriger, c'est de récupérer le code source (fichier XML): or, je n'arrive pas à joindre l'auteur...
hector

Messages : 9

Ven 16 Nov, 2007 17:06

Brièvement, comment faire un dictionnaire stardict: (expliqué aussi ici)


En fait, pour mettre un dictionnaire au format stardict, la première chose à faire est de le mettre sous format texte, en respectant ces quelques règles:

une ligne = 1 mot et sa définition
le mot et sa définition sont séparés par une tabulation (caractère \t)
si le mot fait plusieurs lignes, utiliser \n pour signifier un retour à la ligne.

personnellement, pour mettre le texte au bon format, j'utilise au maximum la fonction "rechercher-remplacer" disponible dans tout éditeur de texte ; ou plus fin, je code ( ou me fais coder...) quelques scripts bash (sous linux). et parfois il faut finir "à la main", ce qui est assez fastidieux...

une fois le fichier mis sous cette forme, un convertisseur comme tabfile ou stardict-editor le transforme en dictionnaire. (je les utilise sous linux ubuntu, mais je crois qu'ils existent aussi sous windows...)
hector

Messages : 9

Sam 16 Mai, 2009 16:29

Bonjour à tous.

Très intéressé par le sujet.
Je cherche un dictionnaire anglais français audio très complet qui distinguerait les différents sens d’un même mot ;
les homonymes-homographes-homophones s’écrivent de la même manière, ils se prononcent de la même manière mais ils ont des sens différents. Dans le tableau ci-dessous, exemple de mot : may (voir freelang)
anglais>sens>français>sens>Audio
may>v aux>pouvoir>v aux>may.mp3
may>bot>aubépine>botanique>may.mp3
may>poes>fleur>poes>may.mp3
May>month>mai>mois>May.mp3

Ce dictionnaire serait exportable (avec plus ou moins de facilité) en format .csv ou .txt ou mieux encore vers excel.
J’apprécierais beaucoup un dictionnaire comme celui-là (même s’il n’a pas d’audio).

J'ai trouvé freelang mais difficile à récupérer car pas de ; entre les champs. Si quelqu'un sait comment le récupérer sur un tableur... Ce serait formidable.
J'ai commencé à utiliser Stardic; il semble y avoir des champs divers (phrases ...). J'ai téléchargé le dico de Luc Han ici
http://polyglotte.tuxfamily.org/doku.ph … _bilingues

J'ai donc les fichiers :
woaifayu-ef.dict.dz
woaifayu-ef.idx
woaifayu-ef.ifo

Mais j'ai du mal à mettre en place stardic-editor pour windows.
Le mien est en .exe donc forcément ... cela devrait marcher.
J'ai le site mais c'est du chinois!
Eric86

Messages : 5

Dim 02 Nov, 2014 20:31

Bonjour,

5 ans entre deux posts! mais peut-être Hector est-il toujours intéressé par les dictionnaires libres à convertir au format stardict ?

J'ai écrit le petit dictionnaire des mots rares et anciens de la langue française, en 2006, et souhaiterais qu'il soit aussi sous stardict puis sous format .app pour mac via l'utilitaire permettant cette conversion (DictUnifier ou sdconv ?). Il existe sous pdf, epub ou autres formats pour liseuses.

Mon mail est dmeral chez orange.fr


Cordialement,

Didier Meral
Didier Meral

Messages : 1

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit