Nous sommes le Lun 23 Juin, 2025 11:57
Supprimer les cookies

Page 1 sur 21, 2 SuivantPasser d'un format PDF à un format word

Pour une tâche précise, pour remplacer un logiciel propriétaire donné...

Jeu 02 Sep, 2010 20:10

Bonsoir, j'ai cherché en vain un programme gratuit pour convertir des fichiers PDF en word cela existe t'il ? En vous remerciant d'avance pour vos réponses,
Bien cordialement
Raphbey

Messages : 6

Jeu 02 Sep, 2010 20:18

Bonjour Raphbey et bienvenu sur Framagora.

Directement, je ne sais pas, étant donné que le format .doc n'est pas libre ou même ouvert.

Mais tu peux toujours importer ton .pdf sous OpenOffice.org et ensuite l'enregistrer dans l'antédiluvien format .doc de Microsoft.
Quand tout le reste a échoué, lisez le mode d'emploi.
yostral

Avatar de l’utilisateur
Messages : 5403
Géo : Là-haut dans la montagne...

Jeu 02 Sep, 2010 20:26

Bonjour,
Le format PDF est un format non modifiable fait pour l'archivage. D'autant que l'auteur peut protéger son document du copier/coller.
Le plus simple est demander à l'auteur un format modifiable (ODF, par exemple).

Raphbey a écrit:pour convertir des fichiers PDF en word cela existe t'il ?
Le format .doc n'est pas un format ouvert donc sur un forum consacré au logiciel libre, cela fait tâche. :twisted:

Pour répondre plus à ta question, tu peux utiliser OpenOffice.org et l'extension Sun PDF Import Extension mais cela correspondra pas tout à fait à ton attente.
Vulcain

Messages : 625
Géo : Poitiers

Jeu 02 Sep, 2010 20:34

Bonsoir et désolé je suis réellement une bille en informatique donc je n'utilise pas vraiment les bons termes, merci de vos réponses, en fait j'ai des anciennes copies en format pdf et/ ou des livres numérisés sur google, une fois ceux-ci téléchargés je me demandais donc si il y avait un logiciel qui permettait de directement passer ce format en texte afin de le travailler ou de le modifier ( le vieux français etc...) , encore merci de votre indulgence ^^
Bien cordialement
Raphbey

Messages : 6

Jeu 02 Sep, 2010 21:47

Le pdf c'est l'équivalent numérique d'un format papier. Tu ne scannerais pas une feuille de papier en espérant modifier son contenu avec un traitement de texte... :)
Donc, pour les livres numérisés (donc photocopiés) de google la seule solution c'est la retouche d'image... :?

Pour un pdf qui provient de l'exportation via un traitement de texte c'est possible de l'importer selon la méthode de Vulcain avec OpenOffice parce que le fichier contient du texte et/ou des images, mais c'est une des rares exceptions. Mais comme le dit Vulcain ça reste assez limité et ça risque de ne pas correspondre à ce que tu cherches...
JosephK

Avatar de l’utilisateur
Messages : 2221

Jeu 02 Sep, 2010 22:51

Raphbey a écrit:Bonsoir et désolé je suis réellement une bille en informatique donc je n'utilise pas vraiment les bons termes
On l'a tous été et le sera tous. Je ne souhaitais pas de froisser. Je m'en excuse.
Cela change tellement qu'il est difficile d'être toujours au courant de tout, c'est pourquoi j'ai mis des liens vers des pages d'explications plus détaillées dans mon message. Bonne lecture :wink:
Vulcain

Messages : 625
Géo : Poitiers

Ven 03 Sep, 2010 08:35

yostral a écrit:Mais tu peux toujours importer ton .pdf sous OpenOffice.org et ensuite l'enregistrer dans l'antédiluvien format .doc de Microsoft.

Ben non. En ouvrant un PDF, OOo ne permet que de l'enregistrer dans un format de dessin (Dessin OpenOffice ou StarDraw).

Vulcain a écrit:Le format PDF est un format non modifiable fait pour l'archivage. D'autant que l'auteur peut protéger son document du copier/coller.

La "protection" contre le copier-coller est illusoire. C'est un simple bit dans le fichier disant "on peut copier/coller" ou pas. D'ailleurs certains logiciels (comme Evince) l'ignorent superbement.

À part le copier-coller d'un lecteur PDF vers un traitement de texte, je ne vois rien...
Sous [color=#008000]LinuxMint[/color] (Sarah - Cinnamon 64 bits) (de moins en moins sous Windows XP ou Seven)
serged

Avatar de l’utilisateur
Messages : 1300
Géo : Montrouge (92)

Ven 03 Sep, 2010 09:10

Bonjour,

Tu ouvres ton document avec ton lecteur PDF et, dans le menu FICHIER, tu utilises "Enregistrer sous.." puis tu sélectionnes le format de fichier ".TXT" (c'est en gros les mêmes commandes dans les différents lecteurs PDF). Ensuite, tu n'as plus qu'à ouvrir ton fichier .TXT avec Word. Très simple.

Bien-sûr, la mise en page n'est pas conservée.

A +
noethys

Messages : 15

Ven 03 Sep, 2010 09:45

Bonjour et mille mercis pour vos sympathiques réponses, j'ai donc essayé en téléchargeant un pdf sur google et de le lire en format texte, cela me donne un condensé de termes qui sont "[code binaire]" etc donc complétement illisible, par contre si je vais sur le site et que j'essaie de lire en texte brut ( mais page par page) selon la qualité de l'impression, la date du livre ( écrit en vieux françois et la police utilisée à l'époque) , c'est souvent plus compréhensible et je dois beaucoup moins corriger, alors quid est ce une manip. de google pour qu'on reste chez eux ?
J'avais vu que des sites font le promo d'un logiciel pdf to w***, seulement lorsque j'ai fais l'essai (qui n'était que de 3 pages) , cela me donnait des images de pages avec contenu dans le .d** et donc non modifiable, cela ne m'intéresse guère.
Dans tous les cas encore merci de votre réactivité et de votre singulière gentillesse,
Bien cordialement
Dernière édition par JosephK le Ven 03 Sep, 2010 16:45, édité 1 fois au total.
Raison: Suppression du code binaire, ça fait planter le flux rss
Raphbey

Messages : 6

Ven 03 Sep, 2010 11:09

Bonjour Raphbey

Comme vous parlez du vieux français et comme c’est un peu ma spécialité depuis plus de dix ans, je me permets d’intervenir pour vous en dire un peu plus. Dans les faits, c’est un peu plus compliqué que cela...

Quand Google (ou la B.N.F.) scannent un ouvrage ils le font d’abord en mode image. En clair c’est une photographie formée de points organisés en lignes et en colonnes. Des logiciels d’O.C.R permettent de trier ces points pour « lire » les caractères formés mais ils faut, pour cela tout de même bien savoir ce que l’on fait.

Les fichiers PDF tant de Google que de la B.N.F. contiennent souvent un avertissement ou une licence en mode texte. Le copier-coller est donc généralement faisable sur celles-ci. Puis, viennent les photocopies en mode image, le tout encapsulé dans un même fichier PDF que vous téléchargez. Il faut donc commencer par extraire les images (photocopies). Pour les ouvrages anciens, c’est très souvent le format TIFF CCITT groupe 4 à 300 points par pouce qui est utilisé. Certains logiciels extraient très bien ces images des PDFs (j’utilise pour ma part ImageMagic mais je dois reconnaître qu’il faut quand même avoir une idée précise de ce à quoi on veut en venir.

Une fois les fichier TIFF extraits, il est très facilement possible de faire une reconnaissance de caractère dessus avec un logiciel idoine ; mais là, je dois reconnaître aussi que les résultats sont très différents en fonction de la typographie d’origine... Partir d’une photocopie d’un texte en typographie contemporaine, parfaitement rectiligne et sans bavures réussit en général à plus de quatre-vingt-dix pour cent. Pour des typographies plus anciennes (XVIIIe, voire XVIIe siècle), c’est souvent une autre histoire et cela demande, en conséquence, un nombre important de retouches puisque la reconnaissance ne réussit pas partout...

Si votre texte ne fait que trois pages, vous pouvez me l’envoyer par courriel ; ce n’est pas un traitement long. Mais si vous voulez faire cela de manière plus fréquente, cela vous demandera un apprentissage qui peut être bénéfique à autrui, à fortiori si vous remettez votre travail de transcription en ligne sur le web puisque les textes anciens sont évidemment libres de droit.

Bien à vous,
:D
Sébastien Cosson

Avatar de l’utilisateur
Messages : 19
Géo : Meymac (19250)

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit