Nous sommes le Lun 21 Juil, 2025 13:30
Supprimer les cookies

Page 1 sur 21, 2 SuivantRecupérer texte pdf sous linux

Sur le logiciel libre en général ou un logiciel libre en particulier

Mar 03 Jan, 2006 23:51

Je m'explique : j'ai souvenir que quand j'étais sous windows, avec acrobat reader, je pouvais copier/coller le texte d'un fichier pdf (sans mise ne forme ni rien, juste le texte brut, mais c'est qu'il me faut, là...)
Or sous linux, je n'y arrive pas, ni avec kpdf, ni avec xpdf.

Quelqu'un saurait-il comment faire avec un de ces 2 logiciels, ou bien quel lecteur pdf utiliser sous linux pour juste récuperer le texte brut d'un pdf (sans mise en forme) ?

Merci de vos conseils avisés
korova08

Messages : 1114
Géo : Ardennes (08)

Mer 04 Jan, 2006 00:50

Xpdf fait ça très bien(*1), comme la plupart des lecteurs de pdf (*2) sous Linux (*3) ! :shock:

Maps


(*2) tu peux aussi utiliser Evince, gpdf (sous Gnome), etc.


(*3) évidemment si le pdf le permet, ce qui n'est pas le cas de tous les pdf... (mais le problème est le même sous Windows !)


(*1) évidemment aussi, xpdf le fait à sa manière :D : sélectionne avec la souris le texte que tu veux copier et clique simplement avec la molette dans l'application où tu veux coller la sélection... Ce qui est rigolo, c'est que tu peux sélectionner des bouts de phrases, ou juste une partie d'un paragraphe (qui ne se suit pas forcément dans le texte)... Pas si archaïque que ça(*4), xpdf :wink:


(*4) remarque, il n'accepte pas le Ctrl+C / Ctrl+V...
Maps

Avatar de l’utilisateur
Messages : 1691
Géo : Québec

Mer 04 Jan, 2006 06:39

korova08 a écrit:Je m'explique : j'ai souvenir que quand j'étais sous windows, avec acrobat reader, je pouvais copier/coller le texte d'un fichier pdf (sans mise ne forme ni rien, juste le texte brut, mais c'est qu'il me faut, là...)
Or sous linux, je n'y arrive pas, ni avec kpdf, ni avec xpdf.


Tu as eu la réponse avec xpdf, c'est aussi possible avec kpdf : tu devrais avoir une petite icône représentant un carré avec une flèche de curseur à l'intérieur, cette icône sert à sélectionner une partie du texte (ou même des images, je crois bien, mais je n'ai jamais utilisé cette partie).
Si tu n'as pas l'icône, c'est dans le menu «Mode souris», tu dois choisir «Sélectioner» en bas de ce menu.
(testé avec kpdf 0.4.2)
Sebastien

Messages : 730
Géo : Sainte-Marie (974)

Mer 04 Jan, 2006 08:49

Tu peux aussi telecharger acrobat reader pour linux... La fonction manquante dans xpdf ou kpdf est plutot la fonction recherche...
JP

Messages : 93
Géo : Tallinn - Estonie

Mer 04 Jan, 2006 09:56

Dois vraiment être nulle :( j'avais jamais réussi à le faire jusqu'ici...
korova08

Messages : 1114
Géo : Ardennes (08)

Mer 04 Jan, 2006 10:10

Maps a écrit:
(*3) évidemment si le pdf le permet, ce qui n'est pas le cas de tous les pdf... (mais le problème est le même sous Windows !)

Là un petit bricolage devrait quand même permettre d'y arriver... :wink:
serged

Avatar de l’utilisateur
Messages : 1300
Géo : Montrouge (92)

Mer 04 Jan, 2006 12:56

JP a écrit:La fonction manquante dans xpdf ou kpdf est plutot la fonction recherche...

La fonction recherche existe sous Xpdf ! Un petit Ctrl+F ou un clic sur les jumelles marche très bien pour ça...

Maps
Maps

Avatar de l’utilisateur
Messages : 1691
Géo : Québec

Mer 04 Jan, 2006 13:59

Bonjour

Mais non tu n'es pas nul car tout dépend comment à été fait pdf .... et l'outil de capture de texte ne fonctionne pas sur certains document au format pdf y compris avec acrobat reader (*)

Pour en savoir plus je te conseil cet excellent site duquel je cite

Avec certains fichiers PDF, la récupération du texte est impossible. Cela n'est pas forcément dû à une protection quelqueconque du PDF, mais à la façon dont le texte a été enregistré dans le fichier PDF. Si le copier-coller du texte donne des caractères bizarre, vous ne pourrez jamais en extraire le texte. Il n'y a rien que vous ou moi puissiez y faire.


http://sebsauvage.net/pdf/


(*) pour installer la dernière version propriétaire mais gratuite du lecteur d'adobe si tu es sous ubuntu et que tu as mis à jour les dépos avec easy ubuntu il suffit de taper dans une console la formule magique :

sudo apt-get install acroread
alaingre

Messages : 1192
Géo : http://brenta.free.fr

Mer 04 Jan, 2006 14:55

Mmm, bon, pas si nulle que ça quand même, hein...
En utilisant la bouton du milieu de ma souris avec xpdf, je reconnais que ça marche... (mais ça ne marchait pas avec ctrl-C / ctrl-V comme expliqué plus haut)
Et en fait, je n'ai pas kpdf mais KGhostView, donc je n'ai pas le bouton magique qui permet de sélectionner le texte (forcément). Je finis par confondre tous ces trucs en K, moi. (Y'a trop de logiciels dans le libre, marre quoi ! :wink: )

Quant à télécharger acroread, bah, pourquoi pas, mais pas avec apt-get, car je ne suis pas sous ubuntu mais sous debian, et acroread est pas dispo sous debian (pas assez libre, je suppose...)

Merci pour votre aide en tout cas
korova08

Messages : 1114
Géo : Ardennes (08)

Mer 04 Jan, 2006 19:30

korova08 a écrit:Quant à télécharger acroread, bah, pourquoi pas, mais pas avec apt-get, car je ne suis pas sous ubuntu mais sous debian, et acroread est pas dispo sous debian (pas assez libre, je suppose...)
Il y a longtent que tu es sous debian?
évidemment que cela marche apt-get. Je n'utilise que apt-get pour installer les softs.
pour acroread il suffit de mettre les (exellentes) sources Marillat. Dans ton /etc/apt/sources.list tu rajoutes la ligne:
deb ftp://ftp.nerim.net/debian-marillat/ sid main (Si tu as une etch tu remplaces sid par etch)
Il te faut taper ensuite en root
# apt-get update (pour mettre à jour)
# apt-get install acroread (pour installer acroread)
i love vim
limax

Avatar de l’utilisateur
Messages : 474
Géo : grenoble

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit