Nous sommes le Jeu 07 Août, 2025 07:38
Supprimer les cookies

...rechercher dans un PDF

Pour une tâche précise, pour remplacer un logiciel propriétaire donné...

Mar 15 Fév, 2011 11:49

Bonjour,

J'utilise actuellement Evince pour lire mes PDF et je trouve très utile la fonction de recherche de mots dans les PDF considérés comme du texte. Seulement j'ai des PDF qui sont considérés par le logiciel comme des images, et je ne peux pas rechercher de texte dedans.

J'ai essayé d'utiliser l'ORC de gscan2pdf mais il associe un texte à l'ensemble de la page, ce qui permet à Evince de me dire "2 occurrences trouvées" lorsque je recherche un mot, sans pour autant me surligner l'endroit où se trouvent lesdites occurrences, comme il a coutume de le faire avec un "vrai" texte en PDF.

Quelqu'un(e) saurait-il/elle comment je pourrai résoudre mon problème ?

Merci d'avance :)
Juste pour le référencement (sauf si vous habitez le Morbihan) : http://www.senesaccorde.org/
Bogoris

Messages : 48

Mar 15 Fév, 2011 13:59

Salut,

Est-ce que ton texte ocr-isé est "par dessus" ton image ?

Jean
janolap1

Avatar de l’utilisateur
Messages : 348
Géo : Bourges

Mar 15 Fév, 2011 16:00

Oui, c'est ça, le texte orc-isé apparait dans une infobulle lorsque je survole l'image avec le pointeur.

EDIT :
Je lis dans la manpage qu'il est écrit :
There is an OCR output buffer for each page and is embedded both as an annotation (pop-up note) and as plain text behind the scanned image in the PDF produced. This way, Beagle can index (i.e. search) the plain text, and the contents of the annotations can be viewed in Acrobat Reader.
Juste pour le référencement (sauf si vous habitez le Morbihan) : http://www.senesaccorde.org/
Bogoris

Messages : 48

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit