Un (bon) logiciel d'OCR ?
Je m'explique, et cette réponse vise surtout à poser un petit débat sur l'utilisation du .pdf, car j'en ai peut-être une vision un peu ...... ( trop formaliste ?), et surtout que l'auteur du post ne se sente pas visé, simplement la concision de la question a entrainé de ma part cette réaction quasi immédiate (cela fait un certain temps justement que je me pose cette question de "bureaunéthiquette").
Personnellement j'ai toujours perçu dans le format .pdf un format "d'impression" FINALE d'un document (créé par un traitement de texte, un tableur etc....) de façon à ce que la publication de ce document soit d'une part lisible (et imprimable) sur toutes les plate-formes et d'autre part sans que ce document soit altéré contre la volonté de son rédacteur, ni que les éventuelles astuces de conception et autres données confidentielles contenues dans le fichier d'origine soient ainsi divulguées.
C'est pourquoi par exemple l'administration nous envoie dans ce format les attestations qu'elle délivre électroniquement.
Vouloir le convertir de nouveau en un document modifiable (au fait en passant pourquoi au format .doc et pas .rtf ou .sxw mais c'est un autre débat) revient dans mon esprit à faire en quelque sorte une copie (par définition illicite) du diocument .pdf.
Si je dis illicite c'est parce que si l'auteur du document l'avait souhaité, il mettrait également à disposition le document d'origine ayant servi à le créer, logique non ?
Donc "moralement" je considère qu'il n'y a pas de différence entre le sens qu'on pourrait mettre dans cette question et le fait de récupérer à l'aide d'un logiciel d'OCR le contenu d'un texte imprimé (uniquement à titre de citation bien entendu et avec l'accord de l'auteur).
Quand aux logiciels "libres et gratuits" pour effectuer cette opération de (rétro)conversion, je ne connais que la possibilité de récupérer les données textuelles du document .pdf ou de le convertir en pages html, mais rien d'efficace avec des documents à la présentation un peu complexe.
Peut-être les autres réponses à cette question seront-elles plus précises ?
Encore une fois que l'auteur de la question ne se sente surtout pas attaqué par ce débat si ses intentions sont "honnêtes" a priori, sinon .... ben il connait mon opinion sur le sujet maintenant
