Nous sommes le Ven 18 Juil, 2025 17:48
Supprimer les cookies

Page 1 sur 21, 2 Suivantcomment transformer des tableaux PDF en tableaux excel

Pour une tâche précise, pour remplacer un logiciel propriétaire donné...

Lun 05 Nov, 2007 22:14

Bonjour,

J'utilise au bureau des masses de stat générées en format PDF. Ces stats sont sous forme de tableau, et j'en ai besoin dans excel. Résultat : des heures de ressaisies à la main.

Donc : comment transformer des tableaux PDF en tableaux excel, avec un logiciel libre ? (voir pas libre, à l'extrême).

Cordialement.
Christophe Cx

Messages : 1

Lun 05 Nov, 2007 22:36

Tu les a exporté en pdf alors réutilise ce logiciel pour te faire un export en txt puis utilise openoffice (calc) pour réimporter ce fichier txt.

sinon utiliser un logiciel pour transformer de pdf en txt. Sous linux j'utilise pdftotext mais il doit bien y avoir qcq chose pour ton os.
i love vim
limax

Avatar de l’utilisateur
Messages : 474
Géo : grenoble

Lun 05 Nov, 2007 22:53

peut être quelques pistes ici

Amicalement
L'homme n'est pas fait pour travailler et la preuve, c'est que ça le fatigue. (Marcel Proust)
dedenimes

Messages : 2410
Géo : proche de Nîmes

Mar 06 Nov, 2007 01:52

Tu devrais nous mettre en fichier joint un de tes pdf pour que l'on voit ce qui est envisageable (pdf avec un tableau texte ou pdf avec un tableau image) ...
Sans plus d'information, deux idées :
1. sélectionner avec l'outil texte ton tableau dans Acrobat Reader, copier puis coller le tout dans Excel (ou OO Calc),
2. utiliser un OCR genre FineReader (qui reconnait les tableaux).
Désolé, mais aucune des deux solutions n'est "libre".
hemhel

Messages : 78

Mar 06 Nov, 2007 09:24

Je me suis posé la même question il y a quelque temps. Tous les outils que j'avais trouvés étaient des sharewares. Rien de gratuit et/ou libre. Pour mes besoins la solution suivante a été suffisante:

hemhel a écrit:1. sélectionner avec l'outil texte ton tableau dans Acrobat Reader, copier puis coller le tout dans Excel (ou OO Calc),


Avec la seule différence que j'avais copié et traité le tableau dans un éditeur de texte (notepad++) avant de passer au tableur. Mais bon, si l'on a régulièrement des quantités importantes de tableaux à convertir, ce n'est pas super.

Pour les bricoleurs et/ou ceux qui doivent absolument disposer d'une solution libre (et grauite) j'ai eu l'idée suivante.

(1) Convertir le pdf en format html avec pdftohtml (= libre)
(2) Extraire les tableaux html à l'aide d'un script perl ou grep (= libre) et les écrire dans un fichier texte qui peut être importé par un tableur

Avantage: Automatisaton
Désavantages: demande des compétences en programmation. Il s'agit aussi d'une double conversion (pdf-> html et html -> txt), avec un double risque de perte d'informations.

Comme je l'ai dit, il s'agit d'une idée. Je n'ai pas essayé ...
moron

Messages : 366

Mar 06 Nov, 2007 10:37

J'ignore le format des données finale. Mais :

  • Copier/Coller brutal dans Excel
  • Tu dois te retrouver avec une colonne avec tes données...
  • Sélection de la colonne. "Données/Convertir..."
  • Et là tu peux choisir comment convertir (séparateurs, colonnes de largeur fixe etc.)
  • Tu te retrouves avec un beau tableau tout propre !

Il doit y avoir une méthode semblable dans OpenOffice Calc (mais pas sous la main, je suis au boulot...).
serged

Avatar de l’utilisateur
Messages : 1300
Géo : Montrouge (92)

Mar 06 Nov, 2007 12:21

il doit bien y avoir un équivalent de pdftotext (libre) sous windows car on peut le faire facilement un petit programme (batch je ne suis pas certain du nom enfin comme un bash sous linux) en le couplant à sed (ou awk ou autre) et ses expressions régulières pour nettoyer le fichier txt obtenu
ou alors utiliser un livecd

Met nous sur le net un exemple de tes pdf.
i love vim
limax

Avatar de l’utilisateur
Messages : 474
Géo : grenoble

Mar 06 Nov, 2007 13:08

limax a écrit:il doit bien y avoir un équivalent de pdftotext (libre) sous windows

Oui:
http://www.foolabs.com/xpdf/download.html

Adobe Reader permet aussi d'enregistrer un pdf en txt.
moron

Messages : 366

Mar 06 Nov, 2007 16:47

oui mais peux tu le faire en console (batch) avec acrobat?

alors qu'avec pdftotext c'est simple
i love vim
limax

Avatar de l’utilisateur
Messages : 474
Géo : grenoble

Mar 06 Nov, 2007 17:03

limax a écrit:oui mais peux tu le faire en console (batch) avec acrobat?

Je ne sais pas.

limax a écrit:alors qu'avec pdftotext c'est simple

C'est surtout plus souple qu'Acrobat Reader, grâce aux options proposées par pdftotext.
moron

Messages : 366

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit