Bonjour à tous,
alors, pour ceux que cela intéresse (Pernmith en l'occurence), voici le résultat des courses avec Wilbur (pas très rapide mais chi va piano va sano e lontano, l'orthographe et la phrase sont approximatifs):
Installation sans problème dans une partition différente de C:\
Pour indexer (et donc scanner par la suite) les fichiers pdf, il faut télécharger le programme pdftotext. Il se trouve à cette adresse:
http://wilbur.redtree.com/pdf_fr.htm
Pour les plus confiants, le lien direct est ici:
http://wilbur.redtree.com/downloads/xpdf-1.00-win32.zip
C'est un fichier zip dans lequel il y a pas mal de fichiers. Le seul intéressant dans ce cas est pdftotext.exe qu'il faut placer dans le répertoire de Wilbur. Je le précise parce que la phrase « Wilbur utilisera automatiquement ce programme (pdftotext.exe) s'il est directement accessible ou placé dans le chemin système de votre machine. » sur le site de l'éditeur m'a laissé un peu perplexe et je n'en étais pas sûr.
Ensuite, le programme correspond tout à fait à ce que je cherchais. Bien paramétré, il est rapide et répond correctement aux requêtes sur les fichiers qui m'intéressaient et peut se limiter à certains dossiers précis.
Je l'ai testé sur des fichiers .pdf (acrobat reader), .txt (bloc-notes Windows), .doc (word), et .sxw (Open office).
Il ne prête pas attention à la casse (maj et min) ni au début ni au sein des mots. Si vous écrivez comme un hacker, une recherche sur « piRatEZ » fonctionnera pour piratez et pour PIRATEZ.
En revanche, les accents sont importants, pensez-y si vous êtes habitué aux recherches google... Par exemple, ne recherche sur le mot « equitation » ne trouvera pas le terme « équitation » mais « Equitation » ne fonctionnera pas non plus.
Pour créer un index, je n'ai pas trouvé la prise en main très intuitive, en tatonnant, voici ce que j'ai compris.
Vous pouvez en créer plusieurs. Ce peut être intéressant pour ne faire une recherche que sur vos documents de travail uniquement ou sur vos doc perso uniquement par exemple.
Pour le créer: menu Fichiers/Nouvel Index (jusque là çà va).
Une fenêtre Propriétés de l'index s'ouvre.
Si vous voulez indexer des fichiers Ooo, allez tout de suite à l'onglet Options et cochez l'option Fichiers Zip comme dossiers.
Ensuite, il faut décider quels fichiers vous souhaitez indexer. Si vous avez beaucoup de données, de fichiers différents etc, il vaut mieux sélectionner (c'est M. Wilbur qui le dit).
Dans ce cas, le plus simple est de retourner dans l'onglet Inclure des fichiers. Vous sélectionnez l'ensemble de la liste (clic sur le premier item, et clic+shift sur le dernier). Vous cliquez sur copier et vous allez le coller dans un éditeur de texte quelconque pour en avoir une sauvegarde. Ensuite, vous cliquez sur Nettoyer, tout s'efface mais ce n'est pas grave, vous venez juste de le sauvegarder.
Maintenant vous rajoutez un à un les types de fichiers qui vous intéressent en faisant ajouter et sous la forme:
*.doc
*.txt
*.pdf
*.xml
Cependant, si vous avez un disque dur ou une partition dédiée à la documentation, vous pouvez préciser au logiciel le chemin de manière à ce qu'il n'indexe pas tout l'ordinateur. Exemple pour un disque K:\ dédié à la doc:
K:\*.doc
K:\*.txt
K:\*.pdf
K:\*.xml
Si c'est sur le bureau:
C:\Documents and Settings\VOTRE COMPTE\Bureau\DOSSIER\*.doc
C:\Documents and Settings\VOTRE COMPTE\Bureau\DOSSIER\*.txt
C:\Documents and Settings\VOTRE COMPTE\Bureau\DOSSIER\*.pdf
C:\Documents and Settings\VOTRE COMPTE\Bureau\DOSSIER\*.xml
etc. etc.
Je n'ai pas eu besoin de cette fonction mais si vous avez des images ou des fichiers sons, vidéos etc qui ne comprennent pas de texte, vous pouvez les indexer mais Wilbur ne recherchera que sur le nom de fichiers. (Peut-être sur les Tags pour les MP3 et autress ogg mais là je vous laisse faire vos propres tests).
Il me semble qu'il est également possible d'indexer les mails mais je ne l'ai pas fait non plus.
Pour les détails sur la recherche, je vous renvoie à la page
http://wilbur.redtree.com/aide/searchdialog.htm
qui liste les opérateurs ET, OU, &, etc qui aident à la recherche (ET ne marche pas c'est pour l'exemple).
Attention, si vous avez créé plusieurs index, Wilbur réinitialise le champ « Changer d'index » de la recherche. Il faut resélectionner l'index désiré. A lire ce n'est pas clair mais si vous faites une recherche vous devriez comprendre tout de suite.
Petite précision: un scan avec AVG free-edition ne trouve rien dans le fichier zip de pdftotext aisni que dans wilbur. Je sais, je suis un peu parano mais bon...
Voilà, c'est tout.
Bon courage, j'espère avoir été clair et gagner le concours du post le plus long.
C'est un jeu pour enfant d'ailleurs celui qui post le plus loin...