Nous sommes le Dim 29 Juin, 2025 17:15
Supprimer les cookies

Page 1 sur 21, 2 SuivantComment rechercher sous windows au sein d'un document texte?

Sur le logiciel libre en général ou un logiciel libre en particulier

Lun 21 Mars, 2005 17:06

Bonjour,
lecteur et téléchargeur de Framasoft depuis quelque temps déjà, je poste aujourd'hui mon premier message.
Je stocke de nombreux textes dans mon ordinateur anciennement au format Word et, aujourd'hui, au format .sxw.
Je viens de réaliser que, lorsque je lance la fonction "rechercher" de windows sur un dossier, il ne peut chercher dans le fichier.
Si quelqu'un connaît un moyen d'effectuer cette recherche, soit par windows soit par un autre logiciel (libre de préférence!), je serais ravi. Ce -je pense- manque de compatibilité pourrait me conduire à abandonner Ooo, puisque toute ma documentation est séparée en de multiples fichiers nommés par date. Sans cette fonction recherche, impossible de m'y retrouver.
Notez que j'utilise la version 1.1.0 d'Open office, peut-être que ce problème n'existe plus dans les versions ultérieures.
Merci d'avance à ceux qui pourront m'aider.
Matteo

Messages : 7

Lun 21 Mars, 2005 17:42

J'ai trouvé ceci: http://oootools.free.fr/fooox/clic.php?url=oootools.free.fr/fooox/fooox001b10.zip

Un petit programme de recherche de document openoffice.

D'autres outils ooo sont disponibles sur ce site:

http://oootools.free.fr/
pierre-yves

Messages : 483
Géo : Belgique

Lun 21 Mars, 2005 18:08

Bonjour,

Il y a un petit logiciel libre, très sympa, qui se présente comme un moteur de recherche local, il s'agit de Wilbur, et il est en français.
Après indexation des documents (types de fichiers et disques paramétrables) il effectue des recherches très rapides.

A+
Pernmith

Messages : 486
Géo : pas loin de Strasbourg

Lun 21 Mars, 2005 19:52

Pernmith a écrit:Bonjour,

Il y a un petit logiciel libre, très sympa, qui se présente comme un moteur de recherche local, il s'agit de Wilbur, et il est en français.
Après indexation des documents (types de fichiers et disques paramétrables) il effectue des recherches très rapides.

A+


Bonjour
Wilbur indexe les fichiers OpenOffice.org?

Par ailleurs, j'ai essayé ce logiciel (ver22b6_fr) sur mon PC (Win2k PIV 512Mo); beaucoup de plantages, malheureusement.
Au risque de passer pour un grand méchant, je signale que Gogole Desktop Search indexe les fichiers OpenOffice.org grâce à http://desktop.google.com/plugins/index ... ffice.html
Ceci dit, ce plugin semble libre.

Y. Mairesse
ymai

Messages : 371
Géo : Brüsel - Les Cités Obscures (BE)

Lun 21 Mars, 2005 23:12

Bonsoir,

Il me semble que Wilbur indexe tous types de fichiers. Alors pourquoi pas des documents Open Office? Reste plus qu'à essayer...

Jusque là il fonctionne très bien sur mon PC, j'ai pas à me plaindre. Par contre Google Desktop? C'est pas un peu Big Brother...?

A+
Pernmith

Messages : 486
Géo : pas loin de Strasbourg

Mar 22 Mars, 2005 00:49

Pernmith a écrit:Bonsoir,

Il me semble que Wilbur indexe tous types de fichiers. Alors pourquoi pas des documents Open Office? Reste plus qu'à essayer...

Jusque là il fonctionne très bien sur mon PC, j'ai pas à me plaindre. Par contre Google Desktop? C'est pas un peu Big Brother...?

A+


Sept fois dans la bouche tu tourneras ton clavier et la notice Framasoft tu liras avant de poster.
Bon, il est bien indiqué là http://www.framasoft.net/article1613.html que Wilbur 2.2 indexe les fichier OpenOffice.org. Et, en plus, il y a même un message sous la notice qui précise l'affaire.
Je m'inflige donc un blâme et je me condamne à réinstaller Wilbur. Je coche même l'option "Fichiers zip comme dossiers" cependant que l'extension xml est déjà sélectionnée dans les fichiers à indexer (comme le précise l'intervention sous la notice).

Conclusion: indexation de mon système sans plantage.
Par contre, la recherche donne des résultats aléatoires. Là, maintenant, il me trouve 1 occurrence du mot "ordinateur" dans plus de 3Go d'archives et m'indique "Recherche interrompue, seuls certains résultats seront affichés".
Bien, me dis-je. Pas grave. J'arrête le logiciel et je le redémarre. A ce moment, notification d'erreur: "Un fichier non nommé contient un chemin non valide". Tiens donc? Un fichier non nommé? Qu'est-ce???
Toujours est-il que, après validation du message d'erreur, il me trouve 286 ordinateurs dans des fichiers .doc et 414 dans des .php.
Fort de ce succès, je tente les .sxw. Rien!
Bah, au moins n'aurai-je pas le même problème que celui qui est soulevé dans l'intervention sous la notice: ouverture du fichier xml plutôt que du fichier Ooo.
Allez, je laisse encore un peu Wilbur sur mon système. Sait-on jamais que quelqu'un connaîtrait l'incantation ad-hoc...

En passant, Wilbur n'indexe pas *tous les fichiers*, mais seulement ceux qui lui sont désignés. Et il me paraît normal que les fichiers Ooo ne soient pas indexés automatiquement: ces fichiers sont effectivement des .zip qui se cachent et qui doivent être analysés selon une méthode particulière. Pas simplement du texte brut.
Gogole Desktop est accusé de jouer à Big Brother. Spectre ou réalité? J'aimerais voir les arguments concrets et les dangers avérés que présente ce logiciel.
Toujours est-il qu'il ne me convient pas dans la mesure où l'indexation se fait obligatoirement sur le disque C. Or, ma partition C: est déjà bien remplie. Et je n'ai pas trouvé le moyen de le forcer à forger son index sur un autre disque/partition.

Les aficionados d'Ooo seront-ils donc privés de l'indexation de leurs fichiers? Reste Copernic? Pas d'indexation des Ooo non plus. :(
L'outil signalé par pierre-yves est malheureusement très lent dans la mesure où il ne fonctionne pas sur la base d'un index. Et il ne me trouve aucun "ordinateur" sur ma partition D:. Curieux.
Y. Mairesse
Dernière édition par ymai le Mar 22 Mars, 2005 12:28, édité 1 fois au total.
ymai

Messages : 371
Géo : Brüsel - Les Cités Obscures (BE)

Mar 22 Mars, 2005 10:52

Notons que pour les fichiers Word et textes purs, la recherche basique de Windows XP permet cela...
serged

Avatar de l’utilisateur
Messages : 1300
Géo : Montrouge (92)

Mar 22 Mars, 2005 12:22

Bonjour,
merci à tous ceux qui ont pris la peine de me lire et de me répondre. Je dois avouer que je ne m'attendais pas à ce que ce soit aussi rapide.
- Pierre-Yves: le logiciel en question (FoooX je crois) ne semble effectuer une recherche que dans les fichiers Ooo. Or, dans l'idéal, je cherche quelque chose de similaire à la fonction rechercher de windows -un ou plusieurs mot clé et le logiciel scanne l'ensemble des documents- mais qui n'exclue pas les pdf et Ooo.
Pour une recherche rapide, je pense qu'il est fastidieux de lancer la recherche windows pour les .doc et .txt, ensuite la recherche FoooX pour les documents Ooo et, enfin, la recherche Google Desktop pour mes PDF sur ma partition C:!
- Pernmith: Si Wilbur permet de lancer les scans successivement sur ces trois types de fichiers avec la même interface, c'est un moindre mal par rapport à ce que je viens de décrire. Je m'empresse de le tester et de vérifier si j'ai les mêmes problèmes qu'ymai.
- Serged: Oui, mais ce n'est pas suffisant. Je ne suis pas un ultra d'un logiciel en particulier et je pense qu'une documentation complète comprendra fatalement des documents de toutes extensions. Je travaille sous Ooo et récupére très souvent de la doc sous Word, Pdf ou Txt. Il me faut donc un outil capable d'effectuer une recherche générale.
Matteo

Messages : 7

Mar 22 Mars, 2005 12:53

Tiens nous au courant des résultats...
Pernmith

Messages : 486
Géo : pas loin de Strasbourg

Mer 23 Mars, 2005 17:26

Bonjour à tous,
alors, pour ceux que cela intéresse (Pernmith en l'occurence), voici le résultat des courses avec Wilbur (pas très rapide mais chi va piano va sano e lontano, l'orthographe et la phrase sont approximatifs):

Installation sans problème dans une partition différente de C:\

Pour indexer (et donc scanner par la suite) les fichiers pdf, il faut télécharger le programme pdftotext. Il se trouve à cette adresse:
http://wilbur.redtree.com/pdf_fr.htm
Pour les plus confiants, le lien direct est ici:
http://wilbur.redtree.com/downloads/xpdf-1.00-win32.zip
C'est un fichier zip dans lequel il y a pas mal de fichiers. Le seul intéressant dans ce cas est pdftotext.exe qu'il faut placer dans le répertoire de Wilbur. Je le précise parce que la phrase « Wilbur utilisera automatiquement ce programme (pdftotext.exe) s'il est directement accessible ou placé dans le chemin système de votre machine. » sur le site de l'éditeur m'a laissé un peu perplexe et je n'en étais pas sûr.

Ensuite, le programme correspond tout à fait à ce que je cherchais. Bien paramétré, il est rapide et répond correctement aux requêtes sur les fichiers qui m'intéressaient et peut se limiter à certains dossiers précis.
Je l'ai testé sur des fichiers .pdf (acrobat reader), .txt (bloc-notes Windows), .doc (word), et .sxw (Open office).

Il ne prête pas attention à la casse (maj et min) ni au début ni au sein des mots. Si vous écrivez comme un hacker, une recherche sur « piRatEZ » fonctionnera pour piratez et pour PIRATEZ.
En revanche, les accents sont importants, pensez-y si vous êtes habitué aux recherches google... Par exemple, ne recherche sur le mot « equitation » ne trouvera pas le terme « équitation » mais « Equitation » ne fonctionnera pas non plus.

Pour créer un index, je n'ai pas trouvé la prise en main très intuitive, en tatonnant, voici ce que j'ai compris.
Vous pouvez en créer plusieurs. Ce peut être intéressant pour ne faire une recherche que sur vos documents de travail uniquement ou sur vos doc perso uniquement par exemple.
Pour le créer: menu Fichiers/Nouvel Index (jusque là çà va).
Une fenêtre Propriétés de l'index s'ouvre.
Si vous voulez indexer des fichiers Ooo, allez tout de suite à l'onglet Options et cochez l'option Fichiers Zip comme dossiers.
Ensuite, il faut décider quels fichiers vous souhaitez indexer. Si vous avez beaucoup de données, de fichiers différents etc, il vaut mieux sélectionner (c'est M. Wilbur qui le dit).
Dans ce cas, le plus simple est de retourner dans l'onglet Inclure des fichiers. Vous sélectionnez l'ensemble de la liste (clic sur le premier item, et clic+shift sur le dernier). Vous cliquez sur copier et vous allez le coller dans un éditeur de texte quelconque pour en avoir une sauvegarde. Ensuite, vous cliquez sur Nettoyer, tout s'efface mais ce n'est pas grave, vous venez juste de le sauvegarder.
Maintenant vous rajoutez un à un les types de fichiers qui vous intéressent en faisant ajouter et sous la forme:
*.doc
*.txt
*.pdf
*.xml
Cependant, si vous avez un disque dur ou une partition dédiée à la documentation, vous pouvez préciser au logiciel le chemin de manière à ce qu'il n'indexe pas tout l'ordinateur. Exemple pour un disque K:\ dédié à la doc:
K:\*.doc
K:\*.txt
K:\*.pdf
K:\*.xml
Si c'est sur le bureau:
C:\Documents and Settings\VOTRE COMPTE\Bureau\DOSSIER\*.doc
C:\Documents and Settings\VOTRE COMPTE\Bureau\DOSSIER\*.txt
C:\Documents and Settings\VOTRE COMPTE\Bureau\DOSSIER\*.pdf
C:\Documents and Settings\VOTRE COMPTE\Bureau\DOSSIER\*.xml
etc. etc.

Je n'ai pas eu besoin de cette fonction mais si vous avez des images ou des fichiers sons, vidéos etc qui ne comprennent pas de texte, vous pouvez les indexer mais Wilbur ne recherchera que sur le nom de fichiers. (Peut-être sur les Tags pour les MP3 et autress ogg mais là je vous laisse faire vos propres tests).
Il me semble qu'il est également possible d'indexer les mails mais je ne l'ai pas fait non plus.

Pour les détails sur la recherche, je vous renvoie à la page
http://wilbur.redtree.com/aide/searchdialog.htm
qui liste les opérateurs ET, OU, &, etc qui aident à la recherche (ET ne marche pas c'est pour l'exemple).
Attention, si vous avez créé plusieurs index, Wilbur réinitialise le champ « Changer d'index » de la recherche. Il faut resélectionner l'index désiré. A lire ce n'est pas clair mais si vous faites une recherche vous devriez comprendre tout de suite.
Petite précision: un scan avec AVG free-edition ne trouve rien dans le fichier zip de pdftotext aisni que dans wilbur. Je sais, je suis un peu parano mais bon...
Voilà, c'est tout.
Bon courage, j'espère avoir été clair et gagner le concours du post le plus long.
C'est un jeu pour enfant d'ailleurs celui qui post le plus loin...
Matteo

Messages : 7

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit