Ayant installé un intranet sous Spip, et bien que satisfait de son petit moteur de recherche, je veux créer un métamoteur, afin notamment d'indexer les PDF, DOC, XLS, RTF, etc... que Spip n'indexe pas (encore), et d'autres partie de l'intranet.
Je me suis donc tourné vers PHPDig puisque je fonctionne avec une machine :
- Windows 2000 Serveur
- IIS 5.0
- PHP 5.05
- MySQL 4.0.26-nt
- PHPDig 1.8.8
- pdftotext.exe
PHPDig fonctionne bien avec les fichiers html. Il fait correctement son office de Spider.
PHPDig trouve bien les fichiers PDF (l'indexation voit les fichiers) mais ne les analyse pas.
Voici un bout (celui qui nous intéresse) de mon fichier de config :
- Code: Tout sélectionner
define('PHPDIG_INDEX_PDF',true);
define('PHPDIG_PARSE_PDF','C:\\Intranet\\wwroot\\cgi-bin\\pdftotext');
define('PHPDIG_OPTION_PDF','');
Comme le forum de PHPDig est payant... et que mon administration ne peut pas payer sur Paypal

Et que ça fait quelques jours que je m'arrache le peu de cheveux qui me reste...
Avez-vous une expérience dans le domaine ?
Cordialement
Jean CARTIER
-
janolap1
- Messages : 348
- Géo : Bourges