Travaillant dans une imprimerie, je reçois tous les jours des commandes de calendriers avec des logos fournis par les clients en jpeg à 72 dpi alors qu'il les faudrait en vectoriel (ai, pdf ou eps, ou à la rigueur svg ou cdr) pour imprimer en Pantone ou plus rarement en quadri. Pourtant les graphistes qui leur ont créé leur logo ont dû leur fournir à coup sûr leur logo en ai ou en eps accompagné d'une vignette de prévisualisation en jpeg mais quand le responsable dans la société cliente n'y connaissant rien reçoit ça (par mail ou sur cd), il ne peut visualiser sur son pc windows que la vignette jpeg, en conclut que les ai ou eps sont des déchets du genre comme les fichiers thumbs qu'on trouve toujours partout dans les dossiers d'images et envoie la vignette à l'imprimerie. Dans d'autres cas, il envoient des logos jpeg ou png voire gif qu'ils ont simplement copiés sur le site web de leur société, le fait qu'un logo de 200x100 pixels par exemple ne convient pas à un imprimeur leur passant totalement au-dessus.
Donc pour éviter de contrarier le client j'essaie souvent de dégoter son logo en vectoriel sur le site web de sa société. Si le format svg avait été assez popularisé pour qu'on trouve le logo en svg au lieu de jpeg sur la page d'accueil, ça serait l'amérique (le seul petit défaut de ce format étant que c'est en RVB), seulement c'est un format assez rare sur les pages web. Sans ça si le logo a été incorporé en vectoriel dans une animation flash j'arrive aussi à le récupérer ouvrant l'animation .swf (et non la page html ou elle est incorporée) dans firefox et en imprimant vers un serveur d'impression qui crée des pdf. Mais le plus souvent mon seul espoir de trouver le logo vectoriel est qu'il apparaisse dans les fiches techniques, brochures et autres catalogues pdf à télécharger (s'ils ont été créés par un studio graphique compétent et pas par une secrétaire dans word ou excel). Mais ouvrir un par un tous les pdf depuis les innombrables pages jusqu'à en trouver un valable ou m'apercevoir qu'il n'y en a aucun d'utilisable prend trop longtemps.
J'ai donc fait pour gagner du temps des essais au travail sur Mac Os 10.5 et chez moi sur Ubuntu 9.04 pour aspirer tout les pdf d'un site avec wget et l'option -A mais ça marche pas trop
exemple de commande qui a marché
wget -r -l16 -A.pdf -e robots=off
http://www.henkel.fr/
arrêté au bout de 4 h 1/2, récupéré 149 pdf (287.1 Mio) et rien d'autre (à part des dossiers vides)
mếme commande avec juste un autre site, marche pas
wget -r -l16 -A.pdf -e robots=off
http://www.cga13.fr/
va savoir pourquoi, aucun pdf récupéré alors qu'il y en a 24 dans le répertoire
http://www.cga13.fr/images/upload/upl/ comme on peut le constater si on aspire tout le site en supprimant "-A.pdf"
marche pas non plus
wget -r -l16 -A.pdf -e robots=off
http://www2.hima.com/
aucun pdf récupéré alors qu'il y en a dans les sous répertoires "Actualites", "Contact" et "Meta", qu'on trouve si on aspire tout le site