Je suis tombé il y a quelques jours sur ce site, qui propose des feeds RSS non officiels pour divers sites, avec le code source Perl qui va avec.

J’ai eu l’idée de prendre un de ces script afin de le réutiliser à mon compte, et de pouvoir lire les news de sites « orphelins du RSS » dans mon aggrégateur, après avoir réalisé quelques modifications afin que les sites soient appelables via une interface CGI en utilisant un cache. J’y ai aussi rajouté les extentions permettant de visualiser directement la news entière dans le fichier XML (ben oui, c’est plus convivial puisque la news s’affiche entière dans
bloglines). Et rendu les scripts valides pour le
validateur de feeds.
Le code source reste cependant simple à comprendre, et facile à modifier ; monitorer un nouveau site ne doit pas prendre plus de 10 minutes avec cette base pour qui connait Perl et les expressions régulières. Bien évidemment, si un de ces sites venait a changer sa disposition, ce script arrêtera de fonctionner ; la solution étant bien entendu que les propriétaires des sites concernés réagissent et proposent un feed officiel. Ce n’est donc qu’une rustine en attendant.
Dans cette attente, je vous propose d’utiliser les feeds que j’ai créé vous aussi, ou d’en télécharger le code source, pour éventuellement créer à votre tour d’autre feeds, ou les améliorer pour faire un moteur générique de création de feed (ca doit pas être trop compliqué), ou une base plus propre.
Updates 24 janvier 2004
Geek’s World propose maintenant 2 fichiers officiels, le premier dans l’esprit de ce que j’ai fait (c’est un peu inspiré de chez moi), un second qui propose en plus les commentaires dans le feed.
Guillermito a mise à jour son blog avec des photos des chutes de neiges sur Boston. Impressionnant ! Seulement au passage, cela a détruit le feed, j’ai donc un peu réécrit l’expression régulière au coeur du fonctionnement du script, la rendant un peu plus tolérante.