dimanche 29 janvier 2006

Générez les fils RSS de vos sites préférés même s'ils n'en proposent pas

Je suis en train de tester le service de Feed43.com permettant de créer un flux de syndication RSS vers un site quand bien même ce dernier n'en proposerait pas. C'est par exemple le cas des news insolites de Yahoo, et c'est l'occasion pour moi de cesser mes lamentations à ce sujet ;)

Prérequis

  • Il faut obtenir une invitation pour utiliser ce service [1],
  • L'utilisation du service nécessite de connaître un minimum le langage HTML.

Mise en oeuvre

D'abord, entrez l'URL de la page dont vous voulez générer un fil RSS depuis les contenus. Dans notre cas, nous entrons http://fr.news.yahoo.com/125/. Vous pouvez spécifier l'encodage de la page. Pour le connaître, sous Firefox récupérez la valeur sélectionnée dans le menu Affichage > Encodage des caractères ou en faisant un bête <Ctrl> + i.

Une zone contenant le code HTML de la page apparait - au passage, vous noterez la magnificience du code HTML généré chez Yahoo. Nous allons devoir trouver les délimiteurs de la zone interessante dans ce code [2]. Pour la page de news Yahoo, on constate que ce qui nous interesse est compris au sein des morceaux de code suivants (Global Search Pattern) :

<table border=0 width=100% cellpadding=0 cellspacing=0><tr><td valign=top>
{%}
<table border=0 cellpadding=2 cellspacing=0><tr><td>&nbsp;</td><td>&nbsp;</td></tr>

... où la chaîne {%} indique à Feed43 que notre section ce trouve à cet endroit, et la chaîne {*} est un champs passe-partout (wildcard).

Au sein du bloc émanant de cette délimitation, les itérations de dépêches (Item search pattern) sont de cette forme :

<a href="{%}" style="text-decoration:none">{%}</a>{*}</small>{*}<br>{%}</font>

Un clic sur le bouton Extract nous trouve les 5 items principaux. Ça tombe bien, c'est ça qu'on voulait.

Item 1

{%1} = http://fr.news.yahoo.com/28012006/202/un-iguane-d-appartement-provoque-une-inondation-en-allemagne.html
{%2} = Un iguane d'appartement provoque une inondation en Allemagne
{%3} = Alors que son maître s'était absenté pour quelques heures, un iguane a provoqué une inondation dans un appartement (...)

Item 2

(etc.)

Il ne reste plus qu'à remplir les champs descriptifs du fil à créer, et notamment quelles exctractions correspondent à quels champs. Dans notre cas, cela donne :

Item Title Template*: {%1}

Item Link Template*: {%2}

Item Content Template*: {%3}

La prévisualisation permet de s'assurer que tout est à sa place.

Ceci fait, il ne reste plus qu'à ajouter l'URL du fil RSS généré à notre agrégateur favori. C'est tout :)

Notes

[1] Personnellement, j'ai reçu mon invitation une heure après en avoir fait la demande via le formulaire.

[2] Si comme moi vous trouvez que le textarea n'est pas propice à la recherche de ces motifs, un bon vieux <CTRL> + U des familles fera amplement l'affaire.

samedi 5 novembre 2005

Les errances de Liferea

Liferea est un agrégateur sous licence GPL très courant. La version 1.0RC3 vient de sortir et corrige entre autres un bug extrêment gênant : celui de la redirection infinie lors d'un parsing de favicon.

Le bug consiste en un parsing récursif et continu des liens du type <link rel="icon" type="image/png" href="/path/to/favicon.png" /> afin de découvrir automatiquement les liens vers des flux de syndication, avec pour conséquence l'établissement d'une connexion permanente sur le port 80 vers le serveur hébergeant l'innocent site possédant ce type de balise... dont le mien, encore il y a peu.

C'est Arnaud de Typhon - mon hébergeur - qui, après moult investigations à grands coups de grep dans les logs apache, a pu établir clairement la responsabilité de Liferea [1] dans cette sale affaire [2].

Je me suis empressé de signaler ce très vilain bug à l'équipe de développement, et je salue ici leur réactivité :)

Néanmoins, par sécurité et par compassion pour votre hébergeur, je vous invite à effectuer les démarches suivantes :

  • Mettre à jour votre version de Liferea,
  • Retirer les balises du type <link rel="icon" /> de votre site, sachant que la plupart des navigateurs recherchent par défaut la présence d'un fichier favicon.ico à la racine de votre docroot apache.

Mise à jour du 20 novembre 2005

Je pense que ce post résume assez bien la situation. N'hésitez plus à mettre à jour votre version de Liferea ! [Via Arnaud de Typhon]

Notes

[1] Toutes les version sont concernées sauf la dernière, y compris celle du paquet officiel d'Ubuntu, la 0.9.7b.

[2] <troll>Je ne sais pas si 1 and 1 aurait pris le temps d'effectuer cette démarche et ne m'aurais pas radié sans préavis.</troll>

vendredi 4 novembre 2005

Simple is beautiful

[Via Fred Cavazza]

La mode est au minimalisme : j'adore :D

Ben quoi ?

  • c'est valide,
  • c'est accessible (le alt est renseigné),
  • c'est léger,
  • ça incite à utiliser les flux XML

... et en plus y'a des billets bien marrants dedans. Les designers/intégrateurs bientôt au chômage ? :dent:

samedi 29 octobre 2005

Message à caractère informatif

Je viens de supprimer 72 fils RSS de mon agrégateur.

Je passe ainsi de 214 à 142 blogs bookmarkés, ce qui est encore beaucoup trop à mon goût. Pensez donc, ce matin encore, plus de 1000 éléments non-lus m'attendaient... J'avais presque renoncé à le lancer, ces derniers temps.

Je ne garde donc plus que PC-Inpact et ZDnet pour l'actu généraliste informatique, le reste étant réparti entre de la veille autour de mon coeur de métier et les blogs de gens avec lesquels j'ai des affinités.

En effet, je ne tiens plus à passer à côté de petites merveilles comme l'ouverture du blog d'Esther (sparing-partner de Mitt), dont le premier billet m'a fait mourir de rire, et dont le coup de crayon mérite vraiment le détour. Bienvenue à elle dans la cacosphère blogophonie :D

C'est incroyable comme ce vieil adage reste vrai : Trop d'information tue l'information.

Fin du message à caractère informatif et accessoirement inintéressant :)

dimanche 9 octobre 2005

Google Reader

Google Reader C'est en beta, c'est buggué (chez moi), c'est très lent, uniquement en anglais, mais c'est terriblement prometteur... Google Reader :

  • Agrégateur en ligne,
  • Import de fichiers OPML,
  • Tagging des feeds et des items,
  • Flagging des items,
  • Intégration de GMail et de Blogger,
  • Navigation au clavier,
  • AJAX à donf (ça brille, donc),
  • Moteur intégré performant (Google, quoi)...

Nécessite un compte GMail pour l'utiliser (invitations par là).