Xobni et reCaptcha

Vous connaissez les captchas? Mais si vous savez, ces sortes de signes (parfois) indéchiffrables que l’on nous assène lors d’une inscription à un site ou lorsque l’on poste un commentaire sur un blog pour prouver que l’on n’est pas un robot mais bien un humain.

Il peut se composer de plusieurs façons : un calcul, un question simple ou recopier des mots écrits bizarrement. Ce dernier étant le plus fréquemment utilisé.

Hier, en installant une mise à jour de Xobni (tiens il faut que je vous en parle de celui-là d’ailleurs !), je me suis trouvé face à un captcha d’un nouveau type : celui-ci comportait une explication m’expliquant que mon travail n’était pas inutile, en effet, le mot que je recopiai était tiré d’un vieux livre scanné et que le fait de le recopié était utile pour sa numérisation. Une sorte de reconnaissance optique de carractère humaine !

Xobni

Fort de ce constat je me suis un peu renseigné (quand même) sur ce principe…

Alors il s’agit d’un projet de la Carnegie Mellon University qui vise à récupérer les mots mal interpréter par les logiciels de reconnaissances de caractères et de les diffuser dans ces fameux captchas pour permettre aux internautes -60 millions de captchas sont validés chaque jour selon le site- de leurs donner une valeur numérique. Actuellement ce projet aide à numériser les archives du New York Times et de l’Internet Archive.

Je vous vois venir : si le mot n’est pas reconnu par l’ordinateur comment sait-il que nous rentrons le bon mot dans le captcha ? Et bien en fait il s’agit d’un couple de deux mots qui est proposé à l’internaute à chaque passe : un mot connu par l’ordinateur et un illisible, si le mot connu est correct alors le système interprète l’autre comme étant également correctement rentré par l’internaute. Ce mot inconnu est également proposé à des dizaines d’autres personnes et un indice de confiance en ressort pour sortir la solution et valider le mot.

Judicieux non ? Bon, si le mot inconnu est illisible on ne le rentre pas, comme sur mon premier exemple, charge à l’équipe de projet de s’en occuper…

D’ailleurs maintenant je l’ai installé sur mon blog, comme ça j’évite les spams qui arrivent de plus en plus souvent et je fais une bonne action 🙂

[source : Toile-filante]

shigaepouyen

Aventurier à l'Opinel, mono-maniaque à temps partiel, chef de projet mobile le reste du temps.

Vous aimerez aussi...

1 réponse

  1. 05/03/2010

    […] des listes de liens vers leurs sites. C’est la raison pour laquelle on utilise un CAPTCHA pour filtrer les commentaires : les bots ne sont pas capables de reconnaître le texte contenu dans […]