mercredi 19 octobre 2011

Saviez-vous que Google utilise les internautes à leur insu pour numériser des livres?


Il est toujours très agaçant d'apprendre qu'on nous manipule, pourtant hier, j'ai découvert totalement par hasard que Google abusait de moi et je ne leur en veux pas... La fascination + l'assouvissement d'une curiosité inconsciente l'ont emporté sur  le sentiment irritant qu'on s'était servi de moi.

Mais rassurez-vous, je ne suis pas le seul manipulé... des millions d'internautes participent également à leur insu à la mission pharaonique de numérisation du patrimoine culturel initié par Google.
Si si je vous le promets, même vous, vous travaillez pour Google sans le savoir et sans la moindre rémunération.

En fait pour vous aider à comprendre, Google a, en 2009, racheté reCaptcha, une société spécialisée dans le Captcha, ces petits dispositifs visant à vérifier que ce n'est pas un ordinateur qui essaye de s'inscrire à un site Internet ou de poster des spams sur les forums : une image affiche 2 mots qu'il faut retranscrire, le 1er sert effectivement à valider que ce n'est pas une intelligence artificielle, tandis que le 2e est un test de Google pour nous faire identifier des mots que ses logiciels de reconnaissance de texte (OCR) ne sont pas parvenus à identifier.

Quand un nombre de personnes déterminant retranscrit le mot-image de manière identique, le mot est validé et intégrer aux bases de données des logiciels OCR Google.

Ainsi à chaque fois que nous nous escrimons à déchiffrer ce 2e mot, nous travaillons à l'oeil pour Google.
Il ne reste plus qu'à mettre à profit les transcriptions des captchas audio pour faire faire un grand bon à la qualité des logiciels de reconnaissance vocale...
Étonnant, n'est ce pas?
Related Posts Plugin for WordPress, Blogger...