On en discutait encore lors du dernier séminaire de la chaire AgroTIC à Bordeaux début décembre, l’analyse d’image assisté par Intelligence Artificielle (IA) nécessite des jeux d’entrainement conséquents pour la machine. Ces jeux d’entrainement sont constitués d’images annotées, c’est à dire de mots-clefs associés aux images. Ainsi, la machine pourra apprendre à reconnaitre des chats, des chaises, des voitures,… et in fine reconnaitre ce que l’on voudra lui faire reconnaitre (Dans le RGB, car les images du corpus sont dans le visible. L’IRSTEA a annoncé travailler sur un corpus d’images dans le Proche Infra-Rouge, mais c’est un autre sujet).
La question maintenant est de réussir à obtenir un corpus suffisamment conséquent pour que l’IA puisse être pertinente. Plus il y aura d’images dans ce corpus, plus l’IA qui se base dessus apprendra, et plus elle sera solide pour reconnaitre ce qu’on lui demande. Donc comment annoter des milliers d’images, sans employer spécifiquement des gens pour passer leurs journées à faire cela ? Une réponse possible a été fournie par Luis Van Ahn. Son idée ? Détourner des activités que beaucoup de gens font à d’autres fins (certains anglicisant diront vite « hacker »). En utilisant des jeux, il va mettre des internautes à contribution pour annoter des images.
Ce qui est interessant, c’est l’utilisation de la « foule » d’utilisateurs d’internet pour arriver à ses fins. La vidéo qui suit est issue d’une chaine YouTube qui s’appelle Fouloscopie et qui étudie le comportement des foules et les impacts de ces recherches sur la société. La vidéo explique plus en détail ce qui est dans cet article et parle aussi de jeux qui ont beaucoup fait parler d’eux (Foldit, mais aussi EVE Online). Je vous recommande aussi les vidéos sur comment une foule a failli battre Kasparov aux échecs et pourquoi une foule chante toujours bien, c’est assez édifiant !
Bon visionnage !