Les One-Stage Detector en élevage : YOLO !

Big Data agricole : quid de la protection des données des agriculteurs ?
février 22, 2022
Ré imaginer nos interactions avec le monde numérique
février 23, 2022
Show all

Les One-Stage Detector en élevage : YOLO !

Cela ne vous a sûrement pas échappé, depuis quelques années le Deep Learning est partout autour de nous, porté par sa grande polyvalence et la variété des solutions qu’il propose. Cette sous-catégorie de l’intelligence artificielle excelle aussi bien dans le tri des profils de sites de rencontre que dans la prédiction du repliement des protéines. Sa récente utilisation dans le cadre agricole n’est ainsi pas surprise, d’autant plus que la quantité des données récoltées, qui est un critère indispensable à la création de ces algorithmes, ne cesse de croître au sein de nos exploitations. Parmi tous les champs du Deep Learning existants, nous allons ici nous intéresser au traitement et à la reconnaissance d’images.

L’usage courant du Deep Learning en agriculture, et dans bien d’autres domaines, consiste généralement à mobiliser des architectures algorithmiques entraînées par les géants du numérique (Google, Facebook, etc.) et qui ont déjà prouvé leur efficacité. Ces architectures sont constituées de neurones artificiels qui, en simplifiant, sont des fonctions mathématiques prenant un certain nombre de valeurs numériques en entrées et donnant le résultat d’une somme pondérée de ces nombres en sortie. Dans le cadre du traitement d’image, celles-ci sont stockées sous la forme de tableau de données où chaque pixel peut par exemple être codé par trois valeurs : une pour le rouge, une pour le bleu et une pour le vert ; c’est le code RGB. Ce sont ces nombres qui seront donnés en entrée à l’algorithme de Deep Learning.

Une fois récupérées à partir de base de données libres, ces architectures algorithmiques pré-entraînées (appelées modèles) sont plus ou moins modifiées et adaptées à chaque problème en modifiant quelques parties, c’est ce qu’on appelle le fine-tuning ou transfer learning.

Pour résoudre un problème de détection d’objets dans une image, il faut s’attaquer à deux tâches : trouver un nombre arbitraire d’objets dans l’image qui pourraient être dignes d’intérêt et les classer dans différentes catégories en estimant leur taille. Parmi les modèles les plus utilisés en reconnaissance d’image, il existe deux grandes familles : les “Two-stages detectors” et les “One-stage detectors”.

Les premiers sont des modèles comprenant deux parties. La première partie sert à l’extraction de zones d’intérêts. Par zones d’intérêt il faut comprendre des parties de l’image se détachant du fond, des éléments présentant un motif particulier ou une forme précise etc. Au début de l’analyse d’image par Deep Learning, cette extraction était réalisée par un algorithme appelé “Selective Search” qui n’était pas un algorithme de Deep Learning. Désormais cette tâche est accomplie par un réseau de neurones à part entière. La deuxième partie du modèle est un autre réseau entraîné pour classer les propositions émises par la première, c’est-à-dire leur attribuer un label de classe, par exemple “voiture”, “chien”, ”humain” ou encore ”pot de fleur”. Le label “pas d’objet” peut également leur être attribué après cette classification.

Ensuite, les réseaux appelés “One-stage detectors” sont constitués d’une seule partie. Au lieu de chercher des zones d’intérêt, le réseau divise directement l’image en N cellules avec pour chacune un certain nombre de propositions qui seront spatialement pré-établis. A chacune de ces propositions est ensuite, encore une fois, attribué un label de classe ou la mention “pas d’objet”. Cette démarche est ainsi un compromis entre la rapidité qui est grandement accrue et la précision des prédictions qui est moindre par rapport aux “Two-stages detectors”. La vitesse de prédiction est alors bien plus grande et permet une détection d’objets en temps réel dans des vidéos, ce qui n’était pas envisageable avec les réseaux précédents, et c’est précisément là que se trouve l’intérêt pour nos exploitations agricoles, notamment en élevage.

Les volumes conséquents de données récoltés de nos jours ouvrent de nombreuses portes quant à une gestion assistée des élevages. Cependant cela nécessite des méthodes capables de les traiter, parfois en temps réel. Dans un article publié dans ScienceDirect intitulé A computer vision approach based on deep learning for the detection of dairy cows in free stall barn, des chercheurs de l’université de Bologne en Italie ont mis au point un algorithme de détection de vaches dans une étable à stalles. Les résultats encourageants de l’étude prouvent qu’un tracking des animaux est possible de même que l’identification des individus. L’intelligence artificielle est plus précisément capable de faire une distinction claire entre les vaches, les veaux et les taureaux comme l’ont montré les chercheurs de l’université d’Istanbul dans l’article Detection and Breed Classification of Cattle Using YOLO v4 Algorithm. De la même manière, l’institut américain AIFARMS (Artificial Intelligence for Future Agricultural Resilience, Management, and Sustainability) a mis à disposition le réseau de neurones “Multi Camera Pig Tracking” offrant un système de tracking de porcs avec un réseau de caméras interconnectés.

Ces programmes apportent ainsi une solution à la principale barrière à l’utilisation du Deep Learning en élevage : les animaux au contraire des plantent bougent dans leur espace et ne renvoient pas toujours la même image à la caméra. Tous seuls, ces outils ne résolvent pas de problème concrètement mais il faut imaginer ces systèmes de tracking couplés à d’autres réseaux d’intelligence artificielle. Les recherches menées par des chercheurs coréens dans A deep learning-based approach for feeding behavior recognition of weanling pigs montrent que l’entraînement des derniers modèles YOLO qui sont les réseaux One-stage detectors les plus répandus (YOLO pour You Only Look Once, car le réseau passe en revue les divisions de l’image une seule fois chacune) rend possible l’identification de comportements animaux comme le fait de se nourrir et de boire. Cette détection permet l’estimation du budget temps des bêtes, c’est-à-dire la répartition de leurs activités sur 24h. De cette manière un logiciel informatique pourrait être capable de détecter des anomalies dans les comportements.

L’extraction de ces caractéristiques pourrait être d’une grande aide aux éleveurs en facilitant leur travail (réduction du temps d’attention à accorder à l’élevage, estimation des quantités de nourriture consommée et restante, etc.). De plus, elle apporte une solution à l’enjeux du bien-être animal en délivrant une surveillance précise et continue d’indicateurs. L’article YOLOv3 deep learning and solid-state LiDAR for teats detection nous apprend que des chercheurs chinois ont réussi à atteindre une précision impressionnante de 94.9% dans la détection de pis de vaches. Il n’est alors pas difficile d’imaginer que ce type d’outils puisse ensuite être couplé à une surveillance des maladies sur ces mêmes pis. Cela bénéficierait ainsi à la santé des animaux du troupeau et à la santé des consommateurs par extension.


Le Deep Learning brille par la polyvalence de ses réalisations et certains de ces outils comme les One-stage detectors sont particulièrement adaptés à une utilisation agricole. Dans des environnements compliqués, apportant saleté et poussière et avec des caméras low cost, ils offrent une efficacité importante et des solutions soulageant le travail de l’agriculteur. Il serait cependant illusoire de penser qu’ils apportent une solution à tous les problèmes et il est ainsi intéressant de noter que si ces outils sont particulièrement adaptés à des élevages intensifs dans lesquels les animaux sont regroupés dans un lieu fixe, ils le sont moins et nécessitent une réflexion autour de dispositifs plus complexes pour des conduites extensives.

Sources

P. Tassinari
A computer vision approach based on deep learning for the detection of dairy cows in free stall barn.
Computers and Electronics in Agriculture, Volume 182 (2021).

M. Kim
A deep learning-based approach for feeding behavior recognition of weanling pigs.
Journal of Animal Science and Technology (2021).

A. Yilmaz
Detection and Breed Classification of Cattle Using YOLO v4 Algorithm.
IEEE Xplore (2021).

Y. Hu
YOLOv3 deep learning and solid-state LIDAR for teats detection.
IEEE Xplore (2021).

A. Shirke
Tracking Grow-Finishin Pigs Across Large Pens Using Multiple Cameras.
Cornell University (2021).