Identification photographique individuelle des hippocampes
Mathias Aloui a fait un stage de 6 mois chez Natural Solutions sur l’identification photographique individuelle des hippocampes basée sur l'intelligence artificielle. Interview avec un jeune homme brillant et passionné.
Quel est ton parcours ?
J’ai fait une licence de mathématique et d’informatique à Saint Charles à Marseille et ensuite un master en informatique avec en deuxième année la spécialisation en intelligence artificielle et apprentissage automatique. Dans le cadre de cette spécialisation, j’ai fait un stage de 6 mois chez Natural Solutions.
Quel est le sujet et le contexte de ton stage chez Natural Solutions ?
L’association Peau Bleue étudie la lignée d'hippocampes à long museau de l'étang de Thau ou hippocampe moucheté. Afin de mieux connaître cette espèce et de mieux la protéger, un recensement complet est nécessaire.
Les plongeurs depuis 2020 font de la ré-identification, c’est à dire qu’à chaque fois qu’ils plongent, ils prennent des photos des profils des hippocampes. Le mouchetage sur le corps et sur la tête des hippocampes, créé des petits patterns, des petites formes ce qui permet de les ré-identifier. L’objectif est de savoir combien d’individus sont présents dans l’étang et de voir quelle est l’évolution de la population et quel est le taux de re-rencontres ou de nouvelles rencontres.
Les hippocampes mouchetés sont tous différents, au niveau de la couleur, de la crête, mais ce qui est spécifique pour chaque hippocampe c’est le mouchetage, ce sont les points blancs qu’ils ont sur le visage.
L'identification "manuelle" sur photographie est longue et difficile pour les scientifiques. L’idée est de passer d'une identification individuelle visuelle, chronophage, à un processus entièrement automatisé basé sur l'Intelligence Artificielle (IA)
Mon stage consiste donc à créer un modèle qui est capable à partir de deux images de dire si il s’agit des mêmes individus ou d’un nouvel individu.
Quand tu parles de créer un modèle de quoi s’agit-il ?
C’est un modèle de machine learning, c’est du deep learning ou apprentissage profond. La machine est capable d'apprendre par elle-même, contrairement à la programmation où elle se contente d'exécuter à la lettre des règles prédéterminées. La ré-identification des animaux à l'aide du deep learning est nouvelle et devient de plus en plus populaire. Des études récentes ont montré que les réseaux de neurones convolutifs (CNN) entraînés avec une perte de triplet sont capables d'identifier avec précision les individus de nombreuses espèces. Dans cette étude, l’idée est de prouver que cette méthode peut aussi fonctionner sur une espèce difficile, car aquatique et experte en camouflage, l'hippocampe à long museau.
Et en décrypté ça donne quoi ?
C’est un réseau de neurones inspiré du cortex visuel humain, spécialisé pour l’analyse d’images. Ce sont les réseaux que l’on utilise tout le temps pour l’analyse d’images. Le principe de ces réseaux c’est qu’ils vont regarder l’image segment par segment comme l’Être humain. L’idée c’est de trouver des informations spécifiques pour chaque image, ce qu’on appelle des « features » qui vont nous donner en quelque sorte un code barre pour chaque image. Ce code barre pourra alors être comparé avec une autre image pour savoir si il s’agit du même individu ou pas.
Comment as tu procédé pour parvenir à créer ce modèle d’identification automatique des hippocampes mouchetés ?
Je suis d’abord parti de la base de données existante, et la première étape a consisté à faire un tri. la base de données d'images d'hippocampes comprend des milliers de photos de centaines d'individus. Après avoir sélectionné uniquement les photos où la tête de l'hippocampe est visible, il nous restait 14 638 photos représentant 342 individus, tous identifiés avec un haut niveau de confiance par la même personne.
Une fois le tri effectué, Il s’agit de recadrer les photos pour s'assurer que la plupart des images affiche la tête et la partie supérieure du corps, et un minimum de l'environnement environnant.
Et enfin…. Voilà la partie intéressante du stage…
Une fois que j’ai effectué ce tri et ce recadrage j’ai créé un modèle qui analyse toutes les images de tous les individus que l’on a actuellement. Il va essayer d’apprendre à trouver les différences entre les images selon cette méthode d’apprentissage :
On part de trois images, une appelée l’ancre, ça va être l’individu A et deux autres images, une image positive et une image négative.
L’image positive ça va être le même individu donc l’individu A, mais une autre image de cet individu.
L’image négative, ça va être un autre individu, individu B. Le principe c’est que le modèle va essayer de faire en sorte d’analyser l’image de créer une sorte de code barre, on appelle ça un embeding.
Le code barre produit à la fin entre l’ancre et le positif doit être le plus proche possible. Alors on peut dire qu’il s’agit du même individu. À l’inverse le code barre entre l’ancre et le négatif doit être le plus éloigné possible si ce n’est pas le même individu. Et ensuite on fait ça sur toutes les images de la base de données, à la fin on a un modèle, lorsqu’on lui donne une image, il va nous faire un code barre que l’on peut comparer avec le code barre des images de la base de données qui ont déjà été traitées.
As tu obtenu des résultats ?
Oui, j’ai une première démo qui va permettre aux scientifiques de tester le modèle sur leur base de données. C’est bien entendu perfectible mais c’est une première phase. Mon stage touche à sa fin, et l’étude menée sur l’identification photographique individuelle des espèces basée sur l’intelligence artificielle est concluante.
Quelle est la suite pour toi ?
Du repos… Des vacances ! Une publication scientifique avec Natural Solutions et le Centre d’écologie fonctionnelle et évolutive à Montpellier qui m’a apporté le cadre scientifique pour cette étude. Et puis en janvier un poste de salarié chez Natural Solutions pour développer des projets autour de l’intelligence artificielle dans l’identification des espèces.
Le mot de la fin pour Natural Solutions ?
Le stage que Mathias a réalisé est intéressant et innovant. Les applications de l’identification photographique individuelle des espèces basée sur l’intelligence artificielle sont très porteuses et prometteuses dans le domaine de la préservation et de la conservation des espèces. La méthode « capture-marquage-recapture » ou « CMR1 » désigne une méthode statistique couramment utilisée en écologie pour estimer la taille d’une population animale. En s’appuyant sur l’intelligence artificielle et le deep learning, le recensement d’une population donnée devient non invasif. Une avancée majeure dans le domaine !
Lire le rapport de stage Mathias Aloui Individual photo-identification of seahorses based on artificial intelligence
VOUS AVEZ UN PROJET ET VOUS PENSEZ QUE LE DEEP LEARNING PEUT AMÉLIORER VOS RÉSULTATS ? CONTACTEZ-NOUS !