Dynafor, Université de Toulouse, INRA, INPT, INPT-EI PURPAN, 31326 Castanet Tolosan,
Mistis, Inria Grenoble Rhône-Alpes, LJK, 38334 Montbonnot, France
Modal, Inria Lille Nord Europe, LPP UMR-8524, Université Lille, 59655 Villeneuve d’Ascq, France
Cette thèse en s’intéresse à la statistique fonctionnelle pour la cartographie des écosystèmes. Pour cela, nous allons développer des méthodes d’analyses permettant à la fois de s’affranchir de l’étape de recalage temporel et de manipuler de grands volumes de données.
Le point de départ de ce travail est la définition d’une méthode d’analyse permettant de classifier un pixel quels que soient les instants d’échantillonnage temporel. Nous allons considérer que les échantillons, conditionnellement aux classes, sont distribués selon des processus Gaussiens.
De plus, nous relâcherons l’hypothèse d’échantillonnage temporel irrégulier en supposant simplement que chaque pixel xi est observé Ti fois durant l’année (ou plus généralement durant la période d’analyse), Ti dépendant donc de la localisation géographique, de l’orbite du satellite, des nuages et ombres observés pour xi.
Le coeur des travaux de thèse s’attachera à spécifier les méthodes et les outils pour apprendre les paramètres des processus Gaussiens. En particulier, lors de la création du processus Gaussien, des bases fonctionnelles temporelles vont être définies. Elles devront pendre en compte à la fois l’évolution temporelle (corrélation forte des mesures entre deux instants proches et faible lorsque les instants sont éloignés) et la réponse spectrale à un instant donné (corrélation inter-bandes).
Cette étape est importante car l’utilisation d’une base adaptée permet à la fois de s’affranchir du bruit et des données manquantes tout en capturant l’information utile à l’analyse. Précisons toutefois qu’il n’est pas envisagé ici de lisser/projeter les pixels sur cette base, mais d’exprimer la fonction de décision à partir de cette représentation spectro-temporelle de manière à pouvoir l’appliquer sur n’importe quel échantillonnage temporel.
Pour traiter les flux massifs d’images, des algorithmes d’optimisation efficaces utilisant des approches HPC (high performance computing) devront être définis. A cet effet, nous allons nous appuyer sur certaines propriétés intéressantes de l’algorithme d’apprentissage des paramètres des processus Gaussiens :
Dans un premier temps, seulement la classification supervisée sera considérée. Une fois les différents objectifs pré-cités remplis, les modèles construits serviront de support pour la définition d’une version non-supervisée de l’algorithme, et à plus long terme, d’une version pour l’estimation de variables (indices de biodiversité …).
Pour candidater, prendre contact avec les co-encadrants par courriel (joindre un CV détaillé) :
— mathieu.fauvel@ensat.fr
— stephane.girard@inria.fr
— serge.iovleff@inria.fr
Les candidatures sont ouvertes jusqu’à mi-Mars 2018.