Comment définir la taille optimale d’une grille pour cartographier les données spatiales à haute résolution ?

Offre d’emploi – IFCE – Chargé d’études statistiques et bases de données
avril 16, 2018
API-AGRO recherche un Ingénieur Technico-Commercial en CDI
avril 19, 2018
Show all

Comment définir la taille optimale d’une grille pour cartographier les données spatiales à haute résolution ?

Les données à haute résolution spatiales acquises avec des systèmes de mesure embarqués (capteurs de rendement, Physiocap, Greenseeker, etc.) sont généralement des données bruitées. Ce bruit a des origines multiples : capteur, conditions d’acquisition, variabilité intra-plante, variabilité inter-plantes, etc.). Il en résulte que la représentation de ce type de données sous forme de cartes n’est pas triviale si l’on souhaite mettre en évidence les grands motifs spatiaux. Pour résoudre ce problème, une approche simple (assez classique mais brutale) consiste à faire une moyenne glissante ou à introduire des opérations de lissage lors de l’interpolation spatiale des données. Toutefois, ces opérations ne sont pas sans conséquence sur le résultat final. En effet, elles supposent d’appliquer un filtre sur un certain nombre de données spatiales ce qui revient à appliquer un filtre sur une surface élémentaire. Pour le praticien, l’application de ces opérations entraîne nécessairement l’arbitrage d’un compromis puisque plus la surface de lissage est importante, plus on élimine de bruit, plus on à l’impression d’améliorer les données, mais plus on risque d’atténuer la variabilité spatialisée qui correspond au phénomène que l’on cherche à cartographier. Le mauvais choix d’une surface élémentaire de lissage peut donc affecter la carte finale et les décisions qui en résultent. Aussi étrange que cela puisse paraître, ce problème a très peu été traité dans la littérature scientifique, si bien que la surface élémentaire de filtrage était jusqu’à présent toujours définie en fonction de contraintes opérationnelles plus ou moins objectives.
Des chercheurs Français de Montpellier SupAgro, d’Irstea  et des entreprises SMAG et Pellenc viennent de publier un article scientifique pour apporter une réponse à cette question. Ces chercheurs ont proposé un cadre formel, basé sur les géostatistiques, pour modéliser la manière dont évoluait le bruit de mesure (variance erratique) et le signal (variance organisée spatialement) en fonction de la surface de lissage considérée. Sur le base de ce modèle, les auteurs ont proposé une fonction destinée à trouver la surface élémentaire de lissage optimale qui permet d’éliminer le maximum de bruit tout en préservant le signal (phénomène à cartographier). Cette approche est intéressante puisqu’elle permet aux géomaticiens de proposer une grille de lissage des données optimale en se basant sur une analyse rigoureuse et objective. Cette approche peut s’avérer utile pour la cartographie de données particulièrement bruitées.
Références :  Tisseyre, B., Leroux, C., Pichon, L., Geraudie, V., & Sari, T. (2018). How to define the optimal grid size to map high resolution spatial data?. Precision Agriculture, 1-15.
The development and the release of sensors capable of providing data with high spatial resolution (> 4 000 points ha−1) in agriculture raises new questions as to how to represent this spatial information. The objective of this study was to propose a methodology to help define the optimal grid size to map high resolution data in agriculture. The geostatistical method finds the grid size which maximizes the sum of two components: (i) the proportion of nugget variance that is removed, and (ii) the proportion of sill variance that remains in the data. The optimum grid size was found to be dependent on the resolution of the available information and the spatial structure of the raw data. Experiments on simulated datasets with varying data resolution (from 500 to 2 000 pts.ha−1) and spatial structure (range of variogram between 10 and 45 m) showed that the proposed methodology was able to define varying optimal grid sizes (from 5 to 12 m). The proposed geostatistical approach was then applied on a real dataset of total soluble solids/sugar content of table grape so that the optimal mapping grid size could be found. Once it was defined, two interpolation methods: simple averaging over blocks and block kriging, were applied to mapping the data. Results show that both methods help depict the within-field variability in the data. While the averaging procedure is easier to automate, the block kriging approach provides users with a level of uncertainty in the aggregated data. Both mapping approaches significantly impacted the within-field spatial structure: (i) the small-scale variations were ten times lower than in the raw data, and (ii) the signal-to-noise ratio of the aggregated data with the optimal grid was twice as high as that of the raw data. As the proposed geostatistical methodology is a first attempt to define the optimal grid size to map high resolution spatial data, areas for future development applications are also proposed.