Position hydrologique multi-ordres pour l'Europe — un ensemble de fonctionnalités pour l'apprentissage automatique et l'analyse en hydrologie

Blog

MaisonMaison / Blog / Position hydrologique multi-ordres pour l'Europe — un ensemble de fonctionnalités pour l'apprentissage automatique et l'analyse en hydrologie

Jun 22, 2024

Position hydrologique multi-ordres pour l'Europe — un ensemble de fonctionnalités pour l'apprentissage automatique et l'analyse en hydrologie

Scientific Data volume 9, Numéro d'article : 662 (2022) Citer cet article 1083 Accès 5 Détails des métriques Altmetric L'ensemble de données présenté EU-MOHP v013.1.1 fournit des informations multi-échelles sur le

Données scientifiques volume 9, Numéro d'article : 662 (2022) Citer cet article

1083 Accès

5 Altmétrique

Détails des métriques

L'ensemble de données présenté EU-MOHP v013.1.1 fournit des informations multi-échelles sur la position hydrologique (MOHP) d'un point géographique au sein de son réseau fluvial et de son bassin versant respectifs sous forme de cartes quadrillées. Plus précisément, il comprend les trois mesures « distance entre le cours d'eau et le cours d'eau » (DSD) comme somme des distances jusqu'au cours d'eau le plus proche et au point de partage du bassin versant, « position latérale » (LP) comme mesure relative de la position entre le cours d'eau et le point de partage les plus proches. et « distance du cours d'eau » (SD) comme distance jusqu'au cours d'eau le plus proche. Ces trois mesures sont calculées pour neuf ordres hydrologiques afin de refléter différentes échelles spatiales, du local au continental. Son étendue spatiale couvre la majeure partie de l’Espace économique européen (EEE39) qui coïncide également largement avec l’Europe physiographique. Bien qu'il existe de multiples cas d'utilisation potentiels, cet ensemble de données sert principalement de descripteur environnemental statique précieux ou de variable prédictive pour la modélisation hydrogéologique et hydrologique telle que les tâches de cartographie ou de prévision utilisant l'apprentissage automatique. La génération de cet ensemble de données utilise uniquement des logiciels open source gratuits et peut donc être transférée vers d'autres régions ou ensembles de données d'entrée.

Des mesures)

distance entre la division et le cours d'eau • position latérale • distance entre le cours d'eau

Type(s) de technologie

télédétection

Caractéristique de l'échantillon - Environnement

bassin versant • bassin versant souterrain • bassin versant

Caractéristique de l'échantillon - Emplacement

L'Europe 

Ces dernières années, les outils de science des données tels que l’apprentissage automatique sont de plus en plus appliqués et spécifiquement développés pour les défis hydro(gé)logiques et les questions de recherche1,2. Dans le domaine de l'hydrogéologie, l'apprentissage automatique a été utilisé avec succès pour la prévision du niveau des eaux souterraines et diverses tâches de cartographie3,4,5,6,7,8,9,10,11,12,13. Étant donné que les modèles d'apprentissage automatique — à l'exception des modèles hybrides ou guidés par la physique — sont basés uniquement sur des données sans aucune connaissance des processus physiques, il est important de fournir des fonctionnalités significatives (également appelées variables prédictives ou explicatives) qui affectent la variable cible afin que l'algorithme d'apprentissage automatique peut modéliser la fonction entre l'entrée et la cible. Pour les processus de surface et proches de la surface, ce critère peut être plus ou moins rempli par la disponibilité de données de télédétection, alors que pour la modélisation des processus souterrains comme en hydrogéologie, cela pose un sérieux défi.

La principale motivation de cet ensemble de données est de combler partiellement cette lacune en fournissant un ensemble de fonctionnalités qui introduisent un contexte hydrologique aux modèles d'apprentissage automatique concernant la position horizontale d'un point dans son bassin versant. Les trois mesures — déterminées par cette position horizontale — sont calculées pour plusieurs ordres dits hydrologiques. Les ordres hydrologiques représentent différentes échelles spatiales, du local au régional en passant par le continental. Par conséquent, les mesures servent de proxy pour les caractéristiques géophysiques des systèmes hydrologiques à plusieurs échelles et complètent les caractéristiques couramment disponibles et utilisées telles que l'utilisation et la couverture des terres, les cartes géologiques ou pédologiques. Cet ensemble de données s'inspire fortement de Belitz et al.14 et adapte leurs idées et méthodes à la « base de données EU-Hydro - River Network »15 mais — en revanche — en utilisant un logiciel open source gratuit et en mettant fortement l'accent sur la reproductibilité. Ce concept pourrait être étendu spatialement en appliquant les méthodes présentées aux réseaux fluviaux mondiaux ou aux ensembles de données hydrographiques, tels que HYDRO1k16 ou MERIT Hydro-Vector17. Pour un aperçu plus détaillé du concept et des méthodes, nous nous référons à Belitz et al.14.

Dans leur étude, Belitz et al.14 fournissent également les résultats d’études de cas pour prouver que la position hydrologique multi-ordres est une caractéristique précieuse lors de la cartographie de diverses variables cibles géophysiques à l’aide de l’apprentissage automatique. Son avantage pour les performances des modèles d’apprentissage automatique a également été reconnu par plusieurs autres études7,18,19.

 = i are used, whereas those with stream order _public_beta_v009.gpkg” and the second with “euhydro__v011.gpkg”. The coastline data is stored in a single Shapefile (.shp) file (see Fig. 4b). All files have a total size of approximately 14 GB when unzipped./p>___.tif”. The placeholders including “<” and “>” can be theoretically replaced by any combination of the values summarized in Table 2. But not all study area polygons have a river network for each hydrologic order. For example, the study area polygon for the island of Sardinia only has rivers up to a maximum streamorder of 6 and therefore only a maximum hydrologic order of 6. This means that there are no GeoTIFF files for Sardinia for hydrologic orders 7–9. Therefore, the total number of files is \({n}_{measures}\cdot {\sum }_{i=1}^{{n}_{hydrologicorders}}{n}_{studyareapolygons,i}=3\cdot {\sum }_{i=1}^{9}{n}_{studyareapolygons,i}=192\)./p> = dsd”). If required, a potential solution to this could be to fill these NA cells with values from the nearest non-NA grid cell as a simple approximation./p>, proxy = TRUE) before applying st_crop(). To simplify some of the previous steps, we developed the R package eumohpclipr (https://github.com/MxNl/eumohpclipr/)33. This package provides functionality to mosaic, crop or clip and plot the EU-MOHP dataset20. For a fast raster cell value extraction based on polygons, the R package exactextractr (https://github.com/isciences/exactextractr)34 is recommended./p> = lp”) must be divided by 100 to obtain percentages with two decimal digits or by 10,000 to obtain values in the range from 0 to 1. The cell values of all other files represent a distance in meters and can be used as is. All files are stored using the coordinate reference system (CRS) ETRS89-extended/LAEA Europe with the EPSG code 3035./p>