May 15, 2024
Position hydrologique multi-ordres pour l'Europe — un ensemble de fonctionnalités pour l'apprentissage automatique et l'analyse en hydrologie
Scientific Data volume 9, Numéro d'article : 662 (2022) Citer cet article 1059 Accès 5 Détails des métriques Altmetric L'ensemble de données présenté EU-MOHP v013.1.1 fournit des informations multi-échelles sur le
Données scientifiques volume 9, Numéro d'article : 662 (2022) Citer cet article
1059 Accès
5 Altmétrique
Détails des métriques
L'ensemble de données présenté EU-MOHP v013.1.1 fournit des informations multi-échelles sur la position hydrologique (MOHP) d'un point géographique au sein de son réseau fluvial et de son bassin versant respectifs sous forme de cartes quadrillées. Plus précisément, il comprend les trois mesures « distance entre le cours d'eau et le cours d'eau » (DSD) comme somme des distances jusqu'au cours d'eau le plus proche et au point de partage du bassin versant, « position latérale » (LP) comme mesure relative de la position entre le cours d'eau et le point de partage les plus proches. et « distance du cours d'eau » (SD) comme distance jusqu'au cours d'eau le plus proche. Ces trois mesures sont calculées pour neuf ordres hydrologiques afin de refléter différentes échelles spatiales, du local au continental. Son étendue spatiale couvre la majeure partie de l’Espace économique européen (EEE39) qui coïncide également largement avec l’Europe physiographique. Bien qu'il existe de multiples cas d'utilisation potentiels, cet ensemble de données sert principalement de descripteur environnemental statique précieux ou de variable prédictive pour la modélisation hydrogéologique et hydrologique telle que les tâches de cartographie ou de prévision utilisant l'apprentissage automatique. La génération de cet ensemble de données utilise uniquement des logiciels open source gratuits et peut donc être transférée vers d'autres régions ou ensembles de données d'entrée.
Des mesures)
distance entre la division et le cours d'eau • position latérale • distance entre le cours d'eau
Type(s) de technologie
télédétection
Caractéristique de l'échantillon - Environnement
bassin versant • bassin versant souterrain • bassin versant
Caractéristique de l'échantillon - Emplacement
L'Europe
Ces dernières années, les outils de science des données tels que l’apprentissage automatique sont de plus en plus appliqués et spécifiquement développés pour les défis hydro(gé)logiques et les questions de recherche1,2. Dans le domaine de l'hydrogéologie, l'apprentissage automatique a été utilisé avec succès pour la prévision du niveau des eaux souterraines et diverses tâches de cartographie3,4,5,6,7,8,9,10,11,12,13. Étant donné que les modèles d'apprentissage automatique — à l'exception des modèles hybrides ou guidés par la physique — sont basés uniquement sur des données sans aucune connaissance des processus physiques, il est important de fournir des fonctionnalités significatives (également appelées variables prédictives ou explicatives) qui affectent la variable cible afin que l'algorithme d'apprentissage automatique peut modéliser la fonction entre l'entrée et la cible. Pour les processus de surface et proches de la surface, ce critère peut être plus ou moins rempli par la disponibilité de données de télédétection, alors que pour la modélisation des processus souterrains comme en hydrogéologie, cela pose un sérieux défi.
La principale motivation de cet ensemble de données est de combler partiellement cette lacune en fournissant un ensemble de fonctionnalités qui introduisent un contexte hydrologique aux modèles d'apprentissage automatique concernant la position horizontale d'un point dans son bassin versant. Les trois mesures — déterminées par cette position horizontale — sont calculées pour plusieurs ordres dits hydrologiques. Les ordres hydrologiques représentent différentes échelles spatiales, du local au régional en passant par le continental. Par conséquent, les mesures servent de proxy pour les caractéristiques géophysiques des systèmes hydrologiques à plusieurs échelles et complètent les caractéristiques couramment disponibles et utilisées telles que l'utilisation et la couverture des terres, les cartes géologiques ou pédologiques. Cet ensemble de données s'inspire fortement de Belitz et al.14 et adapte leurs idées et méthodes à la « base de données EU-Hydro - River Network »15 mais — en revanche — en utilisant un logiciel open source gratuit et en mettant fortement l'accent sur la reproductibilité. Ce concept pourrait être étendu spatialement en appliquant les méthodes présentées aux réseaux fluviaux mondiaux ou aux ensembles de données hydrographiques, tels que HYDRO1k16 ou MERIT Hydro-Vector17. Pour un aperçu plus détaillé du concept et des méthodes, nous nous référons à Belitz et al.14.
Dans leur étude, Belitz et al.14 fournissent également les résultats d’études de cas pour prouver que la position hydrologique multi-ordres est une caractéristique précieuse lors de la cartographie de diverses variables cibles géophysiques à l’aide de l’apprentissage automatique. Son avantage pour les performances des modèles d’apprentissage automatique a également été reconnu par plusieurs autres études7,18,19.