Carte 2016 au format vecteur

OSO 2016 vectoriel

Nous vous annonçons la disponibilité de la carte 2016 au format vecteur. Il s'agit d'un produit avec une unité minimale de collecte de 0.1 ha dérivé du raster à 20 m avec une procédure de régularisation et simplification des polygones obtenus.

Afin de préserver au maximum l'information du produit raster, chaque polygone est caractérisé par un ensemble d'attributs :

  • La classe majoritaire, avec la même nomenclature du produit raster.
  • Le nombre moyen d'images sans nuages utilisées pour la classification ainsi que l'écart-type. Ces attributs sont nommés validmean et validstd.
  • La confiance du classifieur (valeur entre 0 et 100).
  • Le pourcentage de la surface couverte par chaque classe de la nomenclature. Ce pourcentage est calculé sur le raster à 10 m, même si les polygones simplifiés sont dérivés du raster à 20 m.
  • L'aire du polygone.

Nous avons découpé le produit selon les limites administratives des départements et généré une archive au format zip contenant les 4 fichiers qui composent le format "ESRI Shapefile". Les donnés peuvent être télé-chargées à partir d'URL du type :

http://osr-cesbio.ups-tlse.fr/echangeswww/TheiaOSO/vecteurs_2016/departement_XX.zip

où XX correspond au numéro du département (09, 31, par exemple, et 2a et 2b pour la Corse).

La liste complète des produits est ici. Un fichier de style QGis est aussi disponible pour l'affichage.

Délais de production

Le délai pour la disponibilité du produit vectorisé est dû à des difficultés de passage à l'échelle de l'algorithme de simplification et de régularisation des polygones. Donatien, Vincent et Arthur ont travaillé d'arrache-pied pendant des semaines pour résoudre des problèmes informatiques et algorithmiques assez complexes.

La bonne nouvelle est que, maintenant, la chaîne de vectorisation est opérationnelle et que le traitement complet peut être fait en quelques jours, ce qui nous permettra de livrer de façon simultanée les versions raster et vecteur de la carte lors des prochains millésimes.

Cohérence entre raster et vecteur

La conversion au format vectoriel de la couche raster initiale d'occupation du sol nous a obligé à faire certains choix techniques. En effet, afin d'assurer une bonne utilisation de cette donnée par le plus grand nombre d'entre vous, nous avons choisi d'utiliser le format vectoriel utilisé par le plus grand nombre d'utilisateurs (contraintes réglementaires), à savoir le format "ESRI Shapefile". Si ce format est standard, il a l'inconvénient majeur d'être limité 2 Go, à la différence du format sqlite par exemple.

Or, la couche raster d'origine contient plus de 10 milliards de pixels. Même si le produit ré-échantillonné à 20 m est utilisé pour la conversion (plus que 2,8 milliards de pixels), le fichier vectoriel généré dépasse largement cette limite de 2 Go. Il a donc été nécessaire de produire un fichier vectoriel par département. Ce découpage vectoriel a un inconvénient majeur, il génère des petits polygones (surface inférieure à l'unité minimale de collecte) en bordure de département. Ces polygones ont ainsi été agrégés au polygone voisin partageant la plus grande frontière. Cette opération limite la conformité avec les produits raster originaux (10 et 20 m).

Une autre limite de ce produit concerne le calcul de la part des occupations du sol originales (produit raster à 10 m avant régularisation et simplification). Pour certains polygones de petite superficie et de forme allongée, le calcul de ces statistiques n'est pas possible car le polygone ne recouvre aucun centroïde de pixel, base de calcul de ces statistiques. Ces polygones possèdent donc uniquement l'information d'occupation du sol.