En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer une navigation simplifiée et la réalisation de statistiques de visites. Politique de confidentialité en bas de page. En savoir plus.

Mise en forme des données

La mise en forme des données est une étape importante.

La forme et la précision des données transmises sont des éléments clés pour la valorisation des données transmises :

Si la forme n’est pas correcte, cela va entraîner un surcroît conséquent de travail et des allers retours entre l’INPN et l’entomologiste, voir même une impossibilité d’intégrer les données ;

Plus les informations seront précises, plus les possibilités d’exploitation seront grandes. Ainsi, il sera possible d’utiliser une donnée avec ses coordonnées géographique pour savoir si l’espèce est présente dans telle parcelle de la forêt, ce qui sera impossible pour une donnée localisé à la commune.

La mise en forme des données est donc une étape importante. Une très grande rigueur sera nécessaire pour numériser les observations ou les mettre en forme si elles sont déjà numérisées.

SAPROX ne peut prendre en charge que des données au format numérique. Les carnets de chasses et les collections photographiques doivent faire l’objet d’une saisie numérique avant leur intégration dans SAPROX.

Ces données doivent être saisies dans un format numérique qui permet de les manipuler facilement. Les tableurs (Excel par exemple) sont l’outil idéal. Il faut absolument éviter les saisies dans les outils de traitement de texte (Word par exemple), la remise en forme est longue et particulièrement chronophage.

Un modèle de tableau est disponible en téléchargement, il permet de saisir les différents éléments constituant des observations entomologiques. Ce fichier intègre également une feuille de « métadonnées », permettant de renseigner certaines informations importantes, comme par exemple les souhaits de restriction d’utilisation des données transmises. La majorité des informations de métadonnées, propres à l’inventaire SAPROX lui-même et pas au jeu de données transmis, sont bien évidemment déjà pré-remplies.

Les observations sont consignées en ligne. Les colonnes étant les différentes composantes des données. Une attention particulière sera porté la façon de saisir de manière constante une information identique, par exemple le nom d’un observateur sera toujours orthographié de la même façon dans l’ensemble de vos données.

Ci-dessous, un exemple de tableau de saisie avec les colonnes suivante  : Nom du taxon (espèces auteur date), la  date d’observation (avec date de début et date de fin) , la commune et les observateurs.

debut-tableau-saisie

En fonction des besoins il est possible d’ajouter ou de supprimer certaines colonnes. Cependant quatre informations restent indispensables pour une donnée de base.

  • un taxon identifié au niveau spécifique avec si possible le nom du descripteur
  • une date (a minima l’année) ou une période,
  • un collecteur et un identificateur le cas échéant,
  • une commune précise – une commune est un territoire dépendant d’une mairie. Les lieux dits sont à rattacher à une commune avant de pouvoir être transmis

Il est fortement recommandé de ne jamais utiliser le point-virgule (« ; ») ou la tabulation.

I – Le nom du taxon au niveau spécifique ;

Cette information est obligatoire.

Le format proposé : Genre espèce (Auteur, année).

Il est nécessaire de vérifier la validité des noms saisis. L’INPN propose une liste de référence nationale TaxRef . Outre une orthographe correcte du nom, ce référentiel permet de connaître le nom valide pour une espèce que vous avez identifiée.

Pour l’ensemble des espèces saproxyliques, une cotation de la difficulté d’identification a été réalisée. Elle est disponible dans les ressources. Cela permettra éventuellement d’évaluer la pertinence et la difficulté de certaines identifications.

 

II – La date :

Cette information est obligatoire.

La date doit être saisie dans un format classique (jour/mois/ année) dans 3 colonnes différentes. Cela permet un traitement simple. La saisie d’une date partielle (mois, année ou année seulement) est possible. Aucune date sans année ne peut être prise en compte.

observation-debut-fin

Dans le cadre d’une capture sur une période de temps (vacance, ou piégeage) il est possible de mentionner 2 dates, une date de début et une date de fin, soit 6 colonnes. Cette approche lève toute ambiguïté.

III – Le collecteur et l’identificateur :

Cette information est obligatoire.

Les noms doivent être écrits de manière constante.

Les observateurs et d’identificateurs seront mentionnés avec le nom en Majuscules, le prénom avec leur initiale en majuscule, le reste en minuscules. Les abréviations sont à proscrire. Les combinaisons d’observateurs seront séparées par des virgules (et seulement par des virgules). Les données collectés ou centralisées dans le cadre d’une structure (association, gestionnaire, établissement public…) seront porté au crédit de celle-ci dans une colonne à part, mais ni comme observateur ni comme identificateur. Si l’observateur a réalisé ses observations en autonomie,  indiquez  alors « indépendant » dans la colonne structure.

 

IV – La commune :

Cette information est obligatoire.

Une commune est une portion du territoire qui est dépendant d’une mairie. Ce champ d’information n’est pas prévu pour un quelconque autre type d’information, même géographique, comme un lieu dit-ou une forêt. Quel que soit l’endroit où l’on se trouve en France, on dépend d’un territoire communal et c’est cette information et seulement celle-ci qui doit être renseignée ici.

Les noms des communes sont à écrire in extenso (pas d’abréviation), tout en majuscules et sans accents, avec un trait d’union entre les éléments composant son nom à l’exception des articles.

Exemple :

LA VILLENEUVE-BELLENOYE-ET-LA-MAIZE

ROUFFIGNAC-SAINT-CERNIN-DE-REILHAC

Une liste des noms des communes de France est disponible sur le site de l’INSEE une liste simplifiée est également disponible dans les ressources du site.

Une commune doit être associée à un département car il existe des communes ayant le même nom dans différents départements français.

Exemples : WARLUS (80) & WARLUS (62), ou encore, CROISILLES (62), CROISILLES (61), CROISILLES (28) & CROISILLES (14)

Le code INSEE identifie une seule et unique commune. Il doit être consigné dans une colonne différente. Le code postal est à proscrire car il peut être le même pour plusieurs communes.

Dans le fichier standard proposé, le code Insee est automatiquement déduit à partir du nom de la commune et du numéro de département

Les observations qui comprennent toutes ses informations peuvent intégrer SAPROX et l’ensemble des inventaires menés au niveau national.

Pour une meilleure valorisation des données, d’autres éléments peuvent être utiles. Voici ce qui est recommandé en termes de mise en forme.

Les lieux dits :

Cette information est facultative.

Ils ne peuvent être indiqués qu’en association avec un nom de commune.commune-lieu dit

En l’absence de cette information, une recherche de la commune est nécessaire pour cela l’une des meilleures des ressources est le site internet de l’Institut géographique national (IGN) le Géoportail . Les lieux dits y sont référencés. Il sera possible de vérifier à quelle commune les données se rattachent.

Ce site permet d’afficher les cartes IGN au 25 000, mais également les photos aériennes, ainsi que les limites administratives.

L’information sur le lieu-dit doit être conservée dans une colonne séparée des communes.

Les coordonnées géographiques :

Cette information est facultative.

Cette information est généralement plus exploitable que les lieux dits mais elle doit être fournie de façon rigoureuse. Il existe de nombreux formats, en particulier depuis la démocratisation des GPS.

Le format le plus simple est celui fourni en standard par les GPS : Degré décimaux avec une projection WGS84 (important : la forme hexadécimale NN°nn’xx,y ne peut être convertie en NN,nnxxy).

Il est constitué de deux nombres à virgule, avec généralement 4 décimales. Le premier chiffre représente la latitude, expression du positionnement nord ou sud d’un point par rapport au plan équatorial. Le second représente la longitude, expression du positionnement est ou ouest d’un point sur Terre par rapport au méridien de Greenwich.

Exemple : (49,5000° – 123,5000°), généralement avec 4 décimales.

Il est possible de fournir d’autre format en prenant soin de le signaler lors de l’envoi.

Lorsqu’un point précis est transmis, il est recommandé de fournir une estimation de l’imprécision (10, 100, 1000 m pour une prospection effectuée dans un secteur de forêt…).