Standard (mise en forme) des données
La mise en forme des données est une étape importante.
La forme et la précision des données transmises sont des éléments clés pour la valorisation des données transmises. Les données doivent suivre les standards du Système d’Information de l’iNventaire du Patrimoine naturel (SINP) pour pouvoir intégrer l’Inventaire National du Patrimoine Naturel (INPN) ou dans le SINP Régional (voir l’article Comment transmettre ses données ?).
Le non respect du standard provoque un surcroît conséquent de travail, des aller-retours entre l’observateur et l’opérateur et, souvent, des interprétation qui dégradent les données. Dans certains cas, même, l’absence d’informations obligatoires pour le système empêche l’intégration des données.
Plus les informations seront précises, plus les possibilités d’exploitation seront grandes. Ainsi, il sera possible d’utiliser une donnée avec ses coordonnées géographique pour savoir si l’espèce est présente dans telle parcelle de la forêt, ce qui sera impossible pour une donnée localisé à la commune.
La commune est l’entité minimal géographique d’exploitation de la donnée. Les informations de type lieux-dits et toponymes (Forêt de…, Col de…, Mont… etc…) sont difficilement exploitables car elles nécessitent un travail de contrôle manuelle, donnée par donnée.
SAPROX ne peut prendre en charge que des données au format numérique. Les carnets de chasses et les collections photographiques doivent faire l’objet d’une saisie numérique avant leur intégration dans SAPROX.
Ces données doivent être saisies dans un format numérique qui permet de les manipuler facilement. Les tableurs (Excel par exemple) sont l’outil idéal. Il faut absolument éviter les saisies dans les outils de traitement de texte (Word par exemple), la remise en forme est longue et particulièrement chronophage.
A cet effet, un modèle de tableau est disponible en téléchargement, il permet de saisir les différents éléments constituant des observations entomologiques.
Les donnés naturalistes sont une collection d’information structurées sur l’observation d’espèces, cependant dans le cadre du partage, de la mise à disposition de celles-ci des informations complémentaires (métadonnées) sont nécessaires pour que leur utilisation et leur diffusion se fasse dans le cadre commun entre le producteur et le diffuseur. C’est l’objet de la charte de données de l’INPN et de la fiche de métadonnées qui sont présent dans cet ensemble de fichiers. Nous vous conseillons de prendre contact avec Arnaud Horellou qui réalisera directement la saisie des métadonnées. Cette étape préparatoire est simple et indispensable pour un transfert des données réussi.
Structure du tableau proposé
Les données d’observations sont organisées en ligne. Les colonnes étant les différentes composantes de ces données. Une attention particulière sera porté la façon de saisir de manière constante une information identique, par exemple le nom d’un observateur sera toujours orthographié de la même façon dans l’ensemble de vos données.
Ci-dessous, l’exemple du tableau de saisie avec les colonnes suivante : Nom du taxon (espèces auteur date), la date d’observation (avec date de début et date de fin) , la commune et les observateurs.
En fonction des besoins il est possible d’ajouter ou de supprimer certaines colonnes. Cependant quatre informations restent indispensables pour une donnée de base.
- un taxon identifié au niveau spécifique avec si possible le nom du descripteur
- une date (a minima l’année) ou une période,
- un collecteur et un identificateur, même si c’est la même personne,
- une commune précise – une commune est un territoire dépendant d’une mairie. Les lieux dits sont à rattacher à une commune avant de pouvoir être transmis
Il est interdit d’utiliser le point-virgule (« ; ») ou la tabulation.
I – Le nom du taxon au niveau spécifique ;
Cette information est obligatoire.
Le format proposé : Genre espèce (Auteur, année).
Il est nécessaire de vérifier la validité des noms saisis. L’INPN propose une liste de référence nationale TaxRef . Outre une orthographe correcte du nom, ce référentiel permet de connaître le nom valide pour une espèce que vous avez identifiée.
Pour l’ensemble des espèces saproxyliques, une cotation de la difficulté d’identification a été réalisée. Elle est disponible dans les ressources. Cela permettra éventuellement d’évaluer la pertinence et la difficulté de certaines identifications.
II – La date :
Cette information est obligatoire.
La date doit être saisie dans un format classique (jour/mois/ année) dans 3 colonnes différentes. Cela permet un traitement simple. La saisie d’une date partielle (mois, année ou année seulement) est possible. Aucune date sans année ne peut être prise en compte.
Dans le cadre d’une capture sur une période de temps (vacance, ou piégeage) il est possible de mentionner 2 dates, une date de début et une date de fin, soit 6 colonnes. Cette approche lève toute ambiguïté.
III – Le collecteur et l’identificateur :
Ces informations sont obligatoires.
Les noms doivent être écrits de manière constante, de cette façon :
NOM Prénom.
Les abréviations sont à proscrire. Les combinaisons d’observateurs seront séparées par des virgules (point-virgules interdits !). Les données collectés ou centralisées dans le cadre d’une structure (association, gestionnaire, établissement public…) seront porté au crédit de celle-ci dans une colonne à part (Organisme). Si l’observateur a réalisé ses observations en autonomie, ne créez pas celle colonne ou alors laissez la vide.
IV – La commune :
Cette information est obligatoire, que vous renseignez ou non les lieux-dits, toponymes ou même les coordonnées géographiques.
Une commune est une portion du territoire qui est dépendant d’une mairie. Ce territoire ne se limite pas au bourg habitable. Ce champ d’information n’est pas prévu pour un quelconque autre type d’information, même géographique, comme un lieu dit-ou une forêt. Quel que soit l’endroit où l’on se trouve en France, on dépend d’un territoire communal et c’est cette information et seulement celle-ci qui doit être renseignée ici.
Les noms des communes sont à écrire in extenso (pas d’abréviation), tout en majuscules et sans accents, avec un trait d’union entre les éléments composant son nom à l’exception des articles.
Exemple :
LA VILLENEUVE-BELLENOYE-ET-LA-MAIZE
ROUFFIGNAC-SAINT-CERNIN-DE-REILHAC
Une liste des noms des communes de France est disponible sur le site de l’INSEE une liste simplifiée est également disponible dans les ressources du site.
Une commune doit être associée à un département car il existe des communes ayant le même nom dans différents départements français.
Exemples : WARLUS (80) & WARLUS (62), ou encore, CROISILLES (62), CROISILLES (61), CROISILLES (28) & CROISILLES (14)
Le code INSEE identifie une seule et unique commune. Il doit être consigné dans une colonne différente. Le code postal est à proscrire car il peut être le même pour plusieurs communes.
Dans le fichier standard proposé, le code Insee est automatiquement déduit à partir du nom de la commune et du numéro de département
Les observations qui comprennent toutes ses informations peuvent intégrer SAPROX et l’ensemble des inventaires menés au niveau national.
Pour une meilleure valorisation des données, d’autres éléments peuvent être utiles. Voici ce qui est recommandé en termes de mise en forme.
Les lieux dits (toponymes) :
Cette information est facultative.
Ils ne peuvent être indiqués qu’en association avec un nom de commune.
En l’absence de cette information, une recherche de la commune est nécessaire pour cela l’une des meilleures des ressources est le site internet de l’Institut géographique national (IGN) le Géoportail . Les lieux dits y sont référencés. Il sera possible de vérifier à quelle commune les données se rattachent.
Ce site permet d’afficher les cartes IGN au 25 000, mais également les photos aériennes, ainsi que les limites administratives.
L’information sur le lieu-dit doit être conservée dans une colonne séparée des communes.
Les coordonnées géographiques :
Cette information est facultative.
Cette information est généralement plus exploitable que les lieux dits mais elle doit être fournie de façon rigoureuse. Il existe de nombreux formats, en particulier depuis la démocratisation des GPS.
Le format le plus simple est celui fourni en standard par les GPS : Degré décimaux avec une projection WGS84 (important : la forme hexadécimale NN°nn’xx,y ne peut être convertie en NN,nnxxy sans une formule mathématique complexe !).
Il est constitué de deux nombres à virgule, avec généralement 4 décimales. Le premier chiffre représente la latitude, expression du positionnement nord ou sud d’un point par rapport au plan équatorial. Le second représente la longitude, expression du positionnement est ou ouest d’un point sur Terre par rapport au méridien de Greenwich.
Exemple : (49,5000° – 123,5000°), généralement avec 4 décimales.
Il est possible de fournir d’autre format en prenant soin de le signaler lors de l’envoi.
Lorsqu’un point précis est transmis, il est recommandé de fournir une estimation de l’imprécision (10, 100, 1000 m pour une prospection effectuée dans un secteur de forêt…).