Centre de synthèse et
d'analyse sur la biodiversité

Un centre créé et développé par la FRB
Le 11 avril 2018 à l'amphithéatre INRA, rue de l'université, Paris,  Bill Michener (Project Director for Data Observation Network for Earth (DataONE)) , Simon Hodson (Executive Director of CoData, ICS Committee on Data for Science and Technology ), Donald Hobern (Executive Secretary of the Global Biodiversity Information Facility (GBIF)), et Dirk Schmeller (Department of Conservation Biology Helmholtz-Centre for Environmental Research (UFZ)) discuté sur la façon dont la science évolue, sur les nouvelles initiatives de recherche et de données internationales et sur la meilleure façon d'identifier, de collecter et de partager des données pouvant être rapidement assimilées et utilisées pour comprendre et sauver notre planète.

Ce séminaire était l'occasion de réfléchir à la manière dont nous développons les bases de données et les connaissances nécessaires pour comprendre notre planète. Les présentations, suivies d'une table ronde, examiné: (1) comment l'entreprise scientifique évolue; (2) comment les données sont intégrées globalement et à travers les disciplines scientifiques pour comprendre et soutenir les écosystèmes de notre planète; (3) comment les approches novatrices des technologies de l'information aident à créer une nouvelle compréhension de la biodiversité de la Terre; et (4) comment nous transformons la biodiversité et les mesures écologiques en information pouvant être exploitée par les scientifiques, les gestionnaires de ressources et les décideurs.

Les présentations peuvent être consultées ci-dessous (en anglais)

la présentation de Bill Michener:

la présentation de Simon Hodson:


la présentation de Donald Hobern:

la présentation de Dirk Schmeller (la qualité de cet enregistrement a été gâchée par le fait que Dirk était incapable d'assister en personne):

 

 

 

 

 

 Nous avons besoin de la communauté des écologistes pour aider à
construire un « vocabulaire contrôlé » pour les observations sur le terrain !

Pour contribuer merci de cliquez ici, connectez-vous ou demandez un compte, et passez 10 minutes de votre temps pour choisir votre terme ou vos termes, les définir, et faire du partage de donnée et de la réutilisation une réelle perspective!

Pourquoi avons nous besoin de cela?

Pour construire les référentiels de données et systèmes de découverte essentiels pour le suivi et l'analyse à long terme, nous avons besoin de savoir :

    • ce que les gens ont besoin de dire pour décrire la façon dont ils font des observations et des mesures, 

    •  quels termes utilisent-ils

    •  que signifient ces termes?
 
Le CESAB a un objectif à long terme: faciliter le développement d'un Thésaurus Observations écologiques. En 2016, soutenu par un financement de la Région Provence-Alpes-Côte d'Azur, nous avons été en mesure de poursuivre le développement d'un outil en ligne (initié en 2014) pour récolter les termes et définitions (basé sur un outil développé par Laporte, 2011); ainsi que de développer les méthodes pour combiner ces termes et définitions et de les livrer aux grandes ontologies publiques pour un examen global et une acceptation (comme par ENVO: « Environmental Ontology 1 » ).

Avoir un solide ensemble de termes et définitions dans un arbre hiérarchique (un thésaurus) que les écologistes utiliseront : 

    • réduira l'hétérogénéité sémantique,

    • rendra plus facile pour les groupes de construire des bases de données, et

    • permettra aux gens d'être plus efficaces dans leur recherche et d'analyse.

Comment faire ?

Vous pouvez, par l'intermédiaire du « Thesaurus CESAB », annoter ou modifier les termes proposés, proposer une réorganisation de leur apparition, et ajouter tous les termes qui sont manquants selon vous.

Une fois que les entrées ont été faites, le Thesauform fournit également l'occasion pour vous de « voter » sur la pertinence des termes, des définitions et des sources proposées par d’autres et par vous-même. Ceux-ci sont ensuite examinés par un comité d'experts et le ou les termes les plus favorables, avec des annotations, seront soumis à une ontologie globale pertinente (par exemple ENVO) pour la ratification et la source, le CESAB, sera reconnu. Tout le monde y gagne !

 
Référence

Laporte M-A (2011) Thesauform-Traits: a web based collaborative tool to develop a thesaurus for plant functional diversity research. PhD Thesis, University of Montpellier, France.
 
1 Ontology:  une représentation formelle des connaissances sur un ensemble de termes (ou concepts) dans un domaine et les relations entre ces termes. Elle est utilisée pour raisonner sur les propriétés de ce domaine, et il peut être utilisé pour décrire le domaine.

Introduction

Les données livrées par le CESAB


Les références




Introduction

La réutilisation des données existantes est essentielle pour le travail du / au CESAB. Pour ce faire, les données doivent être assemblées, organisées, marquées, synthétisées et analysées. Cela permet aux équipes de scientifiques d'obtenir de nouvelles connaissances à partir de données qui ont souvent été sous-utilisées et non-corrélées à travers les frontières disciplinaires, géographiques et organisationnelles. 

Pour ce faire, les groupes ont besoin de construire des bases de données organisées des données typiquement hétérogènes qu’ils rassemblent. Puis systématiquement enregistrer les sources de leurs données, les termes des documents utilisés et enregistrer la gestion et le traitement des données par leurs propres soins. Pour aider les groupes à cela, nous demandons qu'ils complètent un plan de gestion des données «live» donc non seulement leurs plans, mais aussi leur pratiques sont enregistrées.

les données de CESAB

Après que leurs analyses soient terminées, nous demandons que leurs données soient déposées pour la réutilisation par d'autres: à l'heure actuelle (2016) le seuil pour cela sont les métadonnées de leurs ensembles de données compilées, mais de plus en plus ce sera la donnée elle-même (avec les métadonnées essentielles). Ce sont des objectifs à long terme, mais sont conformes à la pratique dans le monde entier.

Dans ce monde de données ouvertes, les experts disciplinaires ont de plus en plus le devoir de publier leurs données. Cela nécessite l'apprentissage de nouvelles compétences dans la discipline de la gestion de données et de l'organisation autour de laquelle les programmeurs et les écologistes communiquent rarement, un obstacle majeur dans le monde des données numériques. 

C’est là où le centre de synthèse entre en jeu : fournir l'expertise informatique nécessaire de façon à répondre aux exigences variées et la sophistication des groupes. La contribution importante des personnels des centres de synthèse dans le monde entier est de réfléchir et de développer les différents aspects de la gestion des données est une illustration de cet engagement (e.g. Jones et al. 2006, Bowers et al. 2010, Vision and Cranston 2014, Specht et al. 2015).

Un vocabulaire uniforme et contrôlé est nécessaire pour permettre la publication sur le Web et l' « automated discovery ». Cela a mené au soutient et au développement du CESAB Thesauform pour faciliter l’assimilation de la terminologie et des définitions utilisées par les écologistes dans la description de leurs observations écologiques.

retour à haut




Données livrées par le CESAB


BETSI  (Biologie et traits fonctionnels écologiques des invertébrés du sol pour relier les assemblages d'espèces à des facteurs environnementaux), dont la base de données peut être consultée ICI.

Leurs objectifs principaux étaient les suivants:

    • Promouvoir l'utilisation d'approches fondées sur les « traits» dans l’écologie des « invertébrés du sol »
    • Donner une structure de référence pour archiver les données des traits des invertébrés du sol. 

Ceci est représenté spatialement, entre autres, par l’occurrence des espèces.

 

Pey B., Laporte M.-A., Nahmani J., Auclerc A., Capowiez Y., Caro G., Cluzeau D., Cortet J., Decaëns T., Dubs F., Joimel S., Guernion M., Grumiaux F., Laporte B., Pasquet A., Pelosi C., Pernin C., Ponge J.-F., Salmon S., Santorufo L., Hedde M. (2014) A thesaurus for soil invertebrate trait-based approaches. PLoS One 9(10): e108985 <doi: 10.1371/journal.pone.0108985>

retour à haut 


RAINBIO  (Dynamique de la forêt tropicale africaine : implications pour la conservation de la biodiversité tropicale), dont la base de données peut être consultée ICI.

La méga base de données RAINBIO contient des occurrences géoréférencées de haute qualité de plantes vasculaires de l'Afrique subsaharienne tropicale. Il s'agit d'une compilation de treize ensembles de données publics et non publics mis à disposition dans le cadre du projet RAINBIO financé par le CESAB.

Elle contient 610 117 occurrences géoréférencées pour 25 356 espèces de plantes vasculaires et 29 659 taxons (y compris sous-espèces et variétés), 3 158 genres et 273 familles.

 

Dauby G., Zaiss R., Blach-Overgaard A., Catarino L., Damen T., Deblauwe V., Dessein S., Dransfield J., Droissart V.,Duarte M.C., Engledow H., Fadeur G., Figueira, Gereau R.E., Hardy O.J., Harris D.J., de Heij J., Janssens S., Klomberg Y., Ley A.C., Makinder B.A., Meerts P., van de Poel J.L., Sonké B., Sosef M.S.M., Stévart T., Stoffelen P., Svenning J.-C.,  Sepulchre P., van der Burgt, Wieringa J.J., Couvreur T.L.P. (2016) RAINBIO: a mega-database of tropical African vascular plants distributions. PhytoKeys 74: 1-18 <doi: 10.3897/phytokeys.@.9723>

retour à haut


IRBAS (Analyse et synthèse de la biodiversité des rivières intermittentes), dont la base de données peut être consultée à l’adresse : http://irbas.cesab.org/irbas

En utilisant une équipe de scientifiques internationaux, compétents et productifs, le projet IRBAS a:

        compilé, synthétisé et analysé des données sur la biodiversité et l'habitat intermittent des rivières; et

        fournit et gère une base de données ouverte sur la biodiversité des rivières intermittentes

 

La base de données IRBAS intègre et fournit un accès gratuit aux données recueillies (et soumises), contribuant à la base de connaissances croissante et mondiale sur ces systèmes fluviaux omniprésents et importants. L'interface Web de la base de données IRBAS sert de portail de données et d'outil de découverte de données, facilitant la synthèse et l'analyse de données afin d'élucider les modèles de la biodiversité fluviale intermittente.

 

Leigh C., Laporte B., Bonada N., Fritz K., Pella H., Sauquet E., Tockner K., Datry T. (2016) IRBAS: an online database to collate, analyze, and synthesize data on the biodiversity and ecology of intermittent rivers worldwide.  Ecology and Evolution 7: 815-823 <doi:10.1002/ece3.2679.>

 

retour à haut


DiscoWeeds (Assemblage des communautés adventices)

Le groupe a soumis à fin 2017 une base de données sur les mauvaises herbes dans les champs de culture de France et du Royaume-Uni, avec des informations écologiques et biogéographiques. 

François Munoz, Guillaume Fried, Laura Armengot, Bérenger Bourgeois, Vincent Bretagnolle, Joël Chadoeuf, … Sabrina Gaba. (2017). Database of weeds in cultivation fields of France and UK, with ecological and biogeographical information (Version 1.0.0) [Data set]. Zenodo. http://doi.org/10.5281/zenodo.1112342 

Lien vers leur base de données ICI

 

retour à haut


FunctionalWebs (Diversité fonctionnelle des réseaux trophiques)

 

Régis Céréghino. 2018. Constraints on the functional trait space of aquatic invertebrates in bromeliads. Knowledge Network for Biocomplexity. doi:10.5063/F1VD6WMF.

 

Des données sur 12 traits fonctionnels de 852 taxons collectés dans des broméliacées à réservoir du Mexique à l'Argentine ont été utilisées pour examiner les stratégies écologiques et les contraintes qui sous-tendent l'espace des traits des invertébrés aquatiques. Les principaux axes de variation des traits représentent des stratégies d'histoire de vie optimisant l'utilisation des ressources, et les adaptations anti-prédateurs. Ces axes représentent le niveau trophique, l'habitat, les défenses morphologiques, et les cycles de vie. Les invertébrés des broméliacées occupent seulement 17 à 24% de l'espace fonctionnel potentiel représenté par ces dimensions, en raison de concentrations d’espèces plus élevées que prédites par des distributions uniformes ou normales. Les combinaisons de traits agrègent les taxons par famille puis par ordre, ce qui suggère que le conservatisme de niche est un mécanisme répandu dans la diversification des stratégies écologiques.

Les données et métadonnées peuvent être trouvées par cliquez ICI

Le code R pour analyser les données se trouve par cliquez ICI

 

Citation: Debastiani V., Céreghino R., Pillar V.D. (2018) Code and results for constraints on the functional trait space of aquatic invertebrates in bromeliads. (Version 1.0) Zenodo. Doi: 10.5281/zenodo.1200194

 

retour à haut



Les références

Bowers S., Madin J.S., Schildhauer M.P. (2010) Owlifier: creating OWL-DL ontologies from simple spreadsheet-based knowledge. Ecological Informatics 5(1): 19-25.
Jones M.B., Schildauer M.P., Reichman O.J., Bowers, S. (2006) The new bioinformatics: integrating ecological data from the gene to the biosphere. Ann. Rev. Ecol. Evol. Sys. 37: 519-44.
Specht A., Guru S.M., Houghton L., Keniger L., Driver P., Ritchie E.G., Lai K., Treloar A. (2015) Data management challenges in analysis and synthesis in the ecosystem sciences. Science of the Total Environment 534:144-158.
Vision T.J., Cranston K. (2014) Open data for evolutionary synthesis: an introduction to the NESCENT collection. Scientific Data 1:140030.

 

retour à haut
 

 

Présenté par: Prof. Bill Michener, des Etats Unis*

Michener photo

Sponsorisé par: le CESAB et CEFE (CNRS)

 

Les scientifiques de la biodiversité et de l'environnement génèrent, conservent et partagent de nombreux volumes de données, ce qui favorise une recherche à grande échelle, une méta-analyse, un paramétrage de modèle, une reproductibilité et une transparence. La disponibilité accrue des données a été motivée par des changements socioculturels, y compris de nouvelles attitudes et perceptions des organismes de financement, des éditeurs et des communautés scientifiques de pratiques. La technologie a également joué un rôle clé grâce à l'introduction et l'adoption de référentiels de données communautaires, d'outils logiciels, de données et de métadonnées et d'identificateurs persistants. Dans son discours, Bill a identifié une suite de pratiques exemplaires et d'outils logiciels permettant le partage et l'archivage de données, la promotion de la découverte et de l'utilisation de données et de contribuer à la reproductibilité scientifique.

Vous pouvez voir son exposé ci-dessous (en anglais).

 



Après sa présentation initiale, Bill nous a fourni des conseils et des outils pour gérer les données tout au long du cycle de leur vie. Ceux-ci incluaient des conseils pour améliorer l'entrée et l'organisation des données, l'assurance de la qualité / contrôle de la qualité, la gestion des métadonnées, la conservation des données, la découverte de données et la communication des résultats.

Vous pouvez voir ses suggestions ci-dessous (en anglais).

 

* Le présentateur

William Michener est professeur et directeur des initiatives en e-science au Collège des bibliothèques universitaires et des sciences de l'enseignement de l'Université du Nouveau-Mexique, USA. Il sert de directeur de projet pour la Fondation nationale de la science (NSF) du Nouveau-Mexique et Département américain de l'énergie EPSCoR (Programme expérimental de stimulation de la recherche concurrentielle), et le Réseau d'observation des données pour la Terre (DataONE), un grand projet DataNet soutenu par la NSF. Il est impliqué dans des recherches liées à la création de technologies de l'information qui appuient la science à forte intensité de données, le développement de systèmes de données fédérés et l'engagement et l'éducation de la communauté. Il a un doctorat en océanographie biologique de l'Université de Caroline du Sud et a largement publié dans les sciences de la mer, ainsi que les sciences de l'environnement et de l'information. Il est rédacteur en chef des Ecological Archives, rédacteur en chef de Ecological Informatics et membre du Comité de rédaction pour l'Ecology. 

Salle de projection du Forum,
Mardi 19 novembre 2013, 11h

 

« Effet des changements climatiques sur la distribution, colonisation et extinction des papillons de jours à l'échelle européenne »

LOLABMSSmallLRReto Schmucki, chercheur au MNHN-CNRS, Paris
Groupe de travail LOLA-BMS

 

Résumé :

Les changements environnementaux jouent un rôle déterminant dans la distribution des espèces, influençant à la fois la survie des populations et les taux de colonisation et d'extinction locales. La compréhension des mécanismes et de la direction de ces changements ont une importance cruciale dans l’évaluation des conséquences des changements environnementaux sur la biodiversité. Plusieurs initiatives ont  ainsi étudié les tendances démographiques au niveau national, utilisant des données de suivis standardisés des populations et montrant d’importants changements dans la distribution des espèces.

Afin d’étudier les mécanismes qui déterminent ces changements, nous avons réuni une équipe d'experts qui regroupe sept programmes nationaux de suivis de papillons en Europe. Les suivis standardisés de papillons représentent une opportunité unique de mesurer les effets des changements environnementaux sur la distribution et les processus démographiques, ces organismes étant étroitement reliés avec les conditions environnementales dans lesquelles ils sont observés. Le jeu de données réuni dans le cadre du projet LOLA-BMS nous permet ainsi d’analyser les changements démographiques à l’échelle locale et le long d’un gradient latitudinal qui s’étend de l'Espagne à la Finlande.

Dans cette première étude, nous avons développé un modèle hiérarchique d'occupation qui intègre les variations phénologiques locales et quantifie les changements d'occupation, de colonisation et d'extinction des espèces à l'échelle locale, national et de quatre régions biogéographiques. Ces changements démographiques sont alors examinés en fonction des traits écologiques des espèces afin d'identifier et mieux comprendre les mécanismes qui déterminent la réponse des espèces au réchauffement climatique et aux changements d'occupation des sols.

 

LOLA-BMS est co-financé par la FRB et EDF
edflogo

Salle de projection du Forum,
Mardi 19 novembre 2013, 10h

 

« Vers une conceptualisation des réseaux d'échanges de semences: regard croisé entre modélisation et analyse de données »

NETSEEDSmallPixPar Mathieu Thomas(1), Jean Wencelius(2) et Sophie Caillon(3)
(1) INRA et University of Groningen,
(2) Université Paris Ouest Nanterre la Défense,
(3) CNRS, UMR 5175 Centre d’Ecologie Fonctionnelle et Evolutive, Montpellier
Groupe de travail NETSEED

 

Résumé :
La circulation des semences au sein et à l'extérieur des communautés est une source importante de diversité dans les agro-écosystèmes. En utilisant une double approche – analyse statistique et modèle théorique – fondée sur la théorie des réseaux, nous nous intéressons au fonctionnement des réseaux d’échanges de semences pour mieux comprendre :

  1. Quelles sont les catégories socio-biologiques structurant les échanges ?
  2. Quelles sont les caractéristiques topologiques des réseaux rencontrés en termes de maintien de la diversité ?
  3. Quels sont les biais d'échantillonnage induits par les approches ethnographiques en identifiant les principaux facteurs expliquant la robustesse d'un système d'échange au sein d'une communauté ?

L’objectif est d’ajuster les analyses selon les jeux de données et de proposer des stratégies d’échantillonnage adaptées à chaque question et terrain.
Lors de cette présentation, pour répondre à la première question, nous illustrerons les résultats d'analyses obtenus séparément dans une société d'agriculteurs du Cameroun et du Vanuatu (Pacifique Sud). En nous appuyant sur les différentes variétés de sorgho échangées au sein d'une communauté camerounaise et  les différentes espèces  cultivées et échangées au Vanuatu, nous avons comparé les réseaux d'échange observés par catégorie : les espèces/variétés utilisées pour l'alimentation, les cérémonies ou distinctes sur le plan biologique (type de reproduction, de croissance, de taux de multiplication). Pour répondre à la deuxième question, un modèle de persistance de variété combinant les caractéristiques d’une métapopulation (similaire aux modèles épidémiologiques) et de la biogéographie insulaire neutre (modèle de MacArthur & Wilson) a été adapté pour étudier les différences topologiques des réseaux observés sur les deux sites. Ce modèle théorique s'appuie sur un nombre limité de règles d'échanges représentatives des situations rencontrées sur le terrain grâce à un travail interdisciplinaire entre modélisateurs et ethnobiologistes.