Contenu de l'offre Data Scientist H/F chez Institut Pasteur
Bio info / biostat - Cadre supérieur ingéniérie de recherche (Bio info / biostat)
Data Scientist H/F
L'Institut Pasteur a développé un Data Lake, OWEY, qui permet aux chercheurs de l'Institut et à leurs partenaires Européens de partager leurs données en toute sécurité, notamment des fichiers de « big data » volumineux, issus de diverses disciplines (ex : neuroimagerie, génétique…). OWEY offre par ailleurs des fonctionnalités telle la structuration de données textuelles et un formattage des données selon le standard FHIR.
Un financement a été attribué pour rendre OWEY conforme aux principes FAIR (Findable, Accessible, Interoperable, Reusable). Ce projet s'inscrit dans une collaboration entre la Direction des Systèmes d'Information, la Plateforme de Data Management, le Centre de Ressources en Information Scientifique et l'Unité de Génétique Humaine et Fonctions Cognitives de l'Institut Pasteur. L'objectif ultime du projet est d'obtenir la certification CoreTrustSeal afin de proposer aux scientifiques un entrepôt de confiance conforme aux exigences des financeurs de la recherche (ANR, Commission Européenne…).
Les missions :
Définir les actions et développements à mettre en place pour satisfaire aux exigences du CoreTrustSeal et implémenter les principes FAIR :
Affiner l'analyse d'écart entre la situation actuelle et les exigences attendues par le CoreTrustSeal (CTS)
Définir les aspects fonctionnels qui doivent être implémentés dans OWEY afin de répondre aux exigences du CTS. Il s'agira notamment de définir les ontologies et standards de métadonnées choisis dans OWEY. Ce travail se fera en collaboration étroite avec les autres membres du projet.
Rédiger les livrables à destination du CoreTrustSeal (justifications et preuves de la mise en conformité avec les exigences du CoreTrustSeal)
Assurer le suivi de projet et la coordination entre les différents partenaires du projet (GHFC, CeRIS, DSI) pour implémenter les différentes tâches selon le calendrier défini
De formation Bac+5 en gestion de l'information ou dans une filière connexe, vous avez une première expérience professionnelle dans un poste similaire.
Compétences :
Connaissance des principes FAIR et des exigences des finançeurs en termes de gestion des données (métadonnées, documentation, identifiant pérenne, licences de diffusion…)
Connaissances sur les ontologies et standards en sciences de la vie
Familiarité avec la programmation et bases de données (idéalement Java et Python)
La connaissance du modèle OAIS serait un plus
Bonnes capacités d'analyse et de rédaction
Aisance pour communiquer dans des équipes pluridisciplinaires
Anglais écrit (niveau B2)
Contrat à durée déterminée
12
Temps plein
Non
Non
Pas de déplacements
0 Ã 2 ans
Bac + 5
Aucune
France
10/09/2020