Stage - Ingénieur/Ingénieure en Data Engineering ou Data Science

You'll be redirected to
the company's application page
Description de l'entreprise
L'objectif d'Artelia est de construire une société d'ingénierie internationale indépendante et multidisciplinaire, capable d'offrir à ses clients des secteurs public et privé une approche originale de l'ingénierie, de la gestion de projet et du conseil, qui réponde aux attentes d'un monde en pleine mutation.
Le Groupe Artelia est né de l’union de Coteba et de Sogreah finalisé le 30 mars 2010, avec l’acquisition et l’intégration de plusieurs sociétés dont AUXITEC (France) en 2017, MOE (Danemark) en 2019, PRINCIPIA (France) en 2020, Olav Olsen (Norvège) en 2020, ACE (Inde) et SMC (Thaïlande) en 2023, ADPI (Moyen-Orient), Castons et Pick Everard (Royaume-Uni), MTC (France) en 2024, et LCI (Australie) et HNIT (Islande) en 2025
100% du capital du Groupe est détenu par ses dirigeants, ses managers et ses salariés, ce qui préserve Artelia de tout conflit d’intérêt et de toute influence susceptible de nuire à la qualité et l’impartialité de ses missions.
Indépendance, éthique et développement durable sont les valeurs phares du Groupe Artelia qui applique une gouvernance participative et transparente, s’investit dans sa responsabilité sociétale et la maitrise des risques. Performance énergétique et durabilité des bâtiments, écoconception urbaine, protection de l’environnement, promotion des énergies renouvelables et intégration du changement climatique structurent quotidiennement nos missions et notre politique de R&D. La Fondation Artelia concrétise également notre engagement dans les causes d’intérêt général en soutenant plus de 20 projets à caractère social, humanitaire ou environnemental.
Avec 10 100 collaborateurs et un chiffre d’affaires de 1.15 Md€ en 2024, Artelia figure parmi les 10 premières sociétés d’ingénierie-conseil en Europe. A l’international, le groupe réalise des projets dans plus de 100 pays et dispose de bureaux dans 40 pays en Europe, en Afrique, au Moyen-Orient, en Asie et dans les Amériques.
Contexte du stage
Au sein du groupe Artelia, le/la stagiaire intègrera l’équipe internationale Environnement et Social (ESI), qui est spécialisée dans l’évaluation des impacts environnementaux et sociaux des projets liés à la production d’énergie (hydroélectricité, fermes solaire photovoltaïques, parcs éoliens, etc.), des grandes infrastructures linéaires (routes et voies ferrées, pipelines pétroliers et gaziers, lignes électriques haute et basse tension, etc.) ainsi que des projets industriels à l'international. Dans ce contexte, elle conçoit des mesures de mitigation et de compensation, des programmes d’accompagnement, et fournit une assistance continue à ses clients afin d’optimiser la sécurité et de garantir une mise en œuvre fluide des projets, conforme aux politiques de sauvegardes environnementales et sociales nationales et aux standards internationaux.
L’équipe regroupe des ingénieurs de différentes spécialités (sociologie, environnement, biodiversité, géomatique).
Dans le cadre des missions d’inventaires Faune/Flore, l’équipe génère un grand nombre de données issues de différents pays exploitées uniquement dans le cadre des projets menés par ARTELIA. Ces données représentent un intérêt majeur pour la communauté scientifique et ARTELIA souhaite mettre en place une démarche de publication de ces données en OpenSource, en accord avec ses clients, pour :
- Enrichir la connaissance mondiale de la biodiversité
- Favoriser la transparence et la traçabilité des données environnementales
- Valoriser la démarche environnementale des clients
- Acquérir une visibilité dans le monde scientifique
Les données de biodiversité susceptibles d’être publiées sont des occurrences : enregistrements individuels d’observations ou de collectes d’organismes vivants, incluant des informations comme l’espèce observée (nom latin), la date, la localisation géographique (coordonnées GPS), le nom de l’observateur, et éventuellement des supports multimédias (photos, vidéos, enregistrements acoustiques…).
Description du poste
Le stage s’intègre dans un travail d’équipe pour :
- Centraliser, structurer (mapping) et sécuriser les bases de données existantes.
- Faciliter l’analyse grâce à un outil d’interrogation de la base de données
- Prise en main de l’outil Integrated Publishing Toolkit (IPT).
- Permettre leur partage en OpenSource via la plateforme GBIF.
Le Global Biodiversity Information Facility (GBIF) est la plus grande initiative internationale visant à offrir un accès libre et gratuit aux données sur la biodiversité via Internet. Son objectif est de soutenir la science, la conservation et le développement durable en rendant interopérables et accessibles les données d’occurrences d’espèces, de listes taxonomiques et d’événements d’échantillonnage. Pour faciliter la publication, GBIF met à disposition l’Integrated Publishing Toolkit (IPT), un logiciel open source qui permet aux institutions comme ARTELIA de préparer, standardiser et publier leurs jeux de données selon le format Darwin Core. L’IPT fonctionne comme une passerelle : il gère les métadonnées, attribue des identifiants uniques aux jeux de données, et les enregistre dans le registre GBIF pour qu’ils soient indexés et consultables sur le portail mondial.
Missions
Le/la stagiaire assurera les missions suivantes :
- Intégration de l’existant dans la base de données unique
En s’appuyant sur le standard Darwin Core, la personne recrutée devra définir une procédure afin d’intégrer les données existantes dans la base unique. Un jeu de données issues d’un projet en cours sera utilisé et servira de base de travail. La base de données sera hébergée sur un serveur dédié Cloud AWS, mis en place par le service digital d’ARTELIA.
- Partage des données avec la plateforme GBIF
Réaliser l’ensemble du processus menant à la publication en OpenSource des données biodiversités accumulées par ARTELIA. Ce processus comprendra les étapes de collecte des multiples bases de données des différents projets de l’équipe ESI, standardisation des formats, intégration à la base de données centralisée via l’IPT et le partage vers la plateforme GBIF.
- Requêtes
Le stage aura également pour objectif de développer un outil permettant d’interroger la base de données sous formes de requêtes. Cet outil sera à destination des membres de l’équipe ESI et devra être développé en étroite collaboration avec eux.
- Retours d’expériences et restitutions
Au terme du stage, il sera attendu 3 types de restitutions :
Un entretien « Retour d’Expérience » (REX) : il s’agit d’une présentation succincte (~30min) à l’équipe de sa démarche méthodologique, décrire les obstacles rencontrés, les solutions trouvées et les résultats obtenus. Le but étant de partager l’expérience et les connaissances acquises à l’équipe ESI.
Un guide d’utilisation : Un document décrivant l’outil de requêtes de la base de données centrale créé en collaboration avec l’équipe.
Une notice d’utilisation : Un document décrivant l’ensemble des étapes menant à la publication des données sur la plateforme GBIF via l’IPT.
Le/la stagiaire pourra être amené à apporter son appui sur d'autres problématiques liées à la gestion des bases de données et au traitement des données au sein de l'équipe ESI, et à participer à des groupes de travail sur ces sujets.
Qualifications
Profil recherché
Master 1 ou 2 en informatique, avec spécialisation en Data Engineering ou Data Science.
Compétences techniques
- Maîtrise des bases de données relationnelles (SQL, PostgreSQL, éventuellement PostGIS) et des processus ETL pour intégrer des données hétérogènes.
- Développement en Python pour automatisation et analyse.
- Connaissances souhaitées des standards de données biodiversité (Darwin Core) et des formats d’échange (CSV, JSON).
- Utilisation de Git pour la gestion de versions et la collaboration.
Aptitudes
- Bonnes capacités de communication et de restitution auprès d’équipes pluridisciplinaires.
- Rigueur dans la documentation des procédures (rédaction de notices, guides).
- Faculté à créer des outils simples et intuitifs pour faciliter l’usage par des non-informaticiens.
Atouts pour le stage
- Capacité à structurer et sécuriser des bases multi-projets dans un environnement Cloud (AWS).
- Sensibilité à la science collaborative et à la préservation de la biodiversité.
Informations complémentaires
ARTELIA est engagé en matière de responsabilité environnementale et sociétale autour de 4 grands axes: garantir une gouvernance responsable, protéger notre environnement, cultiver notre capital humain, s’engager pour un monde solidaire et citoyen.
Prep Tools
STUCK ON A QUESTION? PRACTICE IT
Practice Any Question
Get instant AI feedback
"How would you design a scalable system for Artelia's use case?"
BOOST YOUR INTERVIEW CHANCES
Must-Have Skills for This Role
STAND OUT FROM THE CROWD
AI Cover Letter
Tailored for Artelia
Dear Artelia Hiring Team,
I am excited to apply for the Stage - Ingénieur/Ingénieure en Data Engineering ou Data Science position. With my experience in Data Engineering and Data Science...
Continue with AI →