stage data lake

Stage en Data Engineering

Ce stage d’été vous permettra de renforcer la valeur de WayCare en structurant les données issues de l’IoT automobile et en les rendant exploitables pour nos algorithmes d’intelligence artificielle. Vous participerez à la mise en place d’un Data Lake capable de centraliser, unifier et exposer ces données à fort potentiel.

Contexte

WayCare, startup spécialisée dans la mobilité connectée et les services intelligents pour les véhicules, recrute un(e) stagiaire pour un stage d’été en data engineering.

Ce stage vous permettra de travailler sur un Data Lake opérationnel, centralisant plusieurs flux de données issus de véhicules connectés, afin de les rendre accessibles et exploitables par notre moteur d’IA.

Objet du stage

  1. Collecter et analyser les différentes sources de données disponibles (OBD brut, données enrichies, données véhicule)

  2. Définir un modèle de données unifié

  3. Mettre en place un pipeline d’intégration des données dans un Data Lake

  4. Assurer la transformation et la normalisation des données (format, schéma)

  5. Préparer les jeux de données pour les modules IA et analytiques de WayCare

Mission

  • – Étudier les structures des données existantes et leur fréquence de mise à jour
  • – Concevoir une architecture de stockage adaptée (S3 ou équivalent)
  • – Développer des scripts d’ingestion automatisée (Python, API, ETL)
  • – Implémenter des règles de validation et d’unification des données
  • – Documenter le modèle de données et les flux d’alimentation
  • – Proposer des pistes d’amélioration pour la scalabilité du système

Profil recherché

  • – Étudiant(e) en école d’ingénieur ou Master (informatique, data, systèmes embarqués)
  • – À l’aise avec les structures de données, les API et les outils cloud
  • – Curieux·se, autonome, et rigoureux·se
  • – Intérêt pour les sujets tech, automobile et IoT
  • – Bonus : une première expérience avec un projet de données ou pipeline

Outils et Compétences

  • Outils : Python, Git, JSON, Pandas, AWS S3 (ou équivalent), Notion/Trello
  • Compétences : ingestion de données, modélisation, structuration, automatisation
  • Connaissances appréciées : ETL, Data Lakes, formats Parquet/CSV, APIs REST

Formulaire de candidature

Congrats

Thank you for applying!

We'll review your application and get back to you soon.