Ce stage d’été vous permettra de renforcer la valeur de WayCare en structurant les données issues de l’IoT automobile et en les rendant exploitables pour nos algorithmes d’intelligence artificielle. Vous participerez à la mise en place d’un Data Lake capable de centraliser, unifier et exposer ces données à fort potentiel.
WayCare, startup spécialisée dans la mobilité connectée et les services intelligents pour les véhicules, recrute un(e) stagiaire pour un stage d’été en data engineering.
Ce stage vous permettra de travailler sur un Data Lake opérationnel, centralisant plusieurs flux de données issus de véhicules connectés, afin de les rendre accessibles et exploitables par notre moteur d’IA.
Objet du stage
Collecter et analyser les différentes sources de données disponibles (OBD brut, données enrichies, données véhicule)
Définir un modèle de données unifié
Mettre en place un pipeline d’intégration des données dans un Data Lake
Assurer la transformation et la normalisation des données (format, schéma)
Préparer les jeux de données pour les modules IA et analytiques de WayCare
Mission
– Étudier les structures des données existantes et leur fréquence de mise à jour
– Concevoir une architecture de stockage adaptée (S3 ou équivalent)
– Développer des scripts d’ingestion automatisée (Python, API, ETL)
– Implémenter des règles de validation et d’unification des données
– Documenter le modèle de données et les flux d’alimentation
– Proposer des pistes d’amélioration pour la scalabilité du système
Profil recherché
– Étudiant(e) en école d’ingénieur ou Master (informatique, data, systèmes embarqués)
– À l’aise avec les structures de données, les API et les outils cloud
– Curieux·se, autonome, et rigoureux·se
– Intérêt pour les sujets tech, automobile et IoT
– Bonus : une première expérience avec un projet de données ou pipeline