Au sein du Data & IA Hub SOCOTEC , vous rejoignez une équipe pluridisciplinaire chargée de concevoir, déployer et maintenir l’architecture Data du groupe à l’échelle internationale. Vous contribuerez à la modernisation du Lakehouse SOCOTEC , cœur de la plateforme analytique mondiale, et participerez à des projets concrets de valorisation des données, de la conception à la data visualisation. Vous travaillerez sur trois missions principales : Développer des pipelines de données de bout en bout (ingestion, transformation, modélisation, exposition) et contribuer à la mise en place de visualisations dans Power BI ou Databricks SQL. Améliorer en continu le Lakehouse SOCOTEC , notamment sur les volets gouvernance , qualité , et pseudonymisation des données. Expérimenter des solutions d’IA générative appliquées à la data, comme GenIE de Databricks , pour transformer des requêtes textuelles en insights exploitables. Le poste requiert une maîtrise parfaite de l'anglais pour la collaboration avec nos équipes aux US. Le stack technique utilisée : Amazon Web Services (AWS) Databricks Fivetran Spark pour les pipelines ETL Gitlab pour versionner les sources S3 Power BI, l’outil de BI, géré avec les équipes BI Chez SOCOTEC, les carrières sont construites avec vous vers ce qui vous correspond le mieux : expertise technique, management d’une équipe (lead data), etc. Vous aurez la possibilité d’interagir à l’international (US, UK, ITA, ESP, NL) et des opportunités de mobilité internationale sont possibles. Vous ferez preuve d’autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de son code.
Master en Big Data , Informatique , ou Ingénierie logicielle avec une forte spécialisation ou appétence pour la data et les architectures distribuées . Au moins 3 ans d'expérience en Data engineering. Solide maîtrise des bases de données SQL et NoSQL (modélisation, requêtes optimisées, intégrité et performance). Bonne compréhension des architectures Big Data et des outils de traitement distribués ( Spark, Hadoop, Airflow, Kafka, Delta Lake… ). Expérience avec les environnements de développement collaboratif : Git, GitLab, Jupyter Notebooks, VS Code . Connaissances appréciées des services cloud AWS ( S3, Lambda, EMR, Glue, Redshift ). Familiarité avec les principes d’ ETL/ELT , de Data Lakehouse et de DataOps (CI/CD, monitoring, qualité de données). Intérêt pour les technologies émergentes , notamment l’ IA Générative et son intégration dans les plateformes Data. Esprit d’équipe , rigueur et sens de la collaboration dans un environnement agile. Curiosité technique et capacité à apprendre rapidement de nouveaux outils et paradigmes. Autonomie , sens du service et goût pour la résolution de problèmes complexes. Niveau d'anglais bilingue/natif requis.
En intégrant le Data & IA Hub, vous entrerez dans une entité avec l’esprit Start-up. Vous deviendrez membre d’une équipe jeune avec une politique RH tournée vers la satisfaction de ses collaborateurs. Pour vous accompagner dans votre montée en compétences, SOCOTEC financera deux certifications reconnues internationalement : Cloud Pratictioner AWS et AWS Certified Machine Learning – Specialty. Vous prendrez part à des projets captivants et de grande envergure où vous aurez un vrai rôle à jouer ! Vous vous engagez sur la charte des valeurs qui font le socle de la société : Cohésion & Dynamisme Performance & Qualité Innovation & Excellence Technique