.
Principales missions :
Le poste combine la responsabilité de service avec un focus technique
Gestion de l’exploitation des services DFL : Assurer la stabilité, la performance et la haute disponibilité des services (Kafka, Apache Hop, Dremio, Iceberg, Application Hosting) sur Kubernetes, avec un focus sur la fiabilité et l’optimisation.
Analyse et gestion des incidents, problèmes et changements : participer activement à la résolution des incidents, à l’analyse des causes racines, et à la gestion des changements, en garantissant une communication structurée et des actions correctives durables, dans le respect du framework ITIL.
Pilotage de fournisseurs pour le run
Observabilité et optimisation des performances : Développer et maintenir le monitoring, le logging, les alertes et les dashboards. Soutenir les analyses de capacité, de débit/latence et la planification des ressources.
Automatisation et standardisation : Créer et améliorer des runbooks, des standards techniques et des processus réutilisables. Automatiser les tâches récurrentes (templates, checks, onboarding) et contribuer aux conventions plateforme (RBAC, secrets, backup/restore).
Accompagnement et conseil des utilisateurs internes de la plateforme : Servir de point de contact pour les équipes métiers et produit : conseiller sur les use cases, optimiser les processus d’onboarding (accès, documentation), et animer des ateliers pour
une utilisation efficace et conforme de la plateforme
Profil
Diplôme en informatique, informatique de gestion, data engineering ou qualification équivalente — jeunes diplômé(e)s bienvenu(e)s.
Compréhension de base de l’exploitation de plateformes et des systèmes distribués, avec intérêt pour la fiabilité, l’automatisation et les standards techniques.
Première expérience pratique dans plusieurs domaines parmi :
Kubernetes (deployments, services, ressources, bases du troubleshooting)
Kafka / event streaming (producer/consumer, partitions, consumer groups, bases offset/lag)
Data pipelines / ETL (Apache Hop ou équivalent)
Monitoring/logging/alerting (bases sur métriques, dashboards, concepts d’alerte)
Bases Linux/réseau,
Bases Sécurité en exploitation (secrets, certificats, droits)
Vous faites preuve d’un esprit d’équipe, d’autonomie, avec capacité à expliquer clairement des sujets techniques.
Vous savez établir et maintenir des relations de travail constructives avec les parties prenantes internes et les prestataires externes.
Vous maîtrisez le français et l’anglais au niveau professionnel (lu, écrit, parlé). La pratique de l’allemand serait un vrai atout.
Déplacements à prévoir : 1 jour par semaine à Gaggenau (Allemagne)

