Das Unternehmen ist eine führende Plattform für Cloud Services und Hosting-Dienstleistungen in Europa. Hierbei wird großen Wert auf die erfolgreiche Begleitung der Kund:innen bei deren Unternehmensentwicklung gelegt. In einem dynamischen Umfeld mit über 4000 Mitarbeitenden in mehreren Ländern wird ein technischer Level-2-Support mit direktem Kundenkontakt angeboten. In dieser Rolle sind Sie verantwortlich für die Pflege von Monitoring-, Logging- und Alerting-Lösungen, um Probleme im Schichtbetrieb proaktiv zu erkennen. Sie werden aktiv an der Lösung komplexer Issues in verteilten Systemen mitwirken und Fehlersuchen in Netzwerken sowie Speichersystemen durchführen. Darüber hinaus stellen Sie hochverfügbare Services auf Linux und Kubernetes bereit und bauen Infrastructure-as-Code auf. Die Zusammenarbeit mit Entwicklungsteams zur Verbesserung von Prozessen und Deployments sowie die Gewährleistung eines stabilen und sicheren Plattformbetriebs sind ebenfalls zentrale Aufgaben. Das Arbeitsumfeld ist geprägt von einer modernen Arbeitskultur, die Weiterbildung und Entwicklungsmöglichkeiten fördert.
Site Reliability Engineer - Kubernetes / Cloud / DevOps (m/w/d)
Beschreibung
Anforderungen
Der ideale Kandidat bringt mehrjährige Erfahrung als Site Reliability Engineer oder in einer verwandten Rolle mit, wie beispielsweise als Linux-Systemadministrator, Platform Engineer, DevOps/Infrastructure Engineer oder Full-Stack-Developer. Fundierte Kenntnisse in Automatisierungstools wie Ansible und Monitoring-Tools wie Prometheus sind erforderlich. Erfahrung mit virtualisierten Umgebungen und Cloud-Storage-Technologien wird ebenfalls erwartet. Zudem sollten Sie sicher im Umgang mit Docker und Kubernetes sein und sehr gute Kenntnisse in mindestens einer Programmiersprache oder Skriptsprache, wie Go, Python oder Bash, besitzen. Ein starkes Problem-Lösungs- und Troubleshooting-Mindset sowie die Bereitschaft, in einem 24 × 7-Schichtmodell zu arbeiten, sind ebenfalls wichtig. Erfahrung im Code-Management ist von Vorteil.