14.995 IT-Jobs

Machine Learning Operations Engineer (w/m/d)

Jobriver HR Service (15016 weitere Jobs)
Frankfurt am Main
Vor Ort
Vollzeit
Mid-Level
Ab sofort
vor 5 Tagen
61.000 € – 83.000 € / Jahr
Jobriver schätzt: 44.612 € – 105.266 € / Jahr Machine Learning Engineer

Beschreibung

Das Unternehmen ist ein verantwortungsvolles, KI-zentriertes globales Unternehmen im Bereich der digitalen Transformation. Es konzipiert fortschrittliche Lösungen für die Daten- und KI-Transformation, modernisiert Technologie-Infrastrukturen und entwickelt Kernsysteme der nächsten Generation für führende Banken, Versicherungen, Industrie- und Robotik-Unternehmen. In enger Zusammenarbeit mit den Kunden verschiebt das Unternehmen Grenzen, um deren volles Potenzial auszuschöpfen. Mit fundierter Branchenexpertise, modernsten Technologien und einem starken Partnernetzwerk bietet es verantwortungsvolle, KI-zentrierte Lösungen, die technologische Exzellenz mit hoher Liefer- und Kosteneffizienz vereinen. In dieser Rolle als Machine Learning Operations Engineer sind Sie verantwortlich für den Aufbau und Betrieb einer Model-Serving-Plattform, wie beispielsweise dem Triton Inference Server. Zu Ihren konkreten Aufgaben gehört die Integration unterschiedlichster Modelltypen und Frameworks, wie PyTorch und TensorFlow, sowie die Entwicklung von Inference APIs für Batch- und Streaming-Anwendungen. Darüber hinaus designen Sie robuste Input- und Output-Schemata für ML-Modelle und optimieren deren Performance hinsichtlich Latenz, Durchsatz und GPU-Auslastung. Die Containerisierung und das Deployment von Modellen, unter Verwendung von Docker und AWS, gehören ebenfalls zu Ihrem Verantwortungsbereich. Das Arbeitsumfeld ist geprägt von einem motivierten Team, das sich auf Ihre Erfahrung freut und Ihnen die Möglichkeit bietet, sich gemeinsam weiterzuentwickeln.

Anforderungen

Der ideale Kandidat bringt sehr gute Python-Kenntnisse im Backend und in der ML Runtime mit. Erfahrung mit ML Inference und Serving, beispielsweise mit Triton, TorchServe oder eigenen Runtimes, sind essenziell. Ein fundiertes Verständnis von Model-Inputs und -Outputs, Batching vs. Streaming sowie FP32, FP16 und Quantisierung ist erforderlich. Zudem sollten Sie sicher im Umgang mit Docker und produktiven Deployments sein. Starke Debugging-Fähigkeiten in verteilten ML-Systemen sind von Vorteil, ebenso wie Grundkenntnisse in CUDA und GPU-Computing. Sehr gute Deutsch- und Englischkenntnisse sind notwendig, um in einem internationalen Umfeld erfolgreich zu kommunizieren. Persönliche Eigenschaften wie Teamfähigkeit, analytisches Denken und eine proaktive Arbeitsweise runden Ihr Profil ab.

Technologien

Python Docker AWS TensorFlow PyTorch

Soft Skills

Teamfähigkeit Analytisches Denken Kommunikation

Erforderliche Sprachen

Deutsch Englisch

Jetzt bewerben

72.000 €
0 / 800 Zeichen

Lebenslauf, Zeugnisse, Anschreiben (PDF, max. 5MB pro Datei, max. 10 Dateien)

Dateien hier ablegen oder klicken
Weitere Informationen findest du in der Datenschutzerklärung. Du kannst deine Einwilligung jederzeit widerrufen.