14.995 IT-Jobs

Machine Learning Operations Engineer (w/m/d)

Jobriver HR Service (15003 weitere Jobs)
Frankfurt am Main
Hybrid
Vollzeit
Mid-Level
Ab sofort
vor 5 Tagen
61.000 € – 83.000 € / Jahr
Jobriver schätzt: 44.612 € – 105.266 € / Jahr Machine Learning Engineer

Beschreibung

Das Unternehmen ist ein verantwortungsvolles, KI-zentriertes globales Unternehmen im Bereich der digitalen Transformation. In dieser Rolle als Machine Learning Operations Engineer sind Sie verantwortlich für den Aufbau und Betrieb einer Model-Serving-Plattform, wie beispielsweise dem Triton Inference Server. Sie integrieren unterschiedlichste Modelltypen und Frameworks, darunter PyTorch und TensorFlow, und entwickeln Inference APIs sowohl für Batch- als auch für Streaming-Anwendungen. Zudem gestalten Sie robuste Input- und Output-Schemata für Machine Learning-Modelle und optimieren deren Performance hinsichtlich Latenz, Durchsatz und GPU-Auslastung. Containerisierung und das Deployment von Modellen unter Verwendung von Docker und AWS gehören ebenfalls zu Ihren Aufgaben. Sie arbeiten in einem motivierten Team, das großen Wert auf Zusammenarbeit und Innovation legt. Das Unternehmen fördert eine offene Unternehmenskultur, in der Teamgeist und flache Hierarchien gelebt werden. Durch den Austausch mit über 12.000 Technologie-Expertinnen und -Experten weltweit haben Sie die Möglichkeit, sich kontinuierlich weiterzuentwickeln und an der Spitze der technologischen Entwicklungen zu stehen.

Anforderungen

Um in dieser Position erfolgreich zu sein, sollten Sie über sehr gute Kenntnisse in Python verfügen, insbesondere im Backend und in der ML Runtime. Erfahrung mit ML Inference und Serving, beispielsweise mit Triton oder TorchServe, ist von Vorteil. Ein fundiertes Verständnis von Model-Inputs und -Outputs sowie den Unterschieden zwischen Batching und Streaming ist unerlässlich. Kenntnisse in FP32, FP16 und Quantisierung sind ebenfalls wichtig. Sie sollten sicher im Umgang mit Docker und produktiven Deployments sein und starke Debugging-Fähigkeiten in verteilten ML-Systemen mitbringen. Grundkenntnisse in CUDA und GPU-Computing sind wünschenswert. Zudem sind sehr gute Deutsch- und Englischkenntnisse erforderlich, um effektiv im internationalen Umfeld arbeiten zu können.

Technologien

Python Docker AWS TensorFlow PyTorch

Soft Skills

Teamfähigkeit Kommunikation Analytisches Denken

Erforderliche Sprachen

Deutsch Englisch

Jetzt bewerben

72.000 €
0 / 800 Zeichen

Lebenslauf, Zeugnisse, Anschreiben (PDF, max. 5MB pro Datei, max. 10 Dateien)

Dateien hier ablegen oder klicken
Weitere Informationen findest du in der Datenschutzerklärung. Du kannst deine Einwilligung jederzeit widerrufen.