Unser Kunde ist an der Spitze der KI-Compiler-Technologie und sucht leidenschaftliche Ingenieure, die die nächste Generation von Werkzeugen für KI-Entwickler und -Forscher weltweit entwickeln. In dieser Rolle sind Sie ein zentraler Bestandteil eines innovativen Teams, das an einem ambitionierten, quellcodebasierten Compiler arbeitet, der herausragende Leistungen für PyTorch-Modelle auf NVIDIA-GPUs freisetzt. Sie werden direkt zur Zukunft der beschleunigten KI beitragen und dabei an der Gestaltung, Implementierung, Optimierung und Wartung der Kern-Compiler-Technologien arbeiten, die massive Deep-Learning-Workloads beschleunigen. Diese Position erfordert eine enge Zusammenarbeit mit den Ingenieuren, die PyTorch für NVIDIA-Hardware entwickelt haben, und bietet Ihnen die Möglichkeit, neue Funktionen zu entwickeln und an der Spitze der Framework-Entwicklung zu bleiben. Sie werden tief in die Leistungsanalyse eintauchen und Workloads, die auf Tausenden von GPUs laufen, überprüfen, um Optimierungsmöglichkeiten zu finden. Darüber hinaus werden Sie Teil eines dynamischen Ökosystems sein, in dem Sie eng mit führenden Compiler-, Bibliotheks- und Systemteams zusammenarbeiten, um die neuesten Forschungsergebnisse in praktische, wirkungsvolle Lösungen für die Open-Source-Community umzusetzen. Diese Rolle bietet Ihnen die Möglichkeit, in einem unterstützenden und innovativen Arbeitsumfeld zu wachsen und sich weiterzuentwickeln.
Senior Deep Learning Compiler Engineer - PyTorch
Beschreibung
Anforderungen
Wir suchen Ingenieure, die begeistert sind von der Entwicklung leistungsstarker, benutzerzentrierter Werkzeuge und die sich in einem schnelllebigen, kollaborativen Umfeld wohlfühlen. Der ideale Kandidat sollte einen Bachelor-, Master- oder Doktortitel in Informatik oder einem verwandten technischen Bereich (oder gleichwertige Erfahrung) vorweisen können und über mehr als 8 Jahre relevante Berufserfahrung verfügen. Fundierte Kenntnisse in Python sowie Erfahrung im Aufbau komplexer, gut getesteter Softwaresysteme sind erforderlich. Praktische Erfahrungen mit Deep-Learning-Frameworks wie PyTorch oder JAX sind von Vorteil. Der Kandidat sollte ein solides Verständnis von Compiler-Konzepten wie abstrakten Syntaxbäumen (ASTs), Zwischenrepräsentationen (z.B. SSA-Form), Programmanalyse und Codegenerierung haben. Ausgezeichnete Kommunikations- und Kollaborationsfähigkeiten sind unerlässlich, um effektiv in einem verteilten, Open-Source-Umfeld zu arbeiten. Vorherige Beiträge zu Deep-Learning-Compiler-Projekten oder -Frameworks sowie tiefgehende Kenntnisse der internen Abläufe von PyTorch sind von Vorteil. Erfahrung mit paralleler Programmierung, verteilten Systemen und der Erstellung von Hochleistungs-CUDA-Code wird ebenfalls geschätzt.