Unser Kunde verfolgt die Mission, den strategischen Zwilling von Organisationen zu schaffen, indem er operative Daten in klare Wirkungsmodelle transformiert. In der Rolle des Data Platform Engineer arbeiten Sie eng mit dem CTO zusammen und überbrücken die Lücke zwischen der Rohinfrastruktur und der semantischen Analyse. Sie sind verantwortlich für die Architektur der Datenherkunft und der Metadatenmodelle, die als Grundlage für unsere mathematische Rechenmaschine dienen. In einem dynamischen und technologieaffinen Team entwickeln Sie die semantischen Strukturen, die unsere Mission ermöglichen. Zu Ihren Aufgaben gehört der Aufbau des leistungsstarken Rückgrats unserer Datenplattform, wobei der Fokus auf der Stabilität verteilter Systeme und der Entwicklung effektiver Caching-Strategien für großangelegte Operationen liegt. Sie entwerfen ETL-Pipelines und entwickeln widerstandsfähige Caching-Lösungen für komplexe Abhängigkeitsauflösungen. Mit umfangreicher praktischer Erfahrung in ELT/ETL-Prozessen und Datenintegrationsplattformen, einschließlich Tools wie Apache Spark und Apache Flink, etablieren Sie die Infrastruktur für Datenherkunft und Metadatenmodellierung, die als stabile Grundlage für die semantische Interpretation und mathematische Berechnungen dient. Darüber hinaus integrieren und erweitern Sie unsere Datenplattform mit graphbasierten Analysefähigkeiten und nutzen APIs für Wissensgraphen sowie git-basierte Workflows, um kollaboratives Datenmodellieren zu ermöglichen. Sie arbeiten eng mit dem CTO und dem Produktteam zusammen, um die architektonische Vision unserer semantischen Engine voranzutreiben.
Data Platform Engineer
Beschreibung
Anforderungen
Der ideale Kandidat bringt mehr als 5 Jahre Erfahrung im Aufbau von Datenplattformen, Dateninfrastrukturen oder Backend-Systemen mit, wobei der Schwerpunkt auf datenintensiven Operationen liegt, vorzugsweise in einem Startup oder einem dynamischen Umfeld. Ein GitHub-Profil oder Portfolio, das Ihre Fähigkeiten im Bereich Datenengineering zeigt, ist von Vorteil. Sie verfügen über tiefgehende Kenntnisse in Python für produktive Datensysteme und sind versiert in TypeScript zur Erstellung von Daten-APIs und Integrationsschichten. Ein proaktiver, neugieriger und unabhängiger Arbeitsstil mit einem starken Sinn für Eigenverantwortung und einer Handlungsorientierung sind ebenfalls wichtig. Praktische Erfahrung mit Cloud-Infrastrukturen (wie AWS oder Cloudflare) ist erforderlich. Vertrautheit mit Graphdatenbanken, semantischer Modellierung oder Wissensgraphen (wie Neo4j oder JanusGraph) ist von Vorteil. Erfahrung mit Datenbetriebssystemen und Graph-APIs sowie eine starke Orientierung an git-basierten Workflows sind ebenfalls wünschenswert. Gute Englisch- und Deutschkenntnisse auf C1-Niveau oder höher sind erforderlich. Der Kandidat sollte bereits in Köln leben oder bereit sein, dorthin umzuziehen.