Das Unternehmen verfolgt die Mission, den strategischen Zwilling von Organisationen zu schaffen. Durch die Transformation operativer Daten in klare Wirkungsmodelle revolutionieren wir die Art und Weise, wie Ressourcen verwaltet werden. In der Rolle des Data Platform Engineer arbeiten Sie eng mit dem CTO zusammen und überbrücken die Kluft zwischen roher Infrastruktur und semantischem Denken. Sie sind verantwortlich für die Architektur der Datenherkunft und der Metadatenmodelle, die als Grundlage für unsere mathematische Rechenmaschine dienen. In einem dynamischen und technologieaffinen Team gestalten Sie die semantischen Strukturen, die unsere Mission ermöglichen. Zu Ihren Aufgaben gehört der Aufbau des leistungsstarken Rückgrats unserer Datenplattform, die Sicherstellung der Stabilität verteilter Systeme und die Entwicklung effektiver Caching-Strategien für großangelegte Operationen. Sie entwerfen ETL-Pipelines und konzipieren resiliente Caching-Mechanismen für komplexe Abhängigkeitsauflösungen. Ihre praktische Erfahrung mit ELT/ETL-Prozessen und Datenintegrationsplattformen, einschließlich Tools wie Apache Spark und Apache Flink, wird entscheidend sein. Zudem etablieren Sie eine Infrastruktur zur Datenherkunft und Metadatenmodellierung, die als stabile Grundlage für die semantische Interpretation und mathematische Berechnungen dient. Sie integrieren und erweitern unsere Datenplattform mit graphbasierten Denkfähigkeiten und nutzen APIs von Wissensgraphen sowie git-basierte Workflows, um kollaborative Datenmodellierung zu ermöglichen. Dabei arbeiten Sie eng mit dem CTO und dem Produktteam zusammen, um die architektonische Vision unserer semantischen Engine voranzutreiben.
Data Platform Engineer
Beschreibung
Anforderungen
Der ideale Kandidat bringt mehr als 5 Jahre Erfahrung im Aufbau von Datenplattformen, Dateninfrastrukturen oder Backend-Systemen mit, wobei der Schwerpunkt auf datenintensiven Operationen liegt, vorzugsweise in einem Startup oder einem dynamischen Umfeld. Ein GitHub-Profil oder Portfolio, das Ihre Fähigkeiten im Bereich Data Engineering zeigt, insbesondere bei der Arbeit mit verteilten Systemen, Orchestrierungsframeworks oder komplexen Datenpipelines, ist erforderlich. Sie verfügen über umfassende Kenntnisse in Python für produktive Datensysteme und beherrschen TypeScript für den Aufbau von Daten-APIs und Integrationsschichten. Ein proaktiver, neugieriger und unabhängiger Arbeitsstil sowie ein starkes Verantwortungsbewusstsein sind ebenfalls wichtig. Praktische Erfahrung mit Cloud-Infrastrukturen (AWS, Cloudflare oder ähnliches) und Vertrautheit mit Graphdatenbanken, semantischer Modellierung oder Wissensgraphen (Neo4j, JanusGraph, RDF/OWL oder ähnliches) sind von Vorteil. Kenntnisse über Datenbetriebssysteme und Graph-APIs sowie eine starke Orientierung an git-basierten Workflows sind ebenfalls wünschenswert. Sie sollten über Englisch- und Deutschkenntnisse auf C1-Niveau oder höher verfügen und bereits in Köln wohnen oder bereit sein, dorthin umzuziehen.