Unser Kunde verfolgt die Mission, den strategischen Zwilling von Organisationen zu erstellen. Durch die Transformation operativer Daten in klare Wirkungsmodelle revolutionieren sie, wie Ressourcen verwaltet werden. In der Rolle des Senior Data Engineers arbeiten Sie direkt mit dem CTO zusammen, um das semantische Rückgrat der Plattform zu entwerfen. Sie übernehmen die volle Verantwortung für die verteilten Pipelines und Wissensgraph-Ontologien, die die Mission des Unternehmens zum Leben erwecken. Sie werden Teil eines engagierten und dynamischen Teams, das die semantischen Strukturen aufbaut, die für die Umsetzung der Unternehmensziele erforderlich sind. Zu Ihren Aufgaben gehören das Entwerfen komplexer Datenflusslösungen, die transparente, versionierte und vollständig überprüfbare Berechnungen ermöglichen. Sie gestalten die Datenebene, indem Sie Metadaten- und Datenherkunftsmodelle entwickeln, die durch semantische Graphen und numerische Daten verbunden sind. Zudem entwickeln Sie Ontologien, um abstrakte Domänenlogik in klare, abfragbare Graphmodelle zu übersetzen. Sie implementieren robuste, skalierbare Verarbeitungspipelines für zeit-, ressourcen- und kostenbasierte Daten unter Nutzung verteilter Systeme. Darüber hinaus treiben Sie die Integration von LLM-gesteuerten Workflows voran, um die Transformation unstrukturierter Daten in strukturierte Kenntnisse zu automatisieren. Sie definieren Standards für Datenintegrität, Qualität und Versionierung über verschiedene Systeme und Plattformen hinweg. Ihr Beitrag ist entscheidend, um die höchsten Produktchancen zur Nutzung von Daten in Entscheidungsprozessen zu identifizieren.
Senior Full Stack Data Engineer
Beschreibung
Anforderungen
Der ideale Kandidat bringt mehr als 5 Jahre Erfahrung in der Entwicklung produktionsreifer, integrationsintensiver Datenprodukte mit, vorzugsweise in einem Startup- oder schnelllebigen Umfeld. Ein GitHub-Profil oder Portfolio, das Ihre Fähigkeiten in der Datenarchitektur zeigt, ist erforderlich, insbesondere in Bezug auf End-to-End-Pipelines und semantische Modelle. Sie sollten über umfassende Kenntnisse in Programmiersprachen wie Python für produktionsreife Datensysteme verfügen und Erfahrung in SQL sowie Datenbankmodellierung, beispielsweise mit PostgreSQL, mitbringen. Ein proaktiver, analytischer und unabhängiger Arbeitsstil sowie ein starkes Verantwortungsbewusstsein sind unerlässlich. Zudem sollten Sie praktische Erfahrungen mit Cloud-Infrastrukturen (AWS, Cloudflare oder ähnliches) und Infrastructure-as-Code-Tools haben. Vertrautheit mit Graphdatenbanken, Ontologien und semantischer Modellierung ist von Vorteil. Kenntnisse über moderne Data Warehousing- und Data Lake-Konzepte sowie Erfahrungen mit LLM-gesteuerten Daten-Workflows sind ebenfalls wünschenswert. Fließende Englisch- und Deutschkenntnisse auf C1-Niveau oder höher sind erforderlich.