Site Reliability Engineer (w/m/d)

RAIDBOXES GmbH

Kreisfreie Stadt Münster, 48 Münster, Deutschland

Veröffentlicht: Heute

Vollzeit

Du möchtest in einem internationalen Engineering Team arbeiten, in dem du täglich Python und Linux verwendest? Bei uns kannst du mit modernen Technologien die optimale Lösung für unsere Kund:innen gestalten. Werde Teil von Raidboxes als Site Reliability Engineer (w/m/d), komplett remote oder in unserem Büro in Münster. Bewirb dich direkt online!

Tätigkeiten

Was sind deine Aufgaben?

Du arbeitest gerne in einem internationalen Team aus Front-End- und Back-End-Developer, Product Ownern und UX/UI Designer:innen
Du bist verantwortlich für die Architektur und Implementierung von Softwarelösungen sowie für Programmierung, Code-Reviews und Testing
Debugge komplexe Produktionsprobleme wie Inkonsistenzen in verteilten Systemen, Connection-Timeouts und Ressourcen-Engpässe
Entwickle und erweitere unsere Monitoring-Systeme zur Reduzierung manueller Arbeit (Toil) und Verbesserung der MTTR (Mean Time To Repair)
Neue Technologien und Methoden lernen macht dir Spaß
Du arbeitest dich rasch in neue Anforderungen ein
In manchen Fällen ist es erforderlich, Bereitschaftsdienst zu leisten
Du denkst unternehmerisch und hast immer den Anspruch, die beste Lösung im Markt für unsere Kund:innen zu bauen
Du arbeitest lösungsorientiert und setzt dich dafür ein, dass gesetzte Ziele erreicht werden
Du kannst in einem sehr dynamischen Umfeld Prioritäten setzen und effiziente Lösungen finden

Anforderungen

Was wir uns von dir wünschen

Technische Exzellenz & Erfahrung:

Mindestens 7 Jahre Erfahrung in der Softwareentwicklung, davon 5 Jahre in SRE/DevOps-Rollen
Tiefgreifende Linux-Kenntnisse (Prozessmanagement, systemd Internals, sshfs, AutoFS), Microservices, Redis Events, FastAPI, Celery und asynchrone Workflows
Fundierte Kenntnisse der Softwareentwicklung nach SOLID|DRY|Clean Code Prinzipien
Starke Python-Fähigkeiten zum Erstellen resilienter Services mit OOP, asynchronen Patterns, ordnungsgemäßer Fehlerbehandlung und Performance-Optimierung
Erfahrung mit Ansible, einschließlich idempotentem Playbook-Design, AWX und Cloud-Infrastrukturen

Führungs- und Ownership Mentalität:

Führungserfahrung, einschließlich Mentoring von Teammitgliedern, Leitung von Incident Response und Vorantreiben von Architekturentscheidungen
Problemlösungsmentalität, um Probleme zu identifizieren, bevor sie zu Incidents werden
Erfahrung in der Führung einer Post-Mortem-Kultur und systematischen Verbesserungen aus vorherigen Incidents
Verbesserung der Teamkapazitäten durch Dokumentation, Tooling und Wissensaustausch
Fähigkeit zur Zusammenarbeit und Koordination mit mehreren Engineering-Teams und Konsensbildung bei technischen Ansätzen

Kernanforderungen:

Du fühlst dich wohl beim Arbeiten mit Linux, Microservices, Redis Events, FastAPI, Celery und asynchronen Workflows
Du bist vertraut mit Git und modernen CI/CD-Praktiken

Team

Im SRE Team freuen sich derzeit drei Kollegen auf deine Unterstützung.

Bewerbungsprozess

Wir schauen uns deine Unterlagen an. Wenn sie für die Stelle überzeugend sind, laden wir dich zum Erstgespräch, und gegebenenfalls zu einem Zweitgespräch oder Probetag ein. Wir freuen uns auf deine Bewerbung!