Site Reliability Engineer (w/m/d)
Du möchtest in einem internationalen Engineering Team arbeiten, in dem du täglich Python und Linux verwendest? Bei uns kannst du mit modernen Technologien die optimale Lösung für unsere Kund:innen gestalten. Werde Teil von Raidboxes als Site Reliability Engineer (w/m/d), komplett remote oder in unserem Büro in Münster. Bewirb dich direkt online!
Tätigkeiten
Was sind deine Aufgaben?
- Du arbeitest gerne in einem internationalen Team aus Front-End- und Back-End-Developer, Product Ownern und UX/UI Designer:innen
- Du bist verantwortlich für die Architektur und Implementierung von Softwarelösungen sowie für Programmierung, Code-Reviews und Testing
- Debugge komplexe Produktionsprobleme wie Inkonsistenzen in verteilten Systemen, Connection-Timeouts und Ressourcen-Engpässe
- Entwickle und erweitere unsere Monitoring-Systeme zur Reduzierung manueller Arbeit (Toil) und Verbesserung der MTTR (Mean Time To Repair)
- Neue Technologien und Methoden lernen macht dir Spaß
- Du arbeitest dich rasch in neue Anforderungen ein
- In manchen Fällen ist es erforderlich, Bereitschaftsdienst zu leisten
- Du denkst unternehmerisch und hast immer den Anspruch, die beste Lösung im Markt für unsere Kund:innen zu bauen
- Du arbeitest lösungsorientiert und setzt dich dafür ein, dass gesetzte Ziele erreicht werden
- Du kannst in einem sehr dynamischen Umfeld Prioritäten setzen und effiziente Lösungen finden
Anforderungen
Was wir uns von dir wünschen
Technische Exzellenz & Erfahrung:
- Mindestens 7 Jahre Erfahrung in der Softwareentwicklung, davon 5 Jahre in SRE/DevOps-Rollen
- Tiefgreifende Linux-Kenntnisse (Prozessmanagement, systemd Internals, sshfs, AutoFS), Microservices, Redis Events, FastAPI, Celery und asynchrone Workflows
- Fundierte Kenntnisse der Softwareentwicklung nach SOLID|DRY|Clean Code Prinzipien
- Starke Python-Fähigkeiten zum Erstellen resilienter Services mit OOP, asynchronen Patterns, ordnungsgemäßer Fehlerbehandlung und Performance-Optimierung
- Erfahrung mit Ansible, einschließlich idempotentem Playbook-Design, AWX und Cloud-Infrastrukturen
Führungs- und Ownership Mentalität:
- Führungserfahrung, einschließlich Mentoring von Teammitgliedern, Leitung von Incident Response und Vorantreiben von Architekturentscheidungen
- Problemlösungsmentalität, um Probleme zu identifizieren, bevor sie zu Incidents werden
- Erfahrung in der Führung einer Post-Mortem-Kultur und systematischen Verbesserungen aus vorherigen Incidents
- Verbesserung der Teamkapazitäten durch Dokumentation, Tooling und Wissensaustausch
- Fähigkeit zur Zusammenarbeit und Koordination mit mehreren Engineering-Teams und Konsensbildung bei technischen Ansätzen
Kernanforderungen:
- Du fühlst dich wohl beim Arbeiten mit Linux, Microservices, Redis Events, FastAPI, Celery und asynchronen Workflows
- Du bist vertraut mit Git und modernen CI/CD-Praktiken
Team
Im SRE Team freuen sich derzeit drei Kollegen auf deine Unterstützung.
Bewerbungsprozess
Wir schauen uns deine Unterlagen an. Wenn sie für die Stelle überzeugend sind, laden wir dich zum Erstgespräch, und gegebenenfalls zu einem Zweitgespräch oder Probetag ein. Wir freuen uns auf deine Bewerbung!