Site­Reliability­/­DevOps­Engineer­-100%­Remote­(m/f/d)
Über diesen Job
Erleben Sie die Freiheit des Remote-Arbeitens als Site Reliability Engineer (SRE) bei Digistore24, einem international erfolgreichen Software- und Bildungstechnologieunternehmen. Bringen Sie Ihre Expertise in Automatisierung, Systemoptimierung und Incident-Management ein, während Sie in einem dynamischen Team von rund 200 motivierten Mitarbeitern arbeiten, die aktiv die digitale Zukunft gestalten. Genießen Sie flexible Arbeitszeiten, kontinuierliche Weiterbildung und die Stabilität eines stark wachsenden Unternehmens, das auf eigene Produkte setzt. Bewerben Sie sich jetzt und werden Sie Teil unserer Vision!
Aufgaben
- Automatisierung von sich wiederholenden Aufgaben, Bereitstellungen und Systemmanagement zur Reduzierung menschlicher Fehler und Verbesserung der Effizienz
- Erstellung von Skripten, CI/CD-Pipelines und Automatisierung der Infrastrukturbereitstellung
- Kontinuierliche Verbesserung der Systemverfügbarkeit durch Identifizierung von Engpässen und Optimierung der Systemarchitektur
- Bewertung und Vorhersage des Ressourcenbedarfs (CPU, Speicher, Speicherplatz) zur Sicherstellung der Skalierbarkeit der Infrastruktur
- Implementierung von Auto-Scaling-Lösungen zur Bewältigung von Lastspitzen ohne menschliches Eingreifen
- Kontinuierliche Überwachung der Systemleistung, Verfügbarkeit und Zuverlässigkeit mithilfe von Tools wie Prometheus, Grafana oder ElasticSearch
- Schnelle Reaktion auf Vorfälle, Ausfälle und Störungen zur Minimierung von Ausfallzeiten
- Verwaltung der Vorfalldokumentation, Kommunikation und Analyse nach Vorfällen
- Durchführung von Ursachenanalysen nach Vorfällen zur Identifizierung von Fehlerursachen und Verbesserung der Systemzuverlässigkeit
- Implementierung von Verbesserungen und bewährten Praktiken basierend auf Erkenntnissen aus Nachuntersuchungen
- Texte präzise und empathisch kommunizieren, um Konflikte zu entschärfen und Lösungen zu finden
- Zusammenarbeit mit Entwicklern, Stakeholdern und dem Betrieb zur Förderung von teamorientierten Lösungen
- Förderung der Automatisierung zur Zeitersparnis und Fehlerreduzierung im Team
- Identifikation von Problemen, Ermittlung der Ursachen und Entwicklung von Lösungen zur Vermeidung künftiger Vorfälle
- Organisation und Strukturierung komplexer Projekte unter Berücksichtigung der Eigenverantwortung
Anforderungen
- Du hast umfangreiche Erfahrung in der Automatisierung von Betriebssystemen und Anwendungsbereitstellungen mittels Infrastructure as Code (IaC) zur Effizienzsteigerung.
- Du kannst Systemverfügbarkeit optimieren, indem du Engpässe identifizierst und Systeme laufend anpasst.
- Du führst kontinuierliches Monitoring von Systemleistungen durch und reagierst schnell auf Vorfälle zur Minimierung von Ausfallzeiten.
- Du bist in der Lage, Ursachenanalysen durchzuführen und Verbesserungsmaßnahmen zu implementieren, um Wiederholungen von Problemen zu vermeiden.
- Du hast Erfahrung im Erstellen und Pflegen von CI/CD-Pipelines mit modernen Tools wie GitHub Workflows und Helm.
- Du bringst ausgezeichnete kommunikativen Fähigkeiten mit und kannst sowohl auf Deutsch als auch auf Englisch klar und präzise kommunizieren.
- Du arbeitest erfolgreich in interdisziplinären Teams und verstehst die Herausforderungen verschiedener Stakeholder und bringst Lösungen voran.
- Du bringst ein hohes Maß an Eigenverantwortung mit und organisierst komplexe Projekte effizient und strukturiert.
- Du hast Kenntnisse in der Verwaltung von Cloud-Diensten, bevorzugt Google Cloud, und beherrschst containerbasierte Technologien wie Kubernetes.
- Du zeigst ein starkes Interesse an kontinuierlicher Weiterbildung im Bereich Site Reliability Engineering und hängst den neuesten Technologien nach.
- Du hast ein gutes Verständnis in der Programmiersprache PHP und kannst damit effizient arbeiten.
- Du kannst Kapazitätsplanung durchführen und Ressourcenbedarf einschätzen, um Systeme optimal skalierbar zu halten.
Benefits
- Flexibles Arbeiten
- Homeoffice
- Regelmäßige Weiterbildung
- Stabilität eines erfolgreichen Unternehmens
- Outcome-orientierte Teams
- Moderne Ausstattung
- Internationale Team-Events
- Eigenverantwortung
- Betriebliche Altersvorsorge
- Erstnames Basis
- Keine Kleiderordnung
- Flexible Arbeitszeiten
Ist dir ein Fehler aufgefallen?
Teile uns mit, was nicht funktioniert hat, damit wir es schnell beheben können. Sende eine E-Mail an fachkraefte(at)img-sachsen-anhalt.de