Site reliability engineer (DevOps se smyslem pro stabilitu)
Víš, co děláš, když aplikace běží. Ale taky víš, co dělat, když neběží. Chceme k sobě parťáka, který se nezalekne alertu (i když ho radši předem ošetří), rozumí cloudu, automatizaci a ví, že dobrý monitoring je víc než hezký dashboard.
Budeš se podílet na rozvoji našich SRE procesů, včetně automatizace a optimalizace pracovních postupů. Ve spolupráci s vývojovými týmy se také aktivně zapojíš do vývoje a testování aplikací.
💼 Co tě čeká?
💡 Tvoje hlavní mise:
● udržet naše systémy v chodu, funkční a rychlé
● monitorovat výkonnost a zdraví aplikací (Dynatrace, Grafana, vlastní kouzla)
● vést incident management – rychle, klidně, konstruktivně
● automatizovat, co se dá, a zbytek optimalizovat
● spolupracovat s vývojáři a DevOps týmem na rozvoji infrastruktury.
🎯 Co oceníme:
● zkušenost s cloudem – ideálně GCP nebo AWS (certifikace vítaná)
● znalost REST API a základního síťového/systémového inženýrství
● přehled v CI/CD nástrojích, verzovacích systémech, logování
● zkušenost s monitoringem (Grafana, Dynatrace) a automatizací
● znalost skriptování (Bash, Python, nebo co ti sedí)
● výhodou: přehled v datových nástrojích jako Looker, Power BI…
● znalost Javy je bonus – alespoň na úrovni „vím, co je stack trace“.
👥 Jaký bys měl být:
● nejsi „jen operátor“, jsi inženýr – přemýšlíš v souvislostech
● víš, že automatizace je lepší než ruční rutina
● umíš jednat při výpadku, ale ještě radši mu předcházíš
● umíš komunikovat – s vývojáři, kolegy i incidenty
🚀 Proč k nám:
● děláme věci, co běží 24/7 – a mají smysl
● tvůj vliv bude vidět a cítit – v produkci i v týmu
● máme prostor na inovace – a chuť je zkoušet
● férový přístup, zdravý přístup k work-life balance a rozvoj, který není jen na papíře