MLOps Engineer
Hledáme zkušeného MLOps inženýra, který se připojí k našemu týmu a bude se podílet na vývoji robustní a škálovatelné infrastruktury pro správu a provoz strojového učení v oblasti energetiky. Čeká tě práce na greenfield projektu s dlouhodobou perspektivou, kde budeš mít možnost navrhovat a implementovat klíčové části systému od samého začátku.
O projektu:
Brzy budeme vyvíjet moderní platformu pro správu, trénování a nasazování modelů strojového učení pro předního hráče na energetickém trhu. Naším cílem je vytvořit robustní a škálovatelnou infrastrukturu, která umožní efektivní provoz a správu stovek modelů s různými požadavky na prostředí a závislosti. Platforma staví na nejnovějších technologiích v oblasti MLOps, automatizace a cloudových služeb a klade důraz na bezpečnost, spolehlivost a optimalizaci využití zdrojů. Součástí řešení je také podpora dynamického retrainu, monitoringu a správy životního cyklu modelů v produkčním prostředí.
Co by bylo náplní tvé práce?
Návrh a implementace MLOps pipeline pro trénování, nasazování a správu modelů strojového učení
Výběr a integrace vhodných frameworků pro time series a machine learning (např. Nixtla, Sktime)
Automatizace procesů retrainu, deploymentu a monitoringu stovek modelů s různými závislostmi
Řešení specifických DevOps výzev v oblasti machine learningu (izolace prostředí, optimalizace využití zdrojů, správa závislostí)
Spolupráce s datovými vědci, vývojáři a DevOps týmem na návrhu a provozu celé platformy
Nastavení a správa infrastruktury v cloudu (AWS, Kubernetes, Docker, Terraform)
Zajištění bezpečnosti, škálovatelnosti a spolehlivosti celého řešení
Technologie/nástroje, se kterými budeš pracovat:
ML/TS frameworky (zvažujeme Nixtla/Sktime případně jiné)
Python
Docker, Kubernetes
AWS/Azure
Terraform
Gitlab
Monitoring a logging nástroje (Prometheus, Grafana,...)
Koho hledáme?
Máš zkušenosti s MLOps a DevOps, ideálně v prostředí s větším množstvím modelů strojového učení
Znáš moderní ML frameworky a nástroje pro správu modelů (např. Nixtla, Sktime, MLflow, Kubeflow apod.)
Umíš navrhnout a provozovat škálovatelnou infrastrukturu v cloudu (AWS, GCP, Azure)
Máš zkušenosti s kontejnerizací (Docker, Kubernetes) a automatizací (Terraform, CI/CD)
Rozumíš specifickým výzvám v oblasti provozu ML modelů (správa závislostí, izolace prostředí, monitoring)
Umíš komunikovat napříč týmy (datoví vědci, vývojáři, DevOps)
Výhodou je zkušenost s time series modely a frameworky