Senior Data Engineer
Hledáme zkušeného Data Engineera, který se bude podílet na návrhu, implementaci a správě ML pipeline v prostředí Databricks. Vaším úkolem bude budovat škálovatelné datové procesy, zajišťovat jejich orchestrace, automatizaci a optimalizaci výkonu, a úzcespolupracovat s Data Science týmem při nasazování a provozu modelů. Budete součástí agilního týmu, který propojuje moderní datové technologie, MLOps a cloudová řešení s cílem přinášet byznysu rychlé a spolehlivé výsledky.
Hlavní odpovědnosti
GitLab (AZURE)
Integrace a správa pipeline (version control, CI/CD).
Monitorování a troubleshooting běhu pipeline a datových procesů.
Nastavování a konfigurace nových komponent datové infrastruktury.
Orchestrace úloh (jobs, workflows) a jejich optimalizace z pohledu výkonu a
nákladů.
Automatizace přechodů mezi vývojovým, testovacím a produkčním
prostředím.
Návrh, vývoj a správa modelů a workflow v Databricks.
Spolupráce s Data Science týmem na nasazení a provozu modelů.
Příprava datových struktur (čištění, transformace) pro Data Science tým
Optimalizace Spark jobů a dalších distribuovaných výpočtů.
Zajištění datové kvality, bezpečnosti a souladu s interními standardy.
Dokumentace datových procesů, architektury a postupů.
Požadované znalosti a dovednosti
Praxe v oblasti Data Engineeringu (min. 2–3 roky).
Zkušenost s Databricks (Delta Lake, Jobs, Workflows, MLflow).
Znalost PySpark a SQL.
Zkušenost s orchestrace nástrojů a automatizací (např. Databricks Workflows,Airflow výhodou).
Znalost správy kódu v GIT a implementace CI/CD.
Zkušenost s optimalizací výkonu distribuovaných výpočtů.
Znalost cloudového prostředí (Azure výhodou).
Schopnost aktivní spolupráce a komunikace v agilním týmu.
Umění prezentovat technické výstupy srozumitelně pro byznysové stakeholdery.
Samostatnost, spolehlivost a vysoká míra odpovědnosti.
Komunikativní znalost angličtiny (psaná i mluvená).
Výhodou
Zkušenosti s Azure Data Factory nebo jinými ETL/ELT nástroji.
Porozumění principům MLOps a nasazování ML modelů do produkce.
Orientace v DevOps nástrojích a infrastruktuře.
Znalost testování datových pipeline (unit/integration tests).
Povědomí o data governance a datové bezpečnosti.
Co nabízíme
Práci na inovativních projektech v oblasti AI a Machine Learningu.
Možnost ovlivnit architekturu a technologický stack.
Přístup k moderním nástrojům a cloudovým službám.
Přátelské prostředí a spolupráci se špičkovými odborníky
Flexibilní pracovní dobu a možnost částečného remote.