Senior Data Engineer

  • Hybrid
  • Praha + 1 další
  • Full-time

Hledáme zkušeného Data Engineera, který se bude podílet na návrhu, implementaci a správě ML pipeline v prostředí Databricks. Vaším úkolem bude budovat škálovatelné datové procesy, zajišťovat jejich orchestrace, automatizaci a optimalizaci výkonu, a úzcespolupracovat s Data Science týmem při nasazování a provozu modelů. Budete součástí agilního týmu, který propojuje moderní datové technologie, MLOps a cloudová řešení s cílem přinášet byznysu rychlé a spolehlivé výsledky.

Hlavní odpovědnosti

  • GitLab (AZURE)

  • Integrace a správa pipeline (version control, CI/CD).

  • Monitorování a troubleshooting běhu pipeline a datových procesů.

  • Nastavování a konfigurace nových komponent datové infrastruktury.

  • Orchestrace úloh (jobs, workflows) a jejich optimalizace z pohledu výkonu a

  • nákladů.

  • Automatizace přechodů mezi vývojovým, testovacím a produkčním

  • prostředím.

  • Návrh, vývoj a správa modelů a workflow v Databricks.

  • Spolupráce s Data Science týmem na nasazení a provozu modelů.

  • Příprava datových struktur (čištění, transformace) pro Data Science tým

  • Optimalizace Spark jobů a dalších distribuovaných výpočtů.

  • Zajištění datové kvality, bezpečnosti a souladu s interními standardy.

  • Dokumentace datových procesů, architektury a postupů.

Požadované znalosti a dovednosti

  • Praxe v oblasti Data Engineeringu (min. 2–3 roky).

  • Zkušenost s Databricks (Delta Lake, Jobs, Workflows, MLflow).

  • Znalost PySpark a SQL.

  • Zkušenost s orchestrace nástrojů a automatizací (např. Databricks Workflows,Airflow výhodou).

  • Znalost správy kódu v GIT a implementace CI/CD.

  • Zkušenost s optimalizací výkonu distribuovaných výpočtů.

  • Znalost cloudového prostředí (Azure výhodou).

  • Schopnost aktivní spolupráce a komunikace v agilním týmu.

  • Umění prezentovat technické výstupy srozumitelně pro byznysové stakeholdery.

  • Samostatnost, spolehlivost a vysoká míra odpovědnosti.

  • Komunikativní znalost angličtiny (psaná i mluvená).

Výhodou

  • Zkušenosti s Azure Data Factory nebo jinými ETL/ELT nástroji.

  • Porozumění principům MLOps a nasazování ML modelů do produkce.

  • Orientace v DevOps nástrojích a infrastruktuře.

  • Znalost testování datových pipeline (unit/integration tests).

  • Povědomí o data governance a datové bezpečnosti.

Co nabízíme

  • Práci na inovativních projektech v oblasti AI a Machine Learningu.

  • Možnost ovlivnit architekturu a technologický stack.

  • Přístup k moderním nástrojům a cloudovým službám.

  • Přátelské prostředí a spolupráci se špičkovými odborníky

  • Flexibilní pracovní dobu a možnost částečného remote.

Přihlaste se k newsletteru a posuňte se vpřed!
© 2012 – 2025 StartupJobs.com s.r.o.