Senior AI Data Engineer / lokalita Praha - Holešovice

76–100 tis. Kč
On-site, Hybrid
Praha
Full-time

Stavíme chytré AI systémy, které využívají velké jazykové modely (LLM), agentní frameworky a modulární datové pipeline. Všechno se to točí kolem dat - loading, filtering, vectorizing, chunking, embedding, storing, indexing, a retrieving …

Právě hledáme zkušeného data engineera, který navrhne a postaví architekturu, na které to celé poběží.

Nejde o klasickou BI/ETL pozici nebo reporting. Budeš budovat datové jádro pro novou generaci AI produktů - tam, kde se potkávají nestrukturovaná data, Python a chytré agenty.

Co budeš dělat?

navrhovat a stavět škálovatelné a modulární datové pipeline pro LLM a AI agenty
řešit zpracování dokumentů, API a obsahu od uživatelů (texty, HTML, PDF atd.)
vzít si na starost celý proces: ingest → předzpracování → rozdělování → embedding → uložení do vektorové DB → vyhledávání
ladit strategie chunkingu, embeddingu a retrievalu s ohledem na rychlost, relevanci a efektivitu tokenů
pracovat s vektorovými databázemi (FAISS, Chroma, Weaviate) a analytickými úložišti (DuckDB, Postgres) v produkčním nasazení
spolupracovat s ML inženýry, backendem a produktem na tvorbě AI funkcionalit
přidat do pipeline logiku pro kontrolu kvality, sledování metrik a verzování dat
pomáhat klientům s nastavením dat pro jejich AI řešení
mentorovat juniory a zlepšovat naše interní nástroje a postupy
vyvíjet a spravovat backend, na kterém AI aplikace běží
podporovat prompt/context engineering tím, že strukturuješ data pro lepší výkonnost LLM

Stack, se kterým pracujeme:

Python, Django
Pandas
AI nástroje: CrewAI, RAG, vlastní agenty
vektorové DB: FAISS, Chroma, Qdrant, Weaviate, Pinecone
databáze: SQL a NoSQL
infra: Docker, GitHub Actions, Kubernetes, Celery, Kafka, Redis

Hledáme někoho, kdo…

má zkušenosti s data engineeringem nebo backendem u datově náročných systémů
umí psát čistý a udržitelný Python kód
už někdy stavěl nebo škáloval RAG pipeliny v reálném provozu
chápe vektorové embeddingy, similarity search a ví, jak se dělá chunking
se nebojí navrhnout architekturu od nuly a poradit ostatním
umí pracovat s nestrukturovanými daty a vytěžit z nich maximum pro AI
umí najít dobrý kompromis mezi jednoduchostí, výkonem a flexibilitou
dokáže vysvětlit technické řešení klientovi nebo stakeholderovi
má dobrou znalost angličtiny
bude rád součástí našeho onsite AI týmu v kancelářích v Praze 7 - Holešovicích

Plus body, pokud…

máš zkušenost s produkčními LLM/RAG projekty
stavěl/a jsi interní nástroje pro práci s daty v AI
vyznáš se v hybrid search, rerankingu nebo vlastních embedding modelech
pracoval/a jsi na nástrojích pro hodnocení kvality dat (např. recall, grounding, detekce halucinací)
rozumíš tomu, jak data ovlivňují chování agentů nebo jazykových modelů

Za to u nás získáš:

dobré finanční ohodnocení odpovídající senioritě
velmi dobrý work-life balanc
časovou flexibilitu a pracovní autonomii
příjemné prostředí technologické společnosti
prostor pro osobní růst společně s firmou
intenzivní sdílení znalostí v rámci interního týmu AI
práce v týmu, který dbá na technickou kvalitu a čistou architekturu
budeš mít prostor zkoušet nové věci, rychle doručovat a ovlivňovat směr vývoje
motivační bonusový program
5 týdnů dovolené
kurzy angličtiny v různých úrovních, i s rodilým mluvčím
MultiSport kartu včetně doprovodné karty
měsíční finanční příspěvek na stravování
notebook, mobilní telefon
klidné a prostorné kanceláře v Praze 7 (nemáme open space)
chill-out relax zónu s občerstvením
posilovnu zdarma přímo v budově
výbornou kávu, ovoce a v létě zmrzlinu jako občerstvení
kantýnu v budově nebo množství blízkých, i vegetariánských restaurací
dobré spojení MHD od metra Palmovka, Vltavská nebo Nádraží Holešovice

Začít můžeš hned nebo za 2 měsíce.

Dej nám o sobě vědět!

Je to jednoduché a rychlé, pošli mi CV nebo odkaz na tvůj LinkedIn profil, obratem se s Tebou spojím a brzy jsi na palubě!

Gabriela Ferjaková

Head of Human Resources ZENTITY