Senior AI Data Engineer / lokalita Praha - Holešovice
Stavíme chytré AI systémy, které využívají velké jazykové modely (LLM), agentní frameworky a modulární datové pipeline. Všechno se to točí kolem dat - loading, filtering, vectorizing, chunking, embedding, storing, indexing, a retrieving …
Právě hledáme zkušeného data engineera, který navrhne a postaví architekturu, na které to celé poběží.
Nejde o klasickou BI/ETL pozici nebo reporting. Budeš budovat datové jádro pro novou generaci AI produktů - tam, kde se potkávají nestrukturovaná data, Python a chytré agenty.
Co budeš dělat?
- navrhovat a stavět škálovatelné a modulární datové pipeline pro LLM a AI agenty
- řešit zpracování dokumentů, API a obsahu od uživatelů (texty, HTML, PDF atd.)
- vzít si na starost celý proces: ingest → předzpracování → rozdělování → embedding → uložení do vektorové DB → vyhledávání
- ladit strategie chunkingu, embeddingu a retrievalu s ohledem na rychlost, relevanci a efektivitu tokenů
- pracovat s vektorovými databázemi (FAISS, Chroma, Weaviate) a analytickými úložišti (DuckDB, Postgres) v produkčním nasazení
- spolupracovat s ML inženýry, backendem a produktem na tvorbě AI funkcionalit
- přidat do pipeline logiku pro kontrolu kvality, sledování metrik a verzování dat
- pomáhat klientům s nastavením dat pro jejich AI řešení
- mentorovat juniory a zlepšovat naše interní nástroje a postupy
- vyvíjet a spravovat backend, na kterém AI aplikace běží
- podporovat prompt/context engineering tím, že strukturuješ data pro lepší výkonnost LLM
Stack, se kterým pracujeme:
- Python, Django
- Pandas
- AI nástroje: CrewAI, RAG, vlastní agenty
- vektorové DB: FAISS, Chroma, Qdrant, Weaviate, Pinecone
- databáze: SQL a NoSQL
- infra: Docker, GitHub Actions, Kubernetes, Celery, Kafka, Redis
Hledáme někoho, kdo…
- má zkušenosti s data engineeringem nebo backendem u datově náročných systémů
- umí psát čistý a udržitelný Python kód
- už někdy stavěl nebo škáloval RAG pipeliny v reálném provozu
- chápe vektorové embeddingy, similarity search a ví, jak se dělá chunking
- se nebojí navrhnout architekturu od nuly a poradit ostatním
- umí pracovat s nestrukturovanými daty a vytěžit z nich maximum pro AI
- umí najít dobrý kompromis mezi jednoduchostí, výkonem a flexibilitou
- dokáže vysvětlit technické řešení klientovi nebo stakeholderovi
- má dobrou znalost angličtiny
- bude rád součástí našeho onsite AI týmu v kancelářích v Praze 7 - Holešovicích
Plus body, pokud…
- máš zkušenost s produkčními LLM/RAG projekty
- stavěl/a jsi interní nástroje pro práci s daty v AI
- vyznáš se v hybrid search, rerankingu nebo vlastních embedding modelech
- pracoval/a jsi na nástrojích pro hodnocení kvality dat (např. recall, grounding, detekce halucinací)
- rozumíš tomu, jak data ovlivňují chování agentů nebo jazykových modelů
Za to u nás získáš:
- dobré finanční ohodnocení odpovídající senioritě
- velmi dobrý work-life balanc
- časovou flexibilitu a pracovní autonomii
- příjemné prostředí technologické společnosti
- prostor pro osobní růst společně s firmou
- intenzivní sdílení znalostí v rámci interního týmu AI
- práce v týmu, který dbá na technickou kvalitu a čistou architekturu
- budeš mít prostor zkoušet nové věci, rychle doručovat a ovlivňovat směr vývoje
- motivační bonusový program
- 5 týdnů dovolené
- kurzy angličtiny v různých úrovních, i s rodilým mluvčím
- MultiSport kartu včetně doprovodné karty
- měsíční finanční příspěvek na stravování
- notebook, mobilní telefon
- klidné a prostorné kanceláře v Praze 7 (nemáme open space)
- chill-out relax zónu s občerstvením
- posilovnu zdarma přímo v budově
- výbornou kávu, ovoce a v létě zmrzlinu jako občerstvení
- kantýnu v budově nebo množství blízkých, i vegetariánských restaurací
- dobré spojení MHD od metra Palmovka, Vltavská nebo Nádraží Holešovice
Začít můžeš hned nebo za 2 měsíce.
Dej nám o sobě vědět!
Je to jednoduché a rychlé, pošli mi CV nebo odkaz na tvůj LinkedIn profil, obratem se s Tebou spojím a brzy jsi na palubě!
Gabriela Ferjaková
Head of Human Resources ZENTITY