Junior AI Data Engineer / lokalita Praha - Holešovice
Stavíme AI systémy, které využívají velké jazykové modely (LLM), agentní frameworky a chytré datové pipeline. Všechno to běží na datech: loading, filtering, vectorizing, chunking, embedding, storing, indexing, a retrieving.
Právě hledáme šikovného juniora nebo nadšence, který se chce ponořit do práce s moderním Python stackem a podpořit vývoj AI/ML aplikací.
Nečekej klasický BI job. Žádné dashboardy, žádné OLAP kostky. Jen rychlé, čisté pipeline a dobrá příprava dat pro chytré modely.
Co budeš dělat?
- stavět a udržovat lehké, přehledné Python pipeline pro naše AI systémy
- pracovat s nestrukturovanými a polostrukturovanými daty (texty, HTML, PDF, logy, API…)
- čistit, rozdělovat a normalizovat texty a metadata pro embedding a uložení
- pracovat s vektorovými databázemi (např. FAISS, Chroma, Weaviate) a s databázemi jako SQLite, DuckDB nebo Postgres
- spolupracovat s ML inženýry, aby data správně a efektivně tekla do LLM, agentů a nástrojů
- automatizovat stahování dat z API nebo uživatelského obsahu
- navrhovat datové toky tak, aby odpovídaly tomu, jak AI modely s daty pracují
- vyvíjet a spravovat backendové komponenty pro AI aplikace
- pomáhat s prompt/context engineeringem tím, že budeš připravovat kvalitní strukturovaná data pro spolehlivější výsledky od LLM
Stack, se kterým se naučíš pracovat:
- Python, Django
- Pandas
- AI nástroje: CrewAI, vlastní RAG logika, agenti
- vektorové DB: FAISS, Chroma, Qdrant, Weaviate, Pinecone
- databáze: SQL a NoSQL
- infra: Docker, GitHub Actions, Kubernetes, Celery, Kafka, Redis
Hledáme někoho, kdo…
- má 0 až 2 roky zkušeností v data engineeringu nebo s AI/ML
- umí psát čistý a srozumitelný Python kód
- ví (nebo tuší), co je embedding a jak funguje vyhledávání podle vektorové podobnosti
- už se zajímal/a o LLM a agentní frameworky (nebo ho to láká)
- raději něco postaví než jen analyzuje
- má chuť být součástí AI revoluce a tvořit její datový základ
- má dobrou znalost angličtiny
- bude rád součástí našeho onsite AI týmu v kancelářích v Praze 7 - Holešovicích
Body navíc, pokud…
- jsi postavil/a vlastní chatbot nebo AI appku (i klidně pro sebe)
- zkoušel/a jsi Hugging Face nebo transformers
- hrál/a sis s RAG pipelinami
- víš, jak rozdělení textu ovlivňuje výkon LLM
- máš za sebou experimenty s CrewAI, LangChain a spol
- nezalekneš se formátů jako JSONL, YAML, Markdown (a dalších “divnůstek”)
Za to u nás získáš:
- dobré finanční ohodnocení odpovídající tvým zkušenostem a znalostem, které poroste podle tvých získaných zkušeností
- velmi dobrý work-life balanc
- časovou flexibilitu a pracovní autonomii
- příjemné prostředí technologické společnosti
- intenzivní sdílení znalostí v rámci interního týmu AI
- motivační bonusový program
- 5 týdnů dovolené
- kurzy angličtiny v různých úrovních, i s rodilým mluvčím
- MultiSport kartu včetně doprovodné karty
- měsíční finanční příspěvek na stravování
- notebook, mobilní telefon
- klidné a prostorné kanceláře v Praze 7 (nemáme open space)
- chill-out relax zónu s občerstvením
- posilovnu zdarma přímo v budově
- výbornou kávu, ovoce a v létě zmrzlinu jako občerstvení
- kantýnu v budově nebo množství blízkých, i vegetariánských restaurací
- dobré spojení MHD od metra Palmovka, Vltavská nebo Nádraží Holešovice
Začít můžeš hned nebo za 2 měsíce.
Dej nám o sobě vědět!
Je to jednoduché a rychlé, pošli mi CV nebo odkaz na tvůj LinkedIn profil, obratem se s Tebou spojím a brzy jsi na palubě!
Gabriela Ferjaková
Head of Human Resources ZENTITY