AI Dataset Engineer pro vesmírný start-up 🚀🛰
O nás
Zaitra je start-up založený v roce 2020, který se zaměřuje na letový software a řešení založené na umělé inteligenci pro družice a další vesmírné mise 🛰. Firma pracuje na projektech pro Evropskou vesmírnou agenturu i pro komerční zákazníky.
O jakou pozici se jedná?
Hledáme Dataset Engineera, který nám pomůže udržet pořádek v rostoucím množství dat a zajistí, že naše AI modely budou mít vždy k dispozici kvalitní a dobře připravené datasety. Budeš hrát klíčovou roli při správě a organizaci dat pro trénování modelů.
Mezi tvoje úkoly bude patřit:
- Spravovat a katalogizovat datasety (lokálně i v cloudu, např. S3).
- Navrhovat a udržovat spolehlivé lokální datové mirrory pro rychlý přístup a zálohování.
- Navrhovat a spravovat systém pro anotaci dat a dohlížet na kvalitu labelů.
- Vytvářet formáty datasetů pro různé ML úlohy (klasifikace, segmentace, detekce objektů atd.) tak, aby byly úsporné na místo a rychlé na načítání.
- Převádět různé datasety do jednotného formátu pro trénování modelů.
- Vyvíjet nástroje pro vyhledávání dat obsahujících konkrétní objekty, události nebo vzory pro anotaci a trénink.
- Hledat a vyhodnocovat veřejné datasety vhodné pro naše projekty.
- Spolupracovat s partnery při získávání komerčních dat.
- Pomáhat týmu se správou úložišť a optimalizací datových workflow.
Co by ti nemělo chybět?
- Dobré organizační schopnosti a zkušenost se správou větších datasetů.
- Zkušenost s anotací dat (labelování, kontrola kvality).
- Praxi s cloudovým úložištěm (např. AWS S3) a verzováním dat.
- Solidní Python skills.
- Základní orientaci v databázích a nástrojích pro vyhledávání ve velkých datasetech (např. EarthExplorer).
- Zájem o kosmické projekty a moderní AI.
Co nabízíme?
- Hybridní režim práce (ideálně alespoň 3 dny týdně v kanceláři).
- ⏰️ Flexibilní pracovní dobu.
- 🏙️ Moderní kanceláře blízko centra Brna.
- 🛰️ Reálný dopad na produkty pro kosmické mise.
- 🌎 Možnost pracovat na řešeních, která poletí na oběžnou dráhu (a dál).
- 🏝️ 5 týdnů dovolené.
- 🍇 Stravenky.
- 🤝 Teambuildingy a firemní akce.
- 🏄🏼♂️ Multisport karta.
Co je pro nás plus?
- Zkušenosti s ML datasety a běžnými formáty (COCO, Pascal VOC apod.).
- Znalost nástrojů jako CVAT, Label Studio nebo podobných.
- Zkušenost se satelitními snímky nebo Earth observation daty.
- Přehled o správě metadat a návrhu schémat pro efektivní vyhledávání.
- Zkušenost s verzováním datasetů (např. DVC, Git LFS).
Chceš se přidat k nám do týmu?
- Pošli nám své CV s krátkým představením
- Dáme si 30 minutový call s naším CTO Radem a HR Petrou
- Domů dostaneš na vypracování krátký úkol
- Projdeme si tvůj úkol a další dotazy na 60minutovém technickém kole
- A pak už ti pošleme nabídku! 😊
