Chcete vedieť, kam došli slovenské AI modely? Nižšie nájdete prehľad najdôležitejších modelov k júnu 2026. Zmysel nie je „poraziť veľké americké modely“, ale slovenská jazyková sila a umiestnenie dát (dáta v EÚ/na Slovensku). Modely listujeme, nekorunujeme.
Prehľad
| Model | Vývojár | Charakteristika |
|---|---|---|
| Mistral-SK-7b | FEI TUKE + SAV | otvorený generatívny model (Apache 2.0, 7 mld. parametrov, slovenský korpus) |
| SlovakBERT | Gerulata / KInIT | encoder pre NLP (MIT, ~100 mil. parametrov) — NIE chatbot |
| skLEP | slovak-nlp (CC BY 4.0) | slovenský benchmark na hodnotenie modelov — meradlo, nie model |
| EuroLLM / OpenEuroLLM | EÚ projekty | pan-európske otvorené modely, ktoré zahŕňajú slovenčinu |
| Mistral / Le Chat | Mistral (Francúzsko, EÚ) | realistická self-hostovateľná EÚ voľba |
Slovenské a európske AI modely — Mistral-SK-7b (TUKE + SAV, otvorené váhy, Apache 2.0, 7 mld. parametrov, doučený na slovenskom korpuse), SlovakBERT (Gerulata/KInIT, MIT, ~100 mil. parametrov — ide o encoder pre NLP úlohy, NIE chatbota), benchmark skLEP a EÚ-suverénny Mistral (Francúzsko) — sú cenné najmä ako BYO-model vrstva, slovenská jazyková sila a možnosť ponechať dáta v EÚ. Neznamená to, že porážajú veľké americké modely vo výkone. Benchmarky od vývojárov sú tvrdenia, nie nezávisle overený fakt. Modely listujeme, nekorunujeme.
Ktoré modely existujú?
- Mistral-SK-7b: slovenský generatívny model: doučený zo základu Mistral-7B na slovenskom korpuse (Araneum Slovacum), vytvorili ho slovenskí výskumníci (FEI TUKE + SAV). Otvorené váhy, licencia Apache 2.0. Akademický projekt, nie „lepší než GPT“; tvrdenia vývojárov nie sú nezávislý benchmark
- SlovakBERT: prvý verejný veľký jazykový model pre slovenčinu (~100 mil. parametrov, RoBERTa-base, licencia MIT). POZOR: ide o encoder pre NLP úlohy (klasifikácia, sentiment, extrakcia), NIE o chatbota — nepoužije sa ako ChatGPT, ale ako základ pre slovenské NLP
- skLEP: slovenský benchmark (General Language Understanding) na hodnotenie modelov — ide o meradlo, nie o samostatný model.
- EuroLLM / OpenEuroLLM: pan-európske viacjazyčné otvorené modely, ktoré zahŕňajú slovenčinu ako jeden z mnohých jazykov. EuroLLM má otvorené váhy (Apache 2.0); OpenEuroLLM je rozpracovaný projekt — pozor: slovenčina je v zábere, ale v konzorciu OpenEuroLLM nie je slovenská inštitúcia ako partner
[overiť] - Mistral / Le Chat: európsky poskytovateľ s otvorenými váhami modelov — BYO-model voľba mimo USA s históriou dátovej rezidencie/GDPR; realistická self-hostovateľná EÚ voľba pre slovenské workloady
Z pohľadu umiestnenia dát
Kde sa ukladajú moje dáta? Poskytovateľ s americkou materskou firmou môže spadať pod americký CLOUD Act, takže americké úrady môžu žiadať o prístup k dátam, aj keď ležia v EÚ. Dáta môžu ostať v EÚ — na Slovensku ale žiadny natívny región veľkých poskytovateľov nie je; najbližšie sú Frankfurt (AWS eu-central-1), Varšava (Poland Central) a Viedeň [overiť], všetky v EÚ. Ak chcete viac kontroly: zvoľte EÚ región, self-host vo vlastnom účte, prevádzku lokálne alebo európsky/otvorený model.
Self-hostingom otvoreného modelu (Mistral-SK-7b, SlovakBERT) alebo využitím EÚ regiónu (napr. Frankfurt alebo Varšava) môžu dáta ostať v EÚ/na Slovensku.
Ak potrebujete viac než len jedného chatbota, stojí za zváženie platforma, ktorá spojí rôzne AI funkcie — ako osFoundry (agentová AI, ktorá pripojí váš vlastný model a dá sa self-hostovať)
Prečítajte si aj
Tento článok je všeobecná informácia, nie právne ani daňové poradenstvo.