Chcete vedieť, kam došli slovenské AI modely? Nižšie nájdete prehľad najdôležitejších modelov k júnu 2026. Zmysel nie je „poraziť veľké americké modely“, ale slovenská jazyková sila a umiestnenie dát (dáta v EÚ/na Slovensku). Modely listujeme, nekorunujeme.

Prehľad

ModelVývojárCharakteristika
Mistral-SK-7bFEI TUKE + SAVotvorený generatívny model (Apache 2.0, 7 mld. parametrov, slovenský korpus)
SlovakBERTGerulata / KInITencoder pre NLP (MIT, ~100 mil. parametrov) — NIE chatbot
skLEPslovak-nlp (CC BY 4.0)slovenský benchmark na hodnotenie modelov — meradlo, nie model
EuroLLM / OpenEuroLLMEÚ projektypan-európske otvorené modely, ktoré zahŕňajú slovenčinu
Mistral / Le ChatMistral (Francúzsko, EÚ)realistická self-hostovateľná EÚ voľba

Slovenské a európske AI modely — Mistral-SK-7b (TUKE + SAV, otvorené váhy, Apache 2.0, 7 mld. parametrov, doučený na slovenskom korpuse), SlovakBERT (Gerulata/KInIT, MIT, ~100 mil. parametrov — ide o encoder pre NLP úlohy, NIE chatbota), benchmark skLEP a EÚ-suverénny Mistral (Francúzsko) — sú cenné najmä ako BYO-model vrstva, slovenská jazyková sila a možnosť ponechať dáta v EÚ. Neznamená to, že porážajú veľké americké modely vo výkone. Benchmarky od vývojárov sú tvrdenia, nie nezávisle overený fakt. Modely listujeme, nekorunujeme.

Ktoré modely existujú?

  • Mistral-SK-7b: slovenský generatívny model: doučený zo základu Mistral-7B na slovenskom korpuse (Araneum Slovacum), vytvorili ho slovenskí výskumníci (FEI TUKE + SAV). Otvorené váhy, licencia Apache 2.0. Akademický projekt, nie „lepší než GPT“; tvrdenia vývojárov nie sú nezávislý benchmark
  • SlovakBERT: prvý verejný veľký jazykový model pre slovenčinu (~100 mil. parametrov, RoBERTa-base, licencia MIT). POZOR: ide o encoder pre NLP úlohy (klasifikácia, sentiment, extrakcia), NIE o chatbota — nepoužije sa ako ChatGPT, ale ako základ pre slovenské NLP
  • skLEP: slovenský benchmark (General Language Understanding) na hodnotenie modelov — ide o meradlo, nie o samostatný model.
  • EuroLLM / OpenEuroLLM: pan-európske viacjazyčné otvorené modely, ktoré zahŕňajú slovenčinu ako jeden z mnohých jazykov. EuroLLM má otvorené váhy (Apache 2.0); OpenEuroLLM je rozpracovaný projekt — pozor: slovenčina je v zábere, ale v konzorciu OpenEuroLLM nie je slovenská inštitúcia ako partner [overiť]
  • Mistral / Le Chat: európsky poskytovateľ s otvorenými váhami modelov — BYO-model voľba mimo USA s históriou dátovej rezidencie/GDPR; realistická self-hostovateľná EÚ voľba pre slovenské workloady

Z pohľadu umiestnenia dát

Kde sa ukladajú moje dáta? Poskytovateľ s americkou materskou firmou môže spadať pod americký CLOUD Act, takže americké úrady môžu žiadať o prístup k dátam, aj keď ležia v EÚ. Dáta môžu ostať v EÚ — na Slovensku ale žiadny natívny región veľkých poskytovateľov nie je; najbližšie sú Frankfurt (AWS eu-central-1), Varšava (Poland Central) a Viedeň [overiť], všetky v EÚ. Ak chcete viac kontroly: zvoľte EÚ región, self-host vo vlastnom účte, prevádzku lokálne alebo európsky/otvorený model.

Self-hostingom otvoreného modelu (Mistral-SK-7b, SlovakBERT) alebo využitím EÚ regiónu (napr. Frankfurt alebo Varšava) môžu dáta ostať v EÚ/na Slovensku.

Ak potrebujete viac než len jedného chatbota, stojí za zváženie platforma, ktorá spojí rôzne AI funkcie — ako osFoundry (agentová AI, ktorá pripojí váš vlastný model a dá sa self-hostovať)

Prečítajte si aj

Tento článok je všeobecná informácia, nie právne ani daňové poradenstvo.