MODELE LLM

Otwarte modele językowe gotowe do lokalnego wdrożenia na sprzęcie NVIDIA DGX Spark i ASUS GX10 Ascent — 128 GB zunifikowanej pamięci, ~1 PFLOP mocy obliczeniowej.

MoE OPENAI

GPT-OSS 120B

GPT-OSS 120B

Pierwszy otwarty model OpenAI od czasów GPT-2. Architektura Mixture-of-Experts: 117B parametrów, z czego tylko 5,1B aktywnych na token. Dorównuje o4-mini w benchmarkach rozumowania. Licencja Apache 2.0, natywne chain-of-thought i obsługa narzędzi. Mieści się na pojedynczym GPU 80 GB.

117B / 5.1B aktywnych 128K kontekst Apache 2.0
MoE META AI

Llama 4 Scout

Llama 4 Scout

Flagowy model open-source od Meta. Wersja „Scout" zoptymalizowana pod agentów autonomicznych i złożone zadania wieloetapowe. Architektura MoE z potężnym oknem kontekstowym, doskonała obsługa polskiego i wielu języków.

109B / 17B aktywnych 10M kontekst Llama License
MoE ZHIPU AI

GLM 4.7 Flash

GLM 4.7 Flash

Model typu Mixture-of-Experts od Zhipu AI (30B MoE). Gigantyczne okno kontekstowe 1M tokenów pozwala analizować całe regulaminy i akty prawne jednorazowo. Testowany lokalnie na ASUS GX10 — bezbłędna analiza Ustawy o rynku kryptoaktywów.

30B MoE 1M kontekst Apache 2.0
Dense GOOGLE

Gemma 4 31B

Gemma 4 31B

Najnowszy model od Google DeepMind (kwiecień 2026), zbudowany na bazie badań Gemini 3. Pozycja #3 wśród otwartych modeli na arenie Arena AI. Multimodalny — przetwarza tekst i obrazy, wbudowany tryb reasoning (thinking mode). Pokonuje Llama 4 w matematyce, kodowaniu i zadaniach agentowych.

31B dense 256K kontekst Apache 2.0
Dense + MoE ALIBABA

Qwen 3.6

Qwen 3.6

Dwa warianty od Alibaba: 27B (dense) — flagowy coding, przewyższa modele 15× większe w benchmarkach agentowych; 35B-A3B (MoE, 3B aktywnych) — 3-4× szybszy, idealny do RAG i narzędzi. Oba z kontekstem 256K i obsługą multimodalną.

27B + 35B/3B 256K kontekst Apache 2.0