MODELE LLM

Otwarte modele językowe gotowe do lokalnego wdrożenia na sprzęcie NVIDIA DGX Spark i ASUS GX10 Ascent — 128 GB zunifikowanej pamięci, ~1 PFLOP mocy obliczeniowej.

MoE MINIMAX

MiniMax M2.7

Największy model, jaki uruchomiliśmy lokalnie: 230B MoE (10B aktywnych), „samodoskonalący się" agent z natywnym tool-callingiem. Na SWE-bench Verified wyprzedza Claude Opus. Serwowany z naszego klastra 2× DGX Spark: 33–36 tok/s, kontekst 131K tokenów.

230B / 10B aktywnych 131K kontekst Klaster 2× Spark

MoE OPENAI

GPT-OSS 120B

Pierwszy otwarty model OpenAI od czasów GPT-2. Architektura Mixture-of-Experts: 117B parametrów, z czego tylko 5,1B aktywnych na token. Dorównuje o4-mini w benchmarkach rozumowania. Licencja Apache 2.0, natywne chain-of-thought i obsługa narzędzi. Mieści się na pojedynczym GPU 80 GB.

117B / 5.1B aktywnych 128K kontekst Apache 2.0

MoE META AI

Llama 4 Scout

Flagowy model open-source od Meta. Wersja „Scout" zoptymalizowana pod agentów autonomicznych i złożone zadania wieloetapowe. Architektura MoE z potężnym oknem kontekstowym, doskonała obsługa polskiego i wielu języków.

109B / 17B aktywnych 10M kontekst Llama License

MoE ZHIPU AI

GLM 4.7 Flash

Model typu Mixture-of-Experts od Zhipu AI (30B MoE). Gigantyczne okno kontekstowe 1M tokenów pozwala analizować całe regulaminy i akty prawne jednorazowo. Testowany lokalnie na ASUS GX10 — bezbłędna analiza Ustawy o rynku kryptoaktywów.

30B MoE 1M kontekst Apache 2.0

Dense GOOGLE

Gemma 4 31B

Najnowszy model od Google DeepMind (kwiecień 2026), zbudowany na bazie badań Gemini 3. Pozycja #3 wśród otwartych modeli na arenie Arena AI. Multimodalny — przetwarza tekst i obrazy, wbudowany tryb reasoning (thinking mode). Pokonuje Llama 4 w matematyce, kodowaniu i zadaniach agentowych.

31B dense 256K kontekst Apache 2.0

Dense + MoE ALIBABA

Qwen 3.6

Dwa warianty od Alibaba: 27B (dense) — flagowy coding, przewyższa modele 15× większe w benchmarkach agentowych; 35B-A3B (MoE, 3B aktywnych) — 3-4× szybszy, idealny do RAG i narzędzi. Oba z kontekstem 256K i obsługą multimodalną.

27B + 35B/3B 256K kontekst Apache 2.0

Grafika IDEOGRAM AI

Ideogram 4

Otwarty model graficzny (9.3B DiT) sterowany ustrukturyzowanym JSON-em: osobna kontrola każdego obiektu, kompozycji i typografii, edycja pojedynczego elementu bez ruszania reszty kadru. Uruchomiony lokalnie na ASUS GX10 (fp8, ~19 GB). Na stronie: demo + konkurs z bonem 2000 zł.

9.3B DiT Prompt JSON Natywne 2K