Saltar al contenido

A Javryx Systems project

Frontier Benchmarks AI

Ground truth, with a map.

Encuentra el LLM correcto para tu tarea, tu hardware y tu presupuesto. 128 modelos frontier · 31 benchmarks verificados · 28 empresas.

Frontera por empresa

Un vendor a la vez — el flagship que cada uno de los 28 labs esta enviando ahora mismo.

Ver todos →
Anthropic US
Flagship
Claude Fable 5
2026-06 · thinking
Frontier Index 98.7
Google DeepMind US
Flagship
Gemini 3.1 Pro
2026-02 · hybrid
Frontier Index 89.2
OpenAI US
Flagship
GPT-5.5
2026-04 · thinking
Frontier Index 85.6
Alibaba CN
Flagship
Qwen3.7-Max
2026-05 · reasoning
Frontier Index 81.2
Zhipu AI CN
Flagship
GLM-5.2
2026-06 · hybrid
Frontier Index 77.1
DeepSeek CN
Flagship
DeepSeek V4 Pro
2026-04 · hybrid
Frontier Index 69.5
MiniMax CN
Flagship
MiniMax M3
2026-06 · reasoning
Frontier Index 67.9
Moonshot AI CN
Flagship
Kimi K2.6
2026-04 · hybrid
Frontier Index 65.4
ByteDance CN
Flagship
Doubao Seed 2.0 Pro
2026-02 · reasoning
Frontier Index 58.8
LG AI Research KR
Flagship
EXAONE 4.5 33B
2026-04 · multimodal
Frontier Index 36.9
Tencent CN
Flagship
Hunyuan Hy3-preview
2026-04 · hybrid
Frontier Index 35
Nvidia US
Flagship
Nemotron 3 Ultra 550B-A55B
2026-06 · reasoning
Frontier Index 34.9
xAI US
Flagship
Grok 4.3
2026-04 · reasoning
Meta US
Flagship
Muse Spark
2026-04 · reasoning
Frontier Index 0
Mistral AI FR
Flagship
Mistral Medium 3.5
2026-04 · hybrid
Frontier Index 0
Cohere CA
Flagship
Command A+
2026-05 · multimodal
Reka US
Flagship
Reka Flash 3.1
2025-07 · reasoning
Frontier Index 0
AI21 Labs IL
Flagship
Jamba 1.7 Large
2025-07 · chat
Frontier Index 0
Baidu CN
Flagship
ERNIE 5.1
2026-05 · reasoning
Apple US
Flagship
AFM Server
2025-07 · chat
Amazon US
Flagship
Amazon Nova 2 Omni
2025-12 · multimodal
Samsung KR
Flagship
Samsung Gauss 2.3
2025-09 · hybrid
Xiaomi CN
Flagship
MiMo V2.5 Pro
2026-04 · hybrid
Frontier Index 0
Ant Group CN
Flagship
Ring-2.6-1T
2026-05 · reasoning
Frontier Index 0
01.AI CN
Sin flagship activo
StepFun CN
Sin flagship activo
Inflection AI US
Sin flagship activo
Microsoft US
Sin flagship activo

Ambas capas, un solo lugar

Por un lado leaderboard riguroso: rankings, scores y comparativas verificadas. Por otro atlas decisional: hardware checker, use case wizard, pricing TCO. Las dos capas integradas son nuestro wedge competitivo.