FB Frontier Benchmarks AI

Hardware Checker

What LLM can I run on my PC? Pick your GPU, choose a quantization and a context, and the checker classifies all 128 models in the atlas into S/A/B/C/D/F tiers.

Your hardware

GPU GPU count (multi-GPU tensor-parallel)

1 × 24 GB = 24 GB

Quantization

Typical context

Result · 24 GB VRAM · Q4_K_M · context 8,000

Only what runs (S/A/B/C)

Cabe en Q4_K_M con margen amplio (4 GB / 24 GB). Contexto largo y batching OK.

Need: 4.1 GBHave: 24 GB

Cabe comodo en Q4_K_M (14 GB / 24 GB). Margen para batch normal.

Need: 13.5 GBHave: 24 GB

Cabe comodo en Q4_K_M (14 GB / 24 GB). Margen para batch normal.

Need: 13.5 GBHave: 24 GB

Gemma 4 26B-A4B

Google DeepMind

Cabe comodo en Q4_K_M (16 GB / 24 GB). Margen para batch normal. (MoE: 25.2B totales, 3.8B activos — VRAM = totales).

Need: 15.7 GBHave: 24 GB

Cabe justo en Q4_K_M (17 GB / 24 GB). Sin margen para batch grande.

Need: 16.7 GBHave: 24 GB

Gemma 4 (31B dense)

Google DeepMind

Cabe justo en Q4_K_M (19 GB / 24 GB). Sin margen para batch grande.

Need: 18.6 GBHave: 24 GB

Nemotron 3 Nano

Cabe justo en Q4_K_M (19 GB / 24 GB). Sin margen para batch grande. (MoE: 31.6B totales, 3.2B activos — VRAM = totales).

Need: 19.1 GBHave: 24 GB

Cabe justo en Q4_K_M (20 GB / 24 GB). Sin margen para batch grande.

Need: 19.8 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

GPT-5.5 Instant

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Claude Mythos 5

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Claude Opus 4.8

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Claude Opus 4.7

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Claude Mythos Preview

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Claude Opus 4.6

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Claude Sonnet 4.6

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Claude Opus 4.5

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Claude Haiku 4.5

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Gemini 3.5 Flash

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Gemini 3 Deep Think

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Gemini 3.1 Flash-Lite

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Gemini 3.1 Flash Live

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Google DeepMind

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Grok 4.20 Heavy

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Mistral Medium 3.5

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Devstral Small 2

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Magistral Medium 1.2

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Codestral 25.08

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Qwen3.6 Max Preview

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Qwen3.6-35B-A3B

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Qwen3-Coder-Next

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Qwen3.5-397B-A17B

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Qwen3.5-Omni-Plus

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Qwen3-Max-Thinking

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

ERNIE 5.1 Preview

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

ERNIE 4.5 VL Thinking

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Doubao Seed 2.0 Mini

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Doubao Seed 2.0 Code

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Doubao Seed 2.0 Pro

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Doubao Seed 2.0 Lite

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Nemotron 3 Ultra 550B-A55B

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Nemotron 3 Nano Omni

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Amazon Nova 2 Omni

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Inflection-3 Pi

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Inflection-3 Productivity

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Samsung Gauss2 Supreme

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Samsung Gauss 2.3

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

Modelo sin params publicados — no se puede estimar VRAM.

Need: 0.0 GBHave: 24 GB

No corre en Q4_K_M (60 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 109B totales, 17B activos — VRAM = totales).

Need: 59.6 GBHave: 24 GB

No corre en Q4_K_M (61 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.

Need: 60.7 GBHave: 24 GB

Command A Reasoning

No corre en Q4_K_M (61 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.

Need: 60.7 GBHave: 24 GB

Mistral Small 4

No corre en Q4_K_M (65 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 119B totales, 6B activos — VRAM = totales).

Need: 64.9 GBHave: 24 GB

Nemotron 3 Super

No corre en Q4_K_M (65 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 120B totales, 12B activos — VRAM = totales).

Need: 65.4 GBHave: 24 GB

No corre en Q4_K_M (105 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 196B totales, 11B activos — VRAM = totales).

Need: 105.2 GBHave: 24 GB

No corre en Q4_K_M (106 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 198B totales, 11B activos — VRAM = totales).

Need: 106.2 GBHave: 24 GB

No corre en Q4_K_M (123 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 230B totales, 10B activos — VRAM = totales).

Need: 123.0 GBHave: 24 GB

K-EXAONE 236B-A23B

No corre en Q4_K_M (126 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 236B totales, 23B activos — VRAM = totales).

Need: 126.2 GBHave: 24 GB

DeepSeek V4 Flash

No corre en Q4_K_M (151 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 284B totales, 13B activos — VRAM = totales).

Need: 151.3 GBHave: 24 GB

Hunyuan Hy3-preview

No corre en Q4_K_M (157 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 295B totales, 21B activos — VRAM = totales).

Need: 157.1 GBHave: 24 GB

No corre en Q4_K_M (164 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 309B totales, 15B activos — VRAM = totales).

Need: 164.4 GBHave: 24 GB

No corre en Q4_K_M (165 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 310B totales, 15B activos — VRAM = totales).

Need: 164.9 GBHave: 24 GB

No corre en Q4_K_M (171 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 321B totales, 38B activos — VRAM = totales).

Need: 170.7 GBHave: 24 GB

No corre en Q4_K_M (190 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 357B totales, 32B activos — VRAM = totales).

Need: 189.6 GBHave: 24 GB

Jamba 1.7 Large

No corre en Q4_K_M (211 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 398B totales, 94B activos — VRAM = totales).

Need: 211.0 GBHave: 24 GB

Llama 4 Maverick

No corre en Q4_K_M (212 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 400B totales, 17B activos — VRAM = totales).

Need: 212.1 GBHave: 24 GB

No corre en Q4_K_M (227 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 428B totales, 23B activos — VRAM = totales).

Need: 226.7 GBHave: 24 GB

No corre en Q4_K_M (241 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 456B totales, 45.9B activos — VRAM = totales).

Need: 241.4 GBHave: 24 GB

No corre en Q4_K_M (354 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 671B totales, 37B activos — VRAM = totales).

Need: 354.0 GBHave: 24 GB

Mistral Large 3

No corre en Q4_K_M (356 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 675B totales, 41B activos — VRAM = totales).

Need: 356.1 GBHave: 24 GB

DeepSeek V3.2 Speciale

No corre en Q4_K_M (361 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).

Need: 361.4 GBHave: 24 GB

DeepSeek R1 0528

No corre en Q4_K_M (361 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).

Need: 361.4 GBHave: 24 GB

No corre en Q4_K_M (392 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 744B totales, 40B activos — VRAM = totales).

Need: 392.3 GBHave: 24 GB

No corre en Q4_K_M (392 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 744B totales, 40B activos — VRAM = totales).

Need: 392.3 GBHave: 24 GB

No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 42B activos — VRAM = totales).

Need: 526.4 GBHave: 24 GB

No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 32B activos — VRAM = totales).

Need: 526.4 GBHave: 24 GB

No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 32B activos — VRAM = totales).

Need: 526.4 GBHave: 24 GB

No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 63B activos — VRAM = totales).

Need: 526.4 GBHave: 24 GB

No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 63B activos — VRAM = totales).

Need: 526.4 GBHave: 24 GB

No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 35B activos — VRAM = totales).

Need: 526.4 GBHave: 24 GB

DeepSeek V4 Pro

No corre en Q4_K_M (841 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1600B totales, 49B activos — VRAM = totales).

Need: 840.7 GBHave: 24 GB

Llama 4 Behemoth

No corre en Q4_K_M (1050 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 2000B totales, 288B activos — VRAM = totales).

Need: 1050.3 GBHave: 24 GB

No corre en Q4_K_M (1260 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.

Need: 1259.8 GBHave: 24 GB

Estimate = params * bytes_per_param + KV cache + overhead. For MoE we use total params (not active), because every expert sits in VRAM.

How the math works

Formula: VRAM = params × bytes_per_param + KV_cache(context) + overhead

bytes_per_param: FP16 = 2.0, Q8_0 = 1.06, Q5_K_M = 0.69, Q4_K_M = 0.56, Q3_K_M = 0.44, Q2_K = 0.31
KV cache: ~0.5-5 KB per token depending on model size (scales with num_layers × head_dim)
Overhead: ~1.5 GB constant (CUDA/Metal runtime + framework)
MoE caveat: for Mixture-of-Experts (Llama 4 Maverick, DeepSeek V3.2, GLM-5.1, etc.) we use total params — every expert sits in VRAM even if only a few activate per token. Compute uses only the active ones.
Apple Silicon: effective VRAM is 75% of unified RAM (Metal Performance Shaders).

Best-effort estimate. Real numbers can vary 5-15% depending on framework (llama.cpp, vLLM, transformers), batch size and KV-cache compression. For production inference, benchmarks with your workload are the source of truth.

Tiers explained

S — Fits with 2x+ headroom. Big batch, long context OK.

A — Comfortable fit (1.5-2x). Margin for normal batch.

B — Tight fit (1.1-1.5x). No big batch.

C — At the edge (0.9-1.1x). Consider lower quant or trimming context.

D — Requires offloading to RAM (slow). Better with lower quant.

F — Will not run. Need more VRAM or much lower quant.