Hardware Checker
What LLM can I run on my PC? Pick your GPU, choose a quantization and a context, and the checker classifies all 128 models in the atlas into S/A/B/C/D/F tiers.
Your hardware
Result · 24 GB VRAM · Q4_K_M · context 8,000
Cabe en Q4_K_M con margen amplio (4 GB / 24 GB). Contexto largo y batching OK.
Cabe comodo en Q4_K_M (14 GB / 24 GB). Margen para batch normal.
Cabe comodo en Q4_K_M (14 GB / 24 GB). Margen para batch normal.
Cabe comodo en Q4_K_M (16 GB / 24 GB). Margen para batch normal. (MoE: 25.2B totales, 3.8B activos — VRAM = totales).
Cabe justo en Q4_K_M (17 GB / 24 GB). Sin margen para batch grande.
Cabe justo en Q4_K_M (19 GB / 24 GB). Sin margen para batch grande.
Cabe justo en Q4_K_M (19 GB / 24 GB). Sin margen para batch grande. (MoE: 31.6B totales, 3.2B activos — VRAM = totales).
Cabe justo en Q4_K_M (20 GB / 24 GB). Sin margen para batch grande.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
No corre en Q4_K_M (60 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 109B totales, 17B activos — VRAM = totales).
No corre en Q4_K_M (61 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
No corre en Q4_K_M (61 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
No corre en Q4_K_M (65 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 119B totales, 6B activos — VRAM = totales).
No corre en Q4_K_M (65 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 120B totales, 12B activos — VRAM = totales).
No corre en Q4_K_M (105 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 196B totales, 11B activos — VRAM = totales).
No corre en Q4_K_M (106 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 198B totales, 11B activos — VRAM = totales).
No corre en Q4_K_M (123 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 230B totales, 10B activos — VRAM = totales).
No corre en Q4_K_M (126 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 236B totales, 23B activos — VRAM = totales).
No corre en Q4_K_M (151 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 284B totales, 13B activos — VRAM = totales).
No corre en Q4_K_M (157 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 295B totales, 21B activos — VRAM = totales).
No corre en Q4_K_M (164 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 309B totales, 15B activos — VRAM = totales).
No corre en Q4_K_M (165 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 310B totales, 15B activos — VRAM = totales).
No corre en Q4_K_M (171 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 321B totales, 38B activos — VRAM = totales).
No corre en Q4_K_M (190 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 357B totales, 32B activos — VRAM = totales).
No corre en Q4_K_M (211 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 398B totales, 94B activos — VRAM = totales).
No corre en Q4_K_M (212 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 400B totales, 17B activos — VRAM = totales).
No corre en Q4_K_M (227 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 428B totales, 23B activos — VRAM = totales).
No corre en Q4_K_M (241 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 456B totales, 45.9B activos — VRAM = totales).
No corre en Q4_K_M (354 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 671B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (356 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 675B totales, 41B activos — VRAM = totales).
No corre en Q4_K_M (361 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (361 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (392 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 744B totales, 40B activos — VRAM = totales).
No corre en Q4_K_M (392 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 744B totales, 40B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 42B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 32B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 32B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 63B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 63B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 35B activos — VRAM = totales).
No corre en Q4_K_M (841 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1600B totales, 49B activos — VRAM = totales).
No corre en Q4_K_M (1050 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 2000B totales, 288B activos — VRAM = totales).
No corre en Q4_K_M (1260 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
Estimate = params * bytes_per_param + KV cache + overhead. For MoE we use total params (not active), because every expert sits in VRAM.
How the math works
Formula: VRAM = params × bytes_per_param + KV_cache(context) + overhead
- bytes_per_param: FP16 = 2.0, Q8_0 = 1.06, Q5_K_M = 0.69, Q4_K_M = 0.56, Q3_K_M = 0.44, Q2_K = 0.31
- KV cache: ~0.5-5 KB per token depending on model size (scales with num_layers × head_dim)
- Overhead: ~1.5 GB constant (CUDA/Metal runtime + framework)
- MoE caveat: for Mixture-of-Experts (Llama 4 Maverick, DeepSeek V3.2, GLM-5.1, etc.) we use total params — every expert sits in VRAM even if only a few activate per token. Compute uses only the active ones.
- Apple Silicon: effective VRAM is 75% of unified RAM (Metal Performance Shaders).
Best-effort estimate. Real numbers can vary 5-15% depending on framework (llama.cpp, vLLM, transformers), batch size and KV-cache compression. For production inference, benchmarks with your workload are the source of truth.