Hardware Checker
¿Que LLM puedo correr en mi PC? Inputa tu GPU, elige una cuantizacion y context, y el checker clasifica los 128 modelos del atlas en tiers S/A/B/C/D/F.
Tu hardware
Resultado · 24 GB VRAM · Q4_K_M · context 8,000
Cabe en Q4_K_M con margen amplio (4 GB / 24 GB). Contexto largo y batching OK.
Cabe comodo en Q4_K_M (14 GB / 24 GB). Margen para batch normal.
Cabe comodo en Q4_K_M (14 GB / 24 GB). Margen para batch normal.
Cabe comodo en Q4_K_M (16 GB / 24 GB). Margen para batch normal. (MoE: 25.2B totales, 3.8B activos — VRAM = totales).
Cabe justo en Q4_K_M (17 GB / 24 GB). Sin margen para batch grande.
Cabe justo en Q4_K_M (19 GB / 24 GB). Sin margen para batch grande.
Cabe justo en Q4_K_M (19 GB / 24 GB). Sin margen para batch grande. (MoE: 31.6B totales, 3.2B activos — VRAM = totales).
Cabe justo en Q4_K_M (20 GB / 24 GB). Sin margen para batch grande.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
Modelo sin params publicados — no se puede estimar VRAM.
No corre en Q4_K_M (60 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 109B totales, 17B activos — VRAM = totales).
No corre en Q4_K_M (61 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
No corre en Q4_K_M (61 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
No corre en Q4_K_M (65 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 119B totales, 6B activos — VRAM = totales).
No corre en Q4_K_M (65 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 120B totales, 12B activos — VRAM = totales).
No corre en Q4_K_M (105 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 196B totales, 11B activos — VRAM = totales).
No corre en Q4_K_M (106 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 198B totales, 11B activos — VRAM = totales).
No corre en Q4_K_M (123 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 230B totales, 10B activos — VRAM = totales).
No corre en Q4_K_M (126 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 236B totales, 23B activos — VRAM = totales).
No corre en Q4_K_M (151 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 284B totales, 13B activos — VRAM = totales).
No corre en Q4_K_M (157 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 295B totales, 21B activos — VRAM = totales).
No corre en Q4_K_M (164 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 309B totales, 15B activos — VRAM = totales).
No corre en Q4_K_M (165 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 310B totales, 15B activos — VRAM = totales).
No corre en Q4_K_M (171 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 321B totales, 38B activos — VRAM = totales).
No corre en Q4_K_M (190 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 357B totales, 32B activos — VRAM = totales).
No corre en Q4_K_M (211 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 398B totales, 94B activos — VRAM = totales).
No corre en Q4_K_M (212 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 400B totales, 17B activos — VRAM = totales).
No corre en Q4_K_M (227 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 428B totales, 23B activos — VRAM = totales).
No corre en Q4_K_M (241 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 456B totales, 45.9B activos — VRAM = totales).
No corre en Q4_K_M (354 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 671B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (356 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 675B totales, 41B activos — VRAM = totales).
No corre en Q4_K_M (361 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (361 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 685B totales, 37B activos — VRAM = totales).
No corre en Q4_K_M (392 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 744B totales, 40B activos — VRAM = totales).
No corre en Q4_K_M (392 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 744B totales, 40B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 42B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 32B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 32B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 63B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 63B activos — VRAM = totales).
No corre en Q4_K_M (526 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1000B totales, 35B activos — VRAM = totales).
No corre en Q4_K_M (841 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 1600B totales, 49B activos — VRAM = totales).
No corre en Q4_K_M (1050 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M. (MoE: 2000B totales, 288B activos — VRAM = totales).
No corre en Q4_K_M (1260 GB / 24 GB). Necesitas mas VRAM o quant Q3_K_M.
Estimacion = params * bytes_per_param + KV cache + overhead. Para MoE usamos params totales (no activos), porque todos los expertos cargan en VRAM.
Como funciona el calculo
Formula: VRAM = params × bytes_per_param + KV_cache(context) + overhead
- bytes_per_param: FP16 = 2.0, Q8_0 = 1.06, Q5_K_M = 0.69, Q4_K_M = 0.56, Q3_K_M = 0.44, Q2_K = 0.31
- KV cache: ~0.5-5 KB por token segun tamaño de modelo (escala con num_layers × head_dim)
- Overhead: ~1.5 GB constante (CUDA/Metal runtime + framework)
- MoE caveat: para Mixture-of-Experts (Llama 4 Maverick, DeepSeek V3.2, GLM-5.1, etc.) usamos params totales — todos los expertos cargan en VRAM aunque solo unos pocos se activen por token. Solo el compute usa los activos.
- Apple Silicon: la VRAM efectiva es 75% de la RAM unificada (Metal Performance Shaders).
Estimacion best-effort. Numbers reales pueden variar 5-15% segun framework (llama.cpp, vLLM, transformers), batch size y kv-cache compression. Para inference en produccion, benchmarks con tu workload son la fuente de verdad.