¿Qué es Llama 4 y por qué importa?

Meta Platforms ha lanzado oficialmente Llama 4, la cuarta generación de su familia de modelos de lenguaje de código abierto. Esta versión supone un salto cualitativo respecto a sus predecesoras: por primera vez, el modelo nace con capacidades multimodales nativas, es decir, puede procesar texto, imágenes y audio sin necesidad de adapters externos.

La importancia estratégica de este lanzamiento va más allá de las métricas técnicas. Meta está apostando por el código abierto como arma competitiva frente a OpenAI y Google, y Llama 4 es su declaración de intenciones más ambiciosa hasta la fecha.

Arquitectura técnica: Mixture of Experts escalado

El corazón de Llama 4 es una arquitectura Mixture of Experts (MoE) con 400 mil millones de parámetros totales, de los cuales solo 17 mil millones se activan por inferencia. Esto permite una eficiencia computacional sin precedentes.

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained(
    "meta-llama/Llama-4-Scout-17B-16E",
    device_map="auto",
    torch_dtype="auto"
)
tokenizer = AutoTokenizer.from_pretrained("meta-llama/Llama-4-Scout-17B-16E")
inputs = tokenizer("Explica la arquitectura MoE en tres párrafos:", return_tensors="pt")
output = model.generate(**inputs, max_new_tokens=512)
print(tokenizer.decode(output[0]))

Las tres variantes principales son:

  • Llama 4 Scout: 17B parámetros activos, contexto de 10 millones de tokens
  • Llama 4 Maverick: 17B activos, optimizado para razonamiento complejo
  • Llama 4 Behemoth: 288B activos, aún en entrenamiento

Capacidades multimodales

La integración visual es quizás el cambio más relevante para aplicaciones prácticas. Llama 4 puede analizar imágenes médicas, interpretar gráficos financieros y describir escenas complejas con un nivel de detalle comparable a GPT-4o.

"Llama 4 marca el momento en que el código abierto dejó de ser una alternativa inferior y se convirtió en una opción genuinamente competitiva." — Yann LeCun, Chief AI Scientist de Meta

Benchmarks: ¿supera a GPT-4o?

BenchmarkLlama 4 MaverickGPT-4oGemini 2.0 Pro
MMLU89.2%88.7%87.8%
HumanEval82.1%90.2%84.3%
MATH73.4%76.6%71.2%
GPQA Diamond69.8%53.6%65.4%

Implicaciones para desarrolladores

Para el ecosistema de desarrollo, este lanzamiento tiene consecuencias inmediatas:

  1. Hosting propio: empresas con datos sensibles pueden ejecutar un modelo de frontera en sus propias infraestructuras
  2. Costes reducidos: el modelo MoE reduce el coste de inferencia hasta un 60% respecto a modelos densos equivalentes
  3. Fine-tuning accesible: Meta publica los pesos completos con licencia comercial permisiva

Conclusión

Llama 4 es el modelo que los desarrolladores open source llevaban años esperando: poderoso, eficiente y libre de las restricciones de las APIs propietarias.