GPT-5: el modelo que unifica modalidades

OpenAI ha presentado GPT-5, un salto generacional que abandona la arquitectura de modelos separados para unificar texto, visión, audio y capacidad de acción en un único modelo end-to-end.

Arquitectura single-stream

La principal innovación técnica es la eliminación de los "encoders" especializados por modalidad. GPT-5 procesa todos los tipos de entrada en el mismo espacio de representación.

Capacidades de agencia

GPT-5 puede ejecutar acciones en ordenadores, navegar por internet y llamar a APIs externas de forma autónoma. OpenAI llama a esto "Operator Mode".

Precio y disponibilidad

El modelo estará disponible en la API con un precio de $15 por millón de tokens de entrada para la versión estándar y $75 para la versión con razonamiento extendido.