GPT-5: el modelo que unifica modalidades
OpenAI ha presentado GPT-5, un salto generacional que abandona la arquitectura de modelos separados para unificar texto, visión, audio y capacidad de acción en un único modelo end-to-end.
Arquitectura single-stream
La principal innovación técnica es la eliminación de los "encoders" especializados por modalidad. GPT-5 procesa todos los tipos de entrada en el mismo espacio de representación.
Capacidades de agencia
GPT-5 puede ejecutar acciones en ordenadores, navegar por internet y llamar a APIs externas de forma autónoma. OpenAI llama a esto "Operator Mode".
Precio y disponibilidad
El modelo estará disponible en la API con un precio de $15 por millón de tokens de entrada para la versión estándar y $75 para la versión con razonamiento extendido.




