OpenAI añade sandboxing al SDK de agentes para contener lo que hacen en producción
La actualización del Agents SDK introduce sandboxing nativo y una arquitectura que separa el control del agente de su entorno de cómputo, permitiendo tareas más largas y más seguras.

Hay un problema que cualquier equipo que haya desplegado un agente de IA en producción conoce bien: el agente hace lo que le pides, pero a veces también hace lo que no le pediste. Accede a un fichero que no debería. Ejecuta un comando fuera de su ámbito. Borra algo que era importante. Los agentes autónomos son útiles precisamente porque actúan con menos supervisión, pero esa misma autonomía es la fuente del riesgo.
OpenAI publicó ayer una actualización importante de su Agents SDK que ataca este problema desde la arquitectura. La solución se llama sandboxing, y aunque el concepto no es nuevo en ingeniería de software, integrarlo de forma nativa en el SDK cambia bastante las cosas para los equipos que construyen con agentes.
Qué es el sandboxing y por qué importa aquí
Un sandbox es un entorno de ejecución aislado: el agente puede leer y escribir ficheros, instalar dependencias, ejecutar código, pero solo dentro de un espacio delimitado. Si algo sale mal, el daño queda contenido. Si el proceso termina inesperadamente, el estado se puede recuperar.
El núcleo de la actualización es hacer el SDK compatible con proveedores de sandbox existentes —Cloudflare, Vercel, E2B, Modal, entre otros— de forma que los desarrolladores puedan conectar su propia infraestructura de contenedores o usar servicios gestionados sin tener que construir la capa de aislamiento desde cero. TechCrunch Antes, cada equipo resolvía esto a su manera o simplemente no lo resolvía.
La otra pieza clave es la separación del harness —la lógica de control del agente— del entorno de cómputo donde ejecuta. Esto tiene dos consecuencias prácticas: si el contenedor falla durante una tarea larga, el agente puede retomar desde el último punto de control en un entorno nuevo; y si se necesita escalar, distintos subagentes pueden ejecutar en sandboxes independientes en paralelo. The Decoder
Por qué esto es relevante más allá del detalle técnico
El Agents SDK original, lanzado hace poco más de un año, estaba pensado para chatbots. Según Steve Coffey, responsable técnico de la API de respuestas de OpenAI, el SDK original era esencialmente una herramienta para casos de uso conversacionales. Lo que el mercado ha pedido —y lo que la actualización intenta resolver— son agentes de «larga distancia»: sistemas que trabajan durante horas, ejecutan decenas de pasos encadenados, gestionan ficheros y bases de datos, y necesitan poder recuperarse si algo falla a mitad del proceso. The New Stack
Ese tipo de tarea —revisar un repositorio entero, analizar contratos, procesar miles de registros— es donde está el valor real para las empresas. Y es también donde el riesgo de que el agente haga algo inesperado es más alto. El sandboxing no elimina ese riesgo, pero lo contiene.
Las nuevas capacidades están disponibles desde hoy en Python, con soporte para TypeScript previsto en una próxima versión. OpenAI aplicará precios estándar de API. TechCrunch También ha anunciado la deprecación de la Assistants API para mediados de 2026, empujando a todos los desarrolladores hacia la nueva arquitectura basada en la Responses API.
Es un movimiento que dice algo sobre el estado del mercado: hace un año, la conversación era sobre qué podían hacer los agentes. Hoy, la conversación es sobre cómo hacerlos seguros cuando los sueltas en sistemas de producción reales. Eso es madurez de industria, aunque incipiente.
Fuentes
En la elaboración de este artículo se ha utilizado inteligencia artificial como apoyo en la investigación y redacción. El contenido ha sido revisado editorialmente antes de su publicación.