Alibaba presenta Qwen3-Coder con soporte para agentes de IA capaces de tomar decisiones independientes

El equipo de Qwen ha presentado oficialmente Qwen3-Coder, su generador de código más potente hasta la fecha, que apoya el enfoque de "agente". La estrella principal de la línea es Qwen3-Coder-480B-A35B-Instruct. Este es un modelo híbrido Mixture-of-Experts con 480 mil millones de parámetros (35 mil millones activos al mismo tiempo) que puede trabajar con un contexto de hasta 256,000 tokens de forma nativa y hasta 1 millón de tokens con extrapolación. En las pruebas, muestra resultados récord entre los modelos de código abierto en tareas de Codificación Agente, Uso de Navegador Agente y Uso de Herramientas Agente - al nivel de Claude Sonnet 4.
¿Qué es la codificación agente?
Qwen3-Coder fue creado no solo para generar código, sino también para trabajar como un "agente" que puede planificar, utilizar herramientas, recibir retroalimentación y tomar decisiones. En tareas del mundo real (p. ej., SWE-Bench), interactúa con el entorno en varios pasos, lo que requiere un complejo aprendizaje de RL de Largo Horizonte. Para ello, el equipo de Qwen ha levantado un sistema escalable de 20,000 entornos paralelos basados en Alibaba Cloud.
Características de Qwen3-Coder
- Entrenado en 7.5 billones de tokens, donde el 70% es código
- Soporta un contexto gigante de hasta 1 millón de tokens (con YaRN)
- Utilizando aprendizaje por refuerzo (Code RL) en tareas del mundo real para mejorar la ejecución del código
- Integración con herramientas para desarrolladores como Qwen Code (CLI), Claude Code e incluso OpenAI SDK
- Capacidad de trabajar tanto a través de la API como en el entorno local
Herramientas y APIs
La herramienta Qwen Code CLI basada en Gemini Code está disponible con el modelo. Te permite utilizar fácilmente Qwen3-Coder en tus propios proyectos, con soporte para indicaciones y funciones personalizadas. También proporciona trabajo a través de Claude Code y acceso API directo a través de Alibaba Cloud Model Studio.
¿Para qué sirve?
Qwen3-Coder se posiciona como un agente de codificación universal, desde la generación de sitios web hasta tareas de desarrollo complejas de múltiples pasos. El equipo de Qwen planea lanzar más tamaños de modelos para reducir los costos de implementación y está explorando oportunidades para la auto-mejora del agente.
Acerca de Qwen
Qwen es una serie de modelos de lenguaje a gran escala y soluciones de agentes del equipo Qwen de Alibaba, diseñados para generar texto, código, análisis de datos y escenarios de múltiples pasos utilizando herramientas. La última versión, Qwen3-Coder, está construida sobre una arquitectura de Mixture-of-Experts con 480 mil millones de parámetros (35 mil millones activos), soporta hasta 256,000 tokens de contexto de forma nativa y hasta 1 millón con extrapolación, y demuestra resultados de nivel de modelo cerrado como Claude Sonnet 4 en SWE-Bench, Codificación Agente, Uso de Navegador y Uso de Herramientas. El modelo se integra con el OpenAI SDK, herramientas CLI (Qwen Code, Claude Code), API de Alibaba Cloud y apoya ecosistemas de GitHub y Hugging Face, utilizando aprendizaje por refuerzo en tareas de codificación del mundo real para mejorar la precisión y eficiencia.