Claude Sonnet 4.5: mejoras en código, agentes y seguridad

Rinde un 61,4% en OSWorld y lidera en SWE-bench Verified
Atiende tareas complejas más de 30 horas y genera hasta 64.000 tokens
Actualizaciones en Claude Code y nuevo Claude Agent SDK para agentes
Seguridad reforzada (ASL-3) y mismo precio: $3/$15 por millón de tokens

Imagen del modelo Claude Sonnet 4.5

Anthropic ha puesto en circulación Claude Sonnet 4.5, una evolución enfocada a programación, agentes y control del ordenador que busca consolidar a la plataforma en entornos profesionales. En un panorama con rivales de alto nivel, la compañía describe este lanzamiento como su modelo más afinado y útil para tareas de ingeniería hasta la fecha.

La nueva versión se apoya en la trayectoria de la familia Sonnet, que ya había mejorado razonamiento y codificación en anteriores iteraciones. A partir de esa base, 4.5 apunta a ampliar el alcance práctico con avances en persistencia de atención, uso de herramientas y productividad, manteniendo una estrategia prudente en seguridad y alineamiento.

Capacidades clave y mejoras de rendimiento

Según Anthropic, Claude Sonnet 4.5 es capaz de mantener el foco durante más de 30 horas en tareas complejas y de múltiples pasos, lo que favorece proyectos largos en los que se requiere continuidad de contexto. También admite salidas de hasta 64.000 tokens en una sola respuesta, y ofrece controles para ajustar el “tiempo de reflexión” previo a responder, equilibrando rapidez y detalle según la necesidad.

Contenido exclusivo - Clic Aquí ¿Cuáles son las mejores IA para generar textos?

En tareas reales frente al ordenador, la compañía reporta un 61,4% en OSWorld, un salto notable respecto al 42,2% de su predecesor en esta misma prueba. En escenarios prácticos, el modelo puede navegar por la web, completar hojas de cálculo y ejecutar acciones en aplicaciones de escritorio desde la extensión de Chrome, reduciendo la supervisión continua del usuario.

El terreno de la programación concentra la mayor parte de las mejoras. En la evaluación SWE-bench Verified, centrada en codificación aplicada a proyectos reales, Sonnet 4.5 se sitúa a la cabeza con un 77,2% (con configuraciones que aumentan la cifra bajo cómputo en paralelo). La propuesta de Anthropic es que el modelo cubra todo el ciclo de desarrollo: planificación, implementación, refactorización y mantenimiento de bases de código extensas.

Más allá del desarrollo puro, Anthropic señala usos que requieren flujos prolongados y coordinación de pasos: desde ciberseguridad y finanzas hasta productividad ofimática e investigación con datos internos y externos. En estos contextos, la promesa pasa por agentes más estables, capaces de sostener trabajos prolongados sin perder coherencia.

Herramientas para desarrolladores y ecosistema

El lanzamiento llega acompañado de novedades en Claude Code: puntos de control para guardar progresos y regresar a estados anteriores, como el historial de versiones, una interfaz de terminal renovada, extensión nativa para Visual Studio Code y mejoras en edición de contexto y memoria a través de la API para ejecutar tareas más largas.

Contenido exclusivo - Clic Aquí Verificar tendencias en tiempo real y resumir hilos de X con Grok

Anthropic también estrena el Claude Agent SDK, que replica la infraestructura que usa la compañía para construir sus propios agentes. El kit ofrece herramientas para memoria a largo plazo, sistemas de permisos y coordinación de subagentes, facilitando la creación de soluciones automatizadas que cooperen hacia objetivos comunes y conectividad segura con herramientas como WireGuard.

Como complemento, la firma habilita de forma temporal “Imagine with Claude”, una demostración que permite observar cómo el modelo genera software en tiempo real sin código predefinido. Esta vista previa, disponible por tiempo limitado para usuarios Max, ilustra el potencial del modelo en creación interactiva.

Seguridad, alineamiento y resiliencia

Anthropic enmarca Sonnet 4.5 en su nivel de protección AI Safety Level 3 (ASL-3), con filtros entrenados para detectar contenidos peligrosos, especialmente los relacionados con riesgos CBRN. La empresa afirma haber reducido falsos positivos por un factor de diez respecto a la versión inicial de estos clasificadores, y ofrece continuidad de conversación con Sonnet 4 si se produce un bloqueo por seguridad.

En paralelo, la compañía asegura que el modelo disminuye conductas no deseadas como la adulación o respuestas engañosas y refuerza defensas frente a intentos de prompt injection. Estas medidas apuntan a un uso más fiable en entornos corporativos, donde la ejecución de acciones automatizadas requiere controles y trazabilidad.

Contenido exclusivo - Clic Aquí Los mejores asistentes de IA gratuitos que puedes usar en Abril de 2025

Disponibilidad, plataformas y precios

Claude Sonnet 4.5 está disponible en Claude.ai (web, iOS y Android) y para desarrolladores vía Claude Developer Platform, con integración en servicios como Amazon Bedrock y Google Cloud Vertex AI. El plan gratuito funciona con límite de sesiones que se reinicia cada cinco horas y un número variable de mensajes según demanda. Los precios se mantienen: 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida.

Entre las novedades de acceso, la extensión de Claude para Chrome se va desplegando a los usuarios Max previamente inscritos en la lista de espera. Aunque los benchmarks sugieren mejoras sustanciales frente a iteraciones anteriores, Anthropic recuerda que el rendimiento real depende del caso de uso y del presupuesto de razonamiento configurado para cada tarea.

Con una combinación de avances en codificación, mayor autonomía para agentes y un enfoque más estricto en seguridad, Claude Sonnet 4.5 se posiciona como una opción sólida para equipos técnicos que necesitan continuidad y control en procesos largos, manteniendo costes estables y compatibilidad con el ecosistema ya desplegado de Anthropic.