- Rinde un 61,4% en OSWorld y lidera en SWE-bench Verified
- Atiende tareas complejas más de 30 horas y genera hasta 64.000 tokens
- Actualizaciones en Claude Code y nuevo Claude Agent SDK para agentes
- Seguridad reforzada (ASL-3) y mismo precio: $3/$15 por millón de tokens
Anthropic ha puesto en circulación Claude Sonnet 4.5, una evolución enfocada a programación, agentes y control del ordenador que busca consolidar a la plataforma en entornos profesionales. En un panorama con rivales de alto nivel, la compañía describe este lanzamiento como su modelo más afinado y útil para tareas de ingeniería hasta la fecha.
La nueva versión se apoya en la trayectoria de la familia Sonnet, que ya había mejorado razonamiento y codificación en anteriores iteraciones. A partir de esa base, 4.5 apunta a ampliar el alcance práctico con avances en persistencia de atención, uso de herramientas y productividad, manteniendo una estrategia prudente en seguridad y alineamiento.
Capacidades clave y mejoras de rendimiento
Según Anthropic, Claude Sonnet 4.5 es capaz de mantener el foco durante más de 30 horas en tareas complejas y de múltiples pasos, lo que favorece proyectos largos en los que se requiere continuidad de contexto. También admite salidas de hasta 64.000 tokens en una sola respuesta, y ofrece controles para ajustar el “tiempo de reflexión” previo a responder, equilibrando rapidez y detalle según la necesidad.
En tareas reales frente al ordenador, la compañía reporta un 61,4% en OSWorld, un salto notable respecto al 42,2% de su predecesor en esta misma prueba. En escenarios prácticos, el modelo puede navegar por la web, completar hojas de cálculo y ejecutar acciones en aplicaciones de escritorio desde la extensión de Chrome, reduciendo la supervisión continua del usuario.
El terreno de la programación concentra la mayor parte de las mejoras. En la evaluación SWE-bench Verified, centrada en codificación aplicada a proyectos reales, Sonnet 4.5 se sitúa a la cabeza con un 77,2% (con configuraciones que aumentan la cifra bajo cómputo en paralelo). La propuesta de Anthropic es que el modelo cubra todo el ciclo de desarrollo: planificación, implementación, refactorización y mantenimiento de bases de código extensas.
Más allá del desarrollo puro, Anthropic señala usos que requieren flujos prolongados y coordinación de pasos: desde ciberseguridad y finanzas hasta productividad ofimática e investigación con datos internos y externos. En estos contextos, la promesa pasa por agentes más estables, capaces de sostener trabajos prolongados sin perder coherencia.
Herramientas para desarrolladores y ecosistema
El lanzamiento llega acompañado de novedades en Claude Code: puntos de control para guardar progresos y regresar a estados anteriores, como el historial de versiones, una interfaz de terminal renovada, extensión nativa para Visual Studio Code y mejoras en edición de contexto y memoria a través de la API para ejecutar tareas más largas.
Anthropic también estrena el Claude Agent SDK, que replica la infraestructura que usa la compañía para construir sus propios agentes. El kit ofrece herramientas para memoria a largo plazo, sistemas de permisos y coordinación de subagentes, facilitando la creación de soluciones automatizadas que cooperen hacia objetivos comunes y conectividad segura con herramientas como WireGuard.
Como complemento, la firma habilita de forma temporal “Imagine with Claude”, una demostración que permite observar cómo el modelo genera software en tiempo real sin código predefinido. Esta vista previa, disponible por tiempo limitado para usuarios Max, ilustra el potencial del modelo en creación interactiva.
Seguridad, alineamiento y resiliencia
Anthropic enmarca Sonnet 4.5 en su nivel de protección AI Safety Level 3 (ASL-3), con filtros entrenados para detectar contenidos peligrosos, especialmente los relacionados con riesgos CBRN. La empresa afirma haber reducido falsos positivos por un factor de diez respecto a la versión inicial de estos clasificadores, y ofrece continuidad de conversación con Sonnet 4 si se produce un bloqueo por seguridad.
En paralelo, la compañía asegura que el modelo disminuye conductas no deseadas como la adulación o respuestas engañosas y refuerza defensas frente a intentos de prompt injection. Estas medidas apuntan a un uso más fiable en entornos corporativos, donde la ejecución de acciones automatizadas requiere controles y trazabilidad.
Disponibilidad, plataformas y precios
Claude Sonnet 4.5 está disponible en Claude.ai (web, iOS y Android) y para desarrolladores vía Claude Developer Platform, con integración en servicios como Amazon Bedrock y Google Cloud Vertex AI. El plan gratuito funciona con límite de sesiones que se reinicia cada cinco horas y un número variable de mensajes según demanda. Los precios se mantienen: 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida.
Entre las novedades de acceso, la extensión de Claude para Chrome se va desplegando a los usuarios Max previamente inscritos en la lista de espera. Aunque los benchmarks sugieren mejoras sustanciales frente a iteraciones anteriores, Anthropic recuerda que el rendimiento real depende del caso de uso y del presupuesto de razonamiento configurado para cada tarea.
Con una combinación de avances en codificación, mayor autonomía para agentes y un enfoque más estricto en seguridad, Claude Sonnet 4.5 se posiciona como una opción sólida para equipos técnicos que necesitan continuidad y control en procesos largos, manteniendo costes estables y compatibilidad con el ecosistema ya desplegado de Anthropic.
Soy un apasionado de la tecnología que ha convertido sus intereses «frikis» en profesión. Llevo más de 10 años de mi vida utilizando tecnología de vanguardia y trasteando todo tipo de programas por pura curiosidad. Ahora me he especializado en tecnología de ordenador y videojuegos. Esto es por que desde hace más de 5 años que trabajo redactando para varias webs en materia de tecnología y videojuegos, creando artículos que buscan darte la información que necesitas con un lenguaje entendible por todos.
Si tienes cualquier pregunta, mis conocimientos van desde todo lo relacionado con el sistema operativo Windows así como Android para móviles. Y es que mi compromiso es contigo, siempre estoy dispuesto a dedicarte unos minutos y ayudarte a resolver cualquier duda que tengas en este mundo de internet.