Soneto 4.5 de Claude: Un salto na codificación, os axentes e o uso do ordenador

Última actualización: 02/10/2025

  • Ten un rendemento do 61,4 % en OSWorld e é líder en SWE-bench. Verificado.
  • Xestiona tarefas complexas durante máis de 30 horas e xera ata 64.000 tokens
  • Actualizacións de Claude Code e do novo SDK de axentes de Claude para axentes
  • Seguridade mellorada (ASL-3) e mesmo prezo: 3 $/15 $ por millón de tokens

Imaxe da maqueta Claude Sonnet 4.5

Anthropic lanzou Claude Sonnet 4.5, unha evolución centrada na programación, os axentes e o control informático que busca consolidar a plataforma en contornas profesionais. Nun panorama con rivais de alto nivel, a compañía describe esta versión como a súa modelo máis refinado e útil para tarefas de enxeñaría ata a data

A nova versión baséase no historial da familia Sonnet, que xa mellorara o razoamento e a codificación en iteracións anteriores. Baseándose nesa base, a versión 4.5 ten como obxectivo ampliar o alcance práctico con avances en persistencia da atención, uso de ferramentas e produtividade, mantendo unha estratexia prudente en seguridade e aliñamento.

Capacidades clave e melloras de rendemento

Imaxe xenérica do Soneto 4.5 de Claude

Segundo Anthropic, Claude Sonnet 4.5 é capaz de manter a concentración durante máis de 30 horas en tarefas complexas. e de varios pasos, o que favorece os proxectos longos onde se require continuidade de contexto. Tamén admite resultados de ata 64.000 tokens nunha única respostae ofrece controis para axustar o "tempo de reflexión" antes de responder, equilibrando a velocidade e os detalles segundo sexa necesario.

Contido exclusivo - Fai clic aquí  YouTube reforza a súa política contra os vídeos producidos en masa e con tecnoloxía de IA

En tarefas reais diante do ordenador, A compañía informa dun 61,4 % en OSWorld, un salto notable con respecto ao 42,2 % do seu predecesor nesta mesma proba.En escenarios prácticos, o modelo pode navegar pola web, completar follas de cálculo e realizar accións en aplicacións de escritorio desde a extensión de Chrome, o que reduce a monitorización continua do usuario.

A terra de A programación concentra a maioría das mellorasNa avaliación verificada de SWE-bench, que se centrou na codificación aplicada a proxectos do mundo real, Sonnet 4.5 lidera o camiño cun 77,2% (con configuracións que aumentan o número en computación paralela). Anthropic propón que o modelo abarque todo o ciclo de desenvolvemento: planificación, implementación, refactorización e mantemento de grandes bases de código.

Máis alá do puro desenvolvemento, Antrópico identifica usos que requiren fluxos prolongados e coordinación de pasos.Desde a ciberseguridade e as finanzas ata a produtividade da oficina e a investigación mediante o uso de datos internos e externos. Nestes contextos, a promesa reside en axentes máis estables capaces de manter o traballo a longo prazo sen perder consistencia.

Ferramentas e ecosistema para desenvolvedores

Código de Claude

O lanzamento vén acompañado de Novidades de Claude Code: puntos de control para gardar o progreso e volver a estados anteriores, como por exemplo historial de versións, Un interface de terminal renovada, extensión nativa para Visual Studio Code e melloras na edición de contexto e memoria a través da API para executar tarefas máis longas.

Contido exclusivo - Fai clic aquí  Antrópico e o caso da IA ​​que recomendou beber lixivia: cando as modelos fan trampas

Anthropic tamén estrea a SDK do axente de Claude, que replica a infraestrutura que a empresa emprega para construír os seus propios axentesO kit ofrece ferramentas para a memoria a longo prazo, sistemas de permisos e coordinación de subaxentes, facilitando a creación de solucións automatizadas que cooperan cara a obxectivos comúns e aseguran a conectividade con ferramentas como WireGuard.

Como complemento, A empresa habilita temporalmente “Imaxina con Claude”, unha demostración que nos permite observar como funciona o modelo xera software en tempo real Sen código predefinido. Esta vista previa, dispoñible por tempo limitado para o máximo número de usuarios, ilustra o potencial do modelo para a creación interactiva.

Seguridade, aliñamento e resiliencia

Anthropic inclúe Sonnet 4.5 no seu nivel de protección Nivel de seguridade da IA ​​3 (ASL-3), con filtros adestrados para detectar contido perigoso, especialmente aqueles relacionados cos riscos QBRN. A empresa afirma ter reducido falsos positivos por un factor de dez en comparación coa versión inicial destes clasificadores e ofrece Continuidade da conversa con Sonnet 4 se se produce un bloqueo de seguridade.

Paralelamente, a empresa garante que O modelo reduce comportamentos non desexados como a adulación ou as respostas enganosas e fortalece as defensas contra os intentos de inxección inmediataEstas medidas apuntan a un uso máis fiable en entornos corporativos, onde a execución de accións automatizadas require controis e rastrexabilidade.

Contido exclusivo - Fai clic aquí  A IA de Gemini agora pode atopar cancións como Shazam no teu teléfono móbil

Dispoñibilidade, plataformas e prezos

Imaxe de Claude Sonnet 4.5

O Soneto de Claude 4.5 está dispoñible en Claude.ai (web, iOS e Android) e para desenvolvedores a través da plataforma de desenvolvedores Claude, con integración en servizos como Amazon Bedrock e Google Cloud Vertex AI. O plan gratuíto funciona cun límite de sesións que se restablece cada cinco horas e un número variable de mensaxes baixo demanda. Os prezos seguen sendo os mesmos.3 $ por millón de tokens de entrada e 15 $ por millón de tokens de saída.

Entre as novas funcionalidades de acceso, A extensión de Chrome de Claude está a ser lanzada para os usuarios de Max. rexistrados previamente na lista de espera. Aínda que os puntos de referencia suxiren melloras substanciais en comparación con iteracións anteriores, Anthropic sinala que o rendemento real depende do caso de uso e do orzamento de razoamento configurado para cada tarefa.

Cunha combinación de avances na codificación, maior autonomía para os axentes e un enfoque máis estrito na seguridade, Claude Sonnet 4.5 está posicionado como unha opción sólida para equipos técnicos que precisan continuidade e control en procesos longos, mantendo custos estables e compatibilidade co ecosistema xa despregado de Anthropic.

axuste de IA de LinkedIn
Artigo relacionado:
LinkedIn axusta a súa IA: cambios na privacidade, rexións e como desactivala