Claude Opus 4.6: así es el nuevo modelo avanzado de Anthropic

Última actualización: 06/02/2026

  • Claude Opus 4.6 introduce una ventana de contexto de hasta 1 millón de tokens en beta y refuerza su papel en programación y tareas agenticas largas.
  • El modelo lidera benchmarks como Terminal-Bench 2.0, Humanity’s Last Exam, GDPval-AA y BrowseComp, superando a GPT-5.2 y Gemini 3 Pro en varias pruebas específicas.
  • Incorpora funciones como adaptive thinking, niveles de esfuerzo, compactación de contexto, agent teams en Claude Code y mejoras en Excel y PowerPoint.
  • Mantiene el precio de 5/25 dólares por millón de tokens (entrada/salida), está disponible vía web, API y grandes nubes, y refuerza controles de seguridad y ciberseguridad.

Modelo Claude Opus 4.6

La llegada de Claude Opus 4.6 marca un nuevo paso en la carrera de los modelos de inteligencia artificial de gama alta. Anthropic ha tomado como base la versión anterior y la ha llevado un poco más lejos en aquello que más piden las empresas: programación fiable, tareas largas y manejo de grandes volúmenes de información sin que el sistema pierda el hilo a mitad de camino.

Más que un simple chatbot, Opus 4.6 quiere posicionarse como un colaborador de trabajo capaz de mantenerse operativo durante horas sobre el mismo problema, revisar su propio código, explorar repositorios completos o analizar documentos extensos. Todo ello manteniendo un esquema de precios continuista y sin grandes sobresaltos para quienes ya trabajaban con modelos de Anthropic a través de las grandes nubes.

Qué es Claude Opus 4.6 y por qué importa

Claude Opus 4.6

El lanzamiento de Claude Opus 4.6 se presenta como la evolución directa de Opus 4.5, con una novedad especialmente llamativa: una ventana de contexto de hasta un millón de tokens en fase beta. Esto le permite ingerir y razonar sobre conversaciones, repositorios de código o informes que antes había que trocear en fragmentos mucho más pequeños, reduciendo el riesgo de perder instrucciones importantes por el camino.

Anthropic define este modelo como su sistema más avanzado hasta la fecha, orientado a equipos que necesitan ir más allá de una simple respuesta puntual. La idea es que pueda asumir proyectos de largo recorrido —desde investigación inicial hasta implementación de soluciones— actuando como un agente que mantiene la coherencia incluso cuando el material a procesar es del tamaño de varias novelas o de un repositorio completo.

En el ámbito competitivo, la compañía lo sitúa en la misma liga que GPT-5.2 de OpenAI o Gemini 3 Pro de Google, y asegura que en varias pruebas técnicas el nuevo modelo se coloca por encima de esos rivales. Aunque los benchmarks no siempre reflejan al milímetro el uso real, sirven para hacerse una idea del tipo de tareas en las que Opus 4.6 pretende destacar.

Para empresas europeas, despachos profesionales o startups tecnológicas, este enfoque encaja con una necesidad bastante concreta: automatizar trabajo de conocimiento complejo sin tener que multiplicar plantillas, sobre todo en contextos de costes ajustados y plazos de entrega cada vez más cortos.

Capacidades clave: del código al trabajo de oficina

Uno de los pilares del nuevo modelo es su rendimiento en programación y depuración de código. Opus 4.6 está diseñado para navegar por bases de código voluminosas, entender dependencias internas, revisar cambios y detectar errores que versiones anteriores pasaban por alto. Anthropic insiste en que el modelo es capaz no solo de generar código, sino también de revisar su propio trabajo y corregirlo.

Más allá del desarrollo puro, el modelo se ha entrenado para manejar análisis financieros, investigación avanzada y trabajo con documentos, hojas de cálculo y presentaciones. Esto incluye la capacidad de combinar varias tareas en cadena: por ejemplo, extraer datos de informes, procesarlos en Excel, generar conclusiones y volcar el resultado en una presentación coherente.

En el día a día de una empresa, ese tipo de flujo continuo es lo que separa a un asistente de IA “curioso” de una herramienta que realmente ahorra horas de trabajo repetitivo. El objetivo declarado de Anthropic es que Opus 4.6 pueda asumir bloques de trabajo completos, no solo pequeñas consultas sueltas.

El modelo también está pensado para funcionar dentro de entornos multitarea donde se lanzan varias peticiones encadenadas, como sucede en plataformas de colaboración o en suites de productividad corporativa. En esos contextos, la capacidad de mantener la memoria sobre lo que se ha hecho antes resulta crítica para no tener que repetir explicaciones una y otra vez.

Contenido exclusivo - Clic Aquí  Cómo usar tu PC como hub local de IA: Guía práctica y comparativa

Ventana de contexto de 1 millón de tokens y memoria a largo plazo

El cambio técnico más comentado de Claude Opus 4.6 es su ventana de contexto de hasta un millón de tokens en la plataforma para desarrolladores. En términos prácticos, eso significa que puede trabajar con archivos de código, contratos, documentación técnica o registros de conversación de gran tamaño sin tener que dividirlos en bloques artificiales, algo que hasta ahora era un quebradero de cabeza habitual.

Este salto de capacidad busca atacar un problema de fondo: la llamada “pudrición del contexto”. A medida que una sesión se alarga, muchos modelos empiezan a contradecirse, olvidan decisiones anteriores o dejan de respetar instrucciones iniciales. Según los datos publicados, Opus 4.6 mejora de forma importante en pruebas donde hay que encontrar información concreta escondida dentro de cientos de miles de palabras, con tasas de acierto muy superiores a generaciones previas.

La clave no es solo poder “almacenar” más texto, sino utilizarlo de forma efectiva. Anthropic sostiene que el modelo mantiene la coherencia lógica en interacciones muy largas, algo relevante cuando se trabaja con auditorías, due diligence, revisiones legales extensas o migraciones de sistemas, tareas habituales en consultoras y departamentos corporativos europeos.

Para sesiones especialmente prolongadas, el sistema incorpora un mecanismo de compactación de contexto. Cuando la conversación se acerca a un umbral definido, el modelo resume automáticamente las partes más antiguas y las sustituye por versiones condensadas, liberando espacio para seguir trabajando sin perder los elementos clave que se acordaron al principio.

Adaptive thinking y niveles de esfuerzo: más control para desarrolladores

Adaptive thinking Claude

Junto al modelo, Anthropic ha introducido nuevas opciones en la Claude Developer Platform para ajustar cómo razona la IA. El llamado adaptive thinking permite que el sistema decida cuánta profundidad de razonamiento aplicar según la tarea, en lugar de funcionar con un simple interruptor de “modo extendido sí o no”.

Además, se han definido cuatro niveles de esfuerzo —low, medium, high y max— que los desarrolladores pueden configurar por petición. Este control de “effort” permite equilibrar inteligencia, latencia y coste: para consultas triviales no tiene sentido gastar recursos al máximo, mientras que en tareas críticas o proyectos complejos puede interesar darle al modelo margen para pensar más.

Estas opciones son particularmente útiles en entornos donde se ejecutan miles de llamadas a la API al día, como en SaaS europeos, integraciones con ERP o plataformas internas de grandes empresas. Poder decidir cuánto “se esfuerza” el modelo en cada petición facilita contener la factura de IA sin renunciar a calidad cuando realmente hace falta.

En paralelo, la plataforma añade funciones de compactación automática del contexto que ayudan a mantener vivas sesiones de trabajo muy largas, evitando cortes bruscos cuando se alcanza el límite de tokens. Este tipo de herramientas de gestión fina suele ser clave a la hora de integrar modelos avanzados en sistemas ya existentes.

Agent teams y trabajo sobre grandes bases de código

En el área de desarrollo de software, Anthropic ha anunciado para Claude Code la llegada de los llamados agent teams en fase de investigación. La idea es que, en lugar de un único agente avanzando en serie, se puedan lanzar varios subagentes que se reparten el trabajo en paralelo y luego coordinan resultados, como haría un pequeño equipo de ingeniería.

Este enfoque resulta especialmente interesante cuando se trabaja con repositorios grandes, donde revisar todo el código de manera lineal es poco eficiente. Los subagentes pueden encargarse de módulos distintos, buscar referencias cruzadas, analizar cómo viajan los datos por el sistema o revisar pruebas automatizadas, y después unifican conclusiones en un resultado coherente.

Combinado con la ventana de 1 millón de tokens, este sistema permite, al menos sobre el papel, cargar un proyecto entero y pedir al modelo que localice puntos débiles, inconsistencias o zonas de riesgo sin necesidad de ir troceando los archivos uno a uno. Para equipos de desarrollo en España o la UE que gestionan productos complejos, esto puede ahorrar días de revisión manual.

Contenido exclusivo - Clic Aquí  El CEO de IBM y su visión sobre la IA y el impacto en los programadores

Opus 4.6 también refuerza sus capacidades de code review y debugging, con énfasis en la capacidad del modelo para detectar sus propios errores y corregirlos durante el proceso. Este comportamiento, si se consolida en el uso cotidiano, reduce el tiempo que los desarrolladores tienen que dedicar a revisar el código sugerido por la IA.

Benchmarks: dónde destaca Claude Opus 4.6

Claude Opus 4.6 benchmark Terminal-Bench 2.0

Anthropic apoya el lanzamiento de Claude Opus 4.6 en una serie de pruebas estandarizadas donde el modelo obtiene resultados destacados frente a sus competidores directos. Una de las más citadas es Terminal-Bench 2.0, enfocada en programación agentica y trabajo autónomo en entornos de consola, donde el modelo se sitúa en la parte alta del ranking.

En Humanity’s Last Exam, un examen de razonamiento multidisciplinar que combina preguntas complejas de varias áreas, Opus 4.6 también se coloca por delante de otros modelos de frontera, según los datos que aporta la propia compañía. Este tipo de evaluación busca medir la capacidad de la IA para manejar problemas que se parecen más a situaciones reales que a ejercicios aislados.

Otra métrica relevante es GDPval-AA, que evalúa desempeño en tareas profesionales de alto valor económico en campos como finanzas y derecho. En este caso, se indica que Opus 4.6 supera al siguiente mejor modelo del mercado —identificado como GPT-5.2— por unos 144 puntos Elo, y mejora a su propio predecesor con una diferencia aún mayor.

El modelo también muestra resultados sólidos en BrowseComp, una prueba centrada en localizar información difícil de encontrar en la web. Aunque siempre hay que tomar los benchmarks con cierta cautela, el conjunto de datos apunta a un modelo particularmente fuerte en trabajo profesional, análisis complejo y búsquedas de precisión, ámbitos clave para bancos, consultoras, despachos jurídicos o firmas tecnológicas europeas.

Excel, PowerPoint y el salto al trabajo de oficina

Opus 4.6 no solo mira al código: Anthropic ha reforzado las integraciones orientadas al trabajo de oficina, un terreno donde la IA empieza a convertirse en herramienta cotidiana para perfiles no técnicos. En el caso de Excel, la nueva versión permite manejar tareas más largas y complicadas sin perder consistencia, incluyendo funciones avanzadas como formato condicional, validación de datos o cambios multipaso sobre hojas grandes.

El modelo es capaz de planificar sus acciones antes de ejecutarlas, lo que ayuda a evitar errores en cascada cuando se trabaja con libros repletos de fórmulas interconectadas. Además, puede lidiar con datos desordenados, inferir estructuras razonables y preparar el terreno para análisis posteriores o visualizaciones.

La otra gran novedad es la integración de Claude en PowerPoint, actualmente en fase preliminar y orientada sobre todo a usuarios de planes Max, Team y Enterprise. Esta versión puede generar presentaciones completas a partir de un simple prompt, editar diapositivas existentes y crear gráficos manteniendo plantillas, fuentes y estilos fijados por la organización.

En la práctica, esto significa que tareas como preparar un informe mensual, rehacer un deck comercial o actualizar una presentación para consejo pueden apoyarse en la IA sin tener que salir de la propia herramienta. Para muchas empresas europeas habituadas al ecosistema de Microsoft, este tipo de integración resulta más tangible que cualquier benchmark.

Seguridad, ciberseguridad y controles de uso

Cada salto de capacidad en modelos de IA viene acompañado de dudas sobre seguridad y uso indebido, y Anthropic ha dedicado parte importante del anuncio de Opus 4.6 a este punto. La compañía afirma que el nuevo modelo mantiene, e incluso mejora, los niveles de alineación de versiones previas, con bajas tasas de comportamientos problemáticos como el engaño, la adulación excesiva o la cooperación con fines peligrosos.

También se destaca una reducción de las llamadas “negativas excesivas”, esos casos en los que un modelo rechaza contestar a preguntas inofensivas por un exceso de prudencia. Para entornos profesionales que operan bajo marcos regulatorios europeos, encontrar el equilibrio entre seguridad y utilidad es un punto delicado, sobre todo en sectores regulados como el financiero o el sanitario.

En materia de ciberseguridad, Anthropic reconoce que un modelo más potente puede tanto ayudar a defender como a atacar sistemas, y asegura haber desarrollado nuevas sondas internas para detectar respuestas potencialmente dañinas. Al mismo tiempo, está fomentando el uso del modelo para identificar y corregir vulnerabilidades en software de código abierto, reforzando el ángulo defensivo.

Contenido exclusivo - Clic Aquí  Microsoft Paint estrena Restyle: estilos generativos en un clic

La compañía menciona además la aplicación de baterías de evaluación más amplias, incluyendo pruebas centradas en el bienestar del usuario, la resistencia a peticiones peligrosas y la detección de comportamientos encubiertos. Aunque buena parte de estos datos proceden de documentación propia, son relevantes para cualquier empresa que contemple integrar Opus 4.6 en procesos sensibles.

Precios, disponibilidad y opciones de despliegue

Claude Opus 4.6

En el plano económico, Claude Opus 4.6 se mantiene en la misma franja de precios que su predecesor, un detalle importante para compañías que ya habían hecho números con Opus 4.5. El coste estándar se sitúa en 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, lo que coloca al modelo en línea con otros sistemas de gama alta del mercado.

Para usos que superen los 200.000 tokens de contexto, Anthropic aplica una tarifa “premium” de aproximadamente 10 dólares por millón de tokens de entrada y 37,5 dólares por millón de salida, pensada para proyectos que exprimen al máximo la ventana ampliada. Además, el modelo soporta hasta 128.000 tokens de salida, algo relevante cuando el resultado esperado es un informe extenso, una refactorización grande o un conjunto de documentos generados de una sola vez.

Opus 4.6 está disponible en claude.ai, vía API propia y a través de las principales plataformas cloud, incluidas las de Amazon y Google, lo que facilita su adopción en entornos empresariales ya montados en estas infraestructuras y en proyectos de IA local. Para cargas que requieran requisitos de residencia o soberanía de datos, se contempla la opción de procesamiento exclusivamente en centros de datos de EE. UU. con un recargo aproximado del 10 % sobre el precio por token.

En cuanto a planes de acceso, algunas funciones avanzadas —como la integración en PowerPoint o ciertos modos de uso intensivo— quedan restringidas a niveles de suscripción superiores (Max, Team y Enterprise), mientras que los usuarios con cuentas gratuitas se mantienen en modelos más ligeros como Haiku o Sonnet. Esto encaja con el enfoque cada vez más empresarial del producto.

Qué puede suponer para empresas y startups en Europa

Para startups tecnológicas, pymes digitales y grandes corporaciones europeas, Claude Opus 4.6 llega en un momento de fuerte presión por automatizar tareas de alto valor sin disparar plantillas. La combinación de programación agentica, ventana de 1 millón de tokens y herramientas como Excel y PowerPoint coloca al modelo como una opción seria para repensar flujos de trabajo completos.

Los equipos pequeños pueden apoyarse en el modelo para asumir proyectos que antes requerían más perfiles especializados: desde construir y mantener bases de código complejas hasta preparar informes exhaustivos para clientes o reguladores. Para organizaciones más grandes, la ventaja está en integrar el modelo en sistemas internos y dejar que asuma parte de la carga repetitiva que hoy recae en profesionales cualificados.

En términos de competencia, la comparación constante con GPT-5.2 y Gemini 3 Pro refleja un mercado en el que varias propuestas de alto nivel compiten por entrar en el núcleo del trabajo diario. Cada empresa tendrá que valorar no solo benchmarks, sino también condiciones de servicio, ubicación de datos, integración con sus herramientas y requisitos regulatorios, especialmente en el marco del AI Act europeo.

Al juntar contexto masivo, control fino del razonamiento, mejoras en seguridad y un enfoque claro en programación y ofimática, Claude Opus 4.6 se posiciona como un candidato para quienes buscan una IA que aguante proyectos largos y tareas exigentes sin comportarse como un simple chatbot de demostración.

Con todo lo anterior, el nuevo modelo de Anthropic se perfila como una pieza más de una oferta de IA cada vez más poblada, pero con un ángulo claro: apoyar trabajo profesional real en código, análisis y documentación, manteniendo precios relativamente estables y añadiendo las funciones de control que esperan tanto desarrolladores como responsables de negocio en un entorno regulatorio europeo cada vez más exigente.

Xcode 26.3 con programación agéntica
Artículo relacionado:
Xcode 26.3 estrena programación agéntica con Claude y Codex