- Gemini 3 Deep Think se actualiza como modo de razonamiento avanzado centrado en ciencia, investigación e ingeniería.
- El modelo logra resultados punteros en benchmarks como Humanity’s Last Exam, ARC-AGI-2, Codeforces e IMO 2025.
- Ya está disponible en la app de Gemini para suscriptores de Google AI Ultra y en acceso anticipado vía Gemini API.
- Primeros casos de uso incluyen revisión de artículos matemáticos, optimización de semiconductores y diseño de objetos para impresión 3D.
Google ha decidido pisar el acelerador con Gemini 3 Deep Think, su modelo de inteligencia artificial especializado en razonamiento profundo. Esta versión, concebida como un modo avanzado dentro de la familia Gemini, se ha afinado para encargarse de problemas científicos, de investigación e ingeniería donde los datos son incompletos, las fronteras del problema son difusas y no siempre existe una única respuesta correcta.
Frente a los modelos generalistas, Deep Think apuesta por una forma de trabajo más cercana a la de un equipo de investigación: piensa durante más tiempo, explora varias rutas en paralelo y descarta las inconsistencias antes de entregarte una respuesta final. El objetivo de Google no es solo que el sistema “suene” convincente, sino que aporte rigor en tareas de alto nivel, como revisar demostraciones matemáticas, interpretar resultados de laboratorio o diseñar componentes físicos.
Un modo de razonamiento diseñado para problemas abiertos
Gemini 3 Deep Think se ha desarrollado en colaboración estrecha con científicos e investigadores, con la idea de enfrentarse a retos que se parecen poco a un examen tipo test. En investigación real, es habitual trabajar con datos ruidosos, hipótesis a medio formular y objetivos cambiantes; ahí es donde Google quiere que este modo brille.
En su arquitectura interna, Deep Think introduce un mecanismo de razonamiento extendido o “parallel thinking”: ante una consulta compleja, el modelo genera múltiples líneas de razonamiento, las evalúa entre sí y filtra las que caen en contradicciones lógicas. Este enfoque se aleja del típico “un solo hilo de pensamiento” y se parece más a un grupo de personas discutiendo en una pizarra hasta encontrar una vía sólida.
Según explica la propia compañía, esta estrategia permite abordar problemas en los que los requisitos no están bien definidos desde el principio. En vez de limitarse a rellenar huecos, Deep Think puede proponer posibles interpretaciones del problema, comprobar su coherencia con los datos y sugerir pasos de validación, algo clave cuando el contexto no viene “limpio” de fábrica.
Google insiste en que la intención es combinar conocimiento científico profundo con utilidad práctica de ingeniería. Es decir, que el modelo no se quede en la teoría abstracta, sino que ayude a tomar decisiones, escribir código para simulaciones o ajustar parámetros de un experimento.
Rendimiento en benchmarks: de Humanity’s Last Exam a Codeforces

Para respaldar la actualización, Google publica resultados en algunas de las pruebas más exigentes del panorama actual de IA. En Humanity’s Last Exam, un benchmark que reúne cuestiones muy difíciles de matemáticas, ciencias e ingeniería, Gemini 3 Deep Think alcanza alrededor de 48,4 % sin utilizar herramientas externas, situándose por encima de modelos como GPT-5.2 y Claude Sonnet/Opus en ese tipo de tareas.
En ARC-AGI-2, un conjunto de puzzles pensado para medir capacidad de abstracción y generalización, el modelo logra en torno al 84,6 %, una cifra que Google indica que ha sido verificada por la ARC Prize Foundation. Este tipo de prueba no evalúa solo “conocimiento memorizado”, sino hasta qué punto el sistema puede detectar patrones cuando las instrucciones cambian.
En el terreno de la programación competitiva, Deep Think firma un Elo de 3455 en Codeforces, lo que lo coloca en niveles comparables a perfiles humanos de máxima categoría. Esta métrica refuerza la idea de que la IA es capaz de resolver problemas de código complejos del mundo real, con restricciones de tiempo y trampas típicas de los concursos.
La actualización también consolida resultados de nivel medalla de oro en la Olimpiada Internacional de Matemáticas 2025, con un desempeño que ronda el 81,5 % en las evaluaciones internas de DeepMind. Además, el modelo alcanza rendimientos equivalentes a medalla en las secciones escritas de las olimpiadas de física y química de 2025, y marca alrededor de 50,5 % en el CMT-Benchmark de física teórica de materia condensada.
Todo esto dibuja un perfil bastante claro: Gemini 3 Deep Think no solo compite en preguntas cerradas, sino que maneja razonamiento prolongado, pasos intermedios y verificación interna, elementos imprescindibles cuando se trabaja con pruebas, cálculos o simulaciones delicadas.
Ciencia dura: matemáticas, física, química y más allá
El foco de la actualización pasa por reforzar el papel de Deep Think como herramienta para ciencia y tecnología de alto nivel. En matemáticas, Google y DeepMind ya habían mostrado antes sistemas basados en Gemini capaces de alcanzar resultados de medalla de oro en la IMO, así como de resolver un porcentaje notable de problemas en competiciones como el ICPC.
Con Gemini 3, esa línea se amplía. El modelo no se limita a hacer cuentas: puede seguir demostraciones largas, detectar puntos débiles y sugerir vías alternativas de prueba. En una disciplina donde un error lógico minúsculo invalida páginas de trabajo, esta capacidad tiene un valor evidente para equipos que revisan artículos, tesis o informes técnicos.
En física y química, Deep Think muestra avances en problemas de competición y pruebas escritas, pero lo interesante es la traslación a laboratorios e industria. Muchos trabajos en estos campos consisten en traducir fenómenos complejos a modelos matemáticos, ajustar parámetros y decidir qué medir a continuación. El modelo está diseñado para ayudar a conectar intuiciones físicas, ecuaciones y datos experimentales sin perder el hilo cuando el contexto se vuelve extenso.
El rendimiento en benchmarks como CMT-Benchmark sugiere que la IA empieza a moverse con soltura en física teórica avanzada, un terreno donde el lenguaje natural se mezcla con formulaciones matemáticas densas y referencias cruzadas. Eso abre la puerta a asistentes capaces de apoyar en el día a día de grupos de investigación europeos centrados en materiales, óptica cuántica o simulaciones numéricas.
DeepMind también explora configuraciones “agentivas” alrededor de Deep Think, en las que el modelo no solo responde, sino que planifica ciclos de trabajo, verifica sus propios pasos y ajusta la estrategia según los resultados, con el objetivo de reducir errores lógicos y alucinaciones en dominios especialmente sensibles.
Casos reales: revisión de papers, semiconductores y diseño 3D

Más allá de las tablas de resultados, Google acompaña la actualización con ejemplos de uso temprano que ayudan a aterrizar qué puede hacer hoy Gemini 3 Deep Think. Uno de los más comentados es el de Lisa Carbone, matemática en la Universidad de Rutgers, que utilizó el sistema para revisar un artículo de matemáticas altamente técnico en un área con poca presencia en los datos de entrenamiento habituales.
Según relata la compañía, Deep Think fue capaz de identificar un fallo lógico sutil que había pasado inadvertido durante la revisión de pares humana. Este tipo de apoyo no sustituye al trabajo de los revisores, pero sí ofrece una capa adicional de comprobación que puede resultar interesante para revistas científicas europeas o grupos de investigación que manejan manuscritos muy especializados.
Otro caso procede del Wang Lab de la Universidad de Duke, centrado en el desarrollo de nuevos materiales. El equipo habría utilizado Deep Think para optimizar procesos de crecimiento de cristales con el objetivo de obtener películas semiconductoras de más de 100 micrómetros de grosor, algo complicado con los métodos anteriores. La IA propuso una “receta” experimental que permitió avanzar hacia materiales útiles para dispositivos electrónicos de próxima generación.
En el ámbito de la ingeniería aplicada, se menciona el trabajo de Anupam Pathak, responsable de I+D en Platforms & Devices dentro de Google. Aquí, Deep Think se ha usado para acelerar el diseño de componentes físicos, apoyando tanto en la parte conceptual como en la traducción a parámetros técnicos concretos, algo muy relevante para empresas europeas que iteran sobre prototipos mecánicos o electrónicos.
Una demo especialmente llamativa ilustra la capacidad del modelo para transformar un boceto en un objeto listo para impresión 3D. El sistema interpreta el dibujo, infiere la geometría, genera el modelo y produce el archivo necesario para imprimir la pieza. En la práctica, es como enseñar un croquis rápido y recibir planos utilizables, lo que puede ahorrar iteraciones en estudios de diseño industrial o pequeños talleres de hardware.
Visión, contexto largo y tareas multimodales
La actualización de Gemini 3 Deep Think no se limita al texto. Google destaca que el modelo ha mejorado en tareas que requieren combinar visión y razonamiento lógico, como la interpretación de diagramas de flujo complejos, esquemas o gráficos científicos. La IA no solo “ve” la imagen, sino que la integra en la cadena de razonamiento para tomar decisiones coherentes.
Esta capacidad resulta útil, por ejemplo, al analizar figuras de un artículo científico, planos técnicos o capturas de pantalla de instrumentos de medida. En lugar de pedir al usuario que describa todo en texto, el sistema puede trabajar directamente sobre la representación visual y cruzarla con el resto del contexto.
Otro punto subrayado por Google es la gestión de contextos largos. Deep Think puede manejar documentos de cientos de páginas —desde memorias de proyectos europeos hasta extensos anexos técnicos— sin perder el hilo. Esto le permite cruzar variables dispersas, comparar versiones de un experimento o detectar incoherencias que se esconden en diferentes secciones del mismo informe.
De cara a universidades, centros de I+D o departamentos de ingeniería de compañías españolas y europeas, esta combinación de visión, texto y contexto extenso encaja con flujos de trabajo reales: informes, presentaciones, datos experimentales, código y diagramas conviven en un mismo proyecto y rara vez están perfectamente ordenados.
Deep Think se posiciona así como un asistente personal capaz de moverse entre formatos y ayudar a estructurar información dispersa, algo especialmente valioso cuando los equipos trabajan contra reloj en convocatorias competitivas o entregas regulatorias.
Deep Think se posiciona así como un asistente capaz de moverse entre formatos y ayudar a estructurar información dispersa, algo especialmente valioso cuando los equipos trabajan contra reloj en convocatorias competitivas o entregas regulatorias.
En conjunto, la nueva iteración de Gemini 3 Deep Think presenta un perfil de herramienta pensada para problemas difíciles: combina un razonamiento más profundo, resultados sólidos en pruebas de máximo nivel y ejemplos prácticos que van desde la revisión de artículos científicos hasta la fabricación de semiconductores o el diseño de piezas imprimibles. Para equipos de investigación y empresas tecnológicas en España y Europa, el interés no está tanto en las cifras espectaculares como en la posibilidad de integrar este tipo de IA en procesos reales, con control, verificación y foco en resultados medibles.
Soy un apasionado de la tecnología que ha convertido sus intereses «frikis» en profesión. Llevo más de 10 años de mi vida utilizando tecnología de vanguardia y trasteando todo tipo de programas por pura curiosidad. Ahora me he especializado en tecnología de ordenador y videojuegos. Esto es por que desde hace más de 5 años que trabajo redactando para varias webs en materia de tecnología y videojuegos, creando artículos que buscan darte la información que necesitas con un lenguaje entendible por todos.
Si tienes cualquier pregunta, mis conocimientos van desde todo lo relacionado con el sistema operativo Windows así como Android para móviles. Y es que mi compromiso es contigo, siempre estoy dispuesto a dedicarte unos minutos y ayudarte a resolver cualquier duda que tengas en este mundo de internet.
