OpenAI revoluciona ChatGPT amb un agent autònom que executa tasques complexes

Darrera actualització: 18/07/2025

  • ChatGPT suma un agent autònom que executa tasques complexes en un entorn virtual segur.
  • Els usuaris poden delegar tasques com crear presentacions, comprar en línia o analitzar dades.
  • La IA opera sota control de l'usuari amb mesures de seguretat i privadesa reforçades.
  • L'agent ja es pot activar a plans Pro, Plus i Team; aviat arribarà a més usuaris.

Agent autònom de ChatGPT en acció

La carrera per dotar de majors capacitats la intel·ligència artificial acaba de fer un nou salt amb la presentació del agent autònom de ChatGPT, una funció que transforma completament l'experiència habitual amb el famós chatbot d'OpenAI. Ara, ChatGPT és capaç d'executar tasques de certa complexitat de manera autònoma utilitzant un ordinador virtual propi, amb accés a diferents eines i la possibilitat dinteractuar en temps real amb webs, arxius i serveis externs.

Aquest avenç suposa anar més enllà de la simple conversa: l'agent pren decisions, navega per la web, genera documents i automatitza processos, sense que l'usuari hagi de donar instruccions pas a pas. Tot passa dins del mateix entorn de ChatGPT, i sempre sota la supervisió i validació de l'usuari, que pot interrompre o ajustar la tasca en qualsevol moment.

Contingut exclusiu - Clic Aquí  Com utilitzar Google Gemini per saber quins llocs visitar a una ciutat

Una funció basada en la integració de tecnologies prèvies

L'arribada de l'agent a ChatGPT unifica diversos desenvolupaments recents d'OpenAI, com ara Operador (que ja permetia al chatbot interactuar amb pàgines web) i Recerca profunda (centrada a l'elaboració d'informes avançats a partir de fonts múltiples). Gràcies a aquesta combinació, el sistema passa de limitar-se a una xerrada intel·ligent a convertir-se en un col·laborador capaç d'executar tasques de principi a fi. L'usuari pot delegar processos com ara recopilar informació, planificar esdeveniments, crear fulls de càlcul o generar presentacions, i l'agent s'encarrega de tot el flux, sol·licitant confirmació quan calgui.

Què podeu fer exactament l'agent de ChatGPT?

Agents GPT

Durant les demostracions, s'han vist exemples tan variats com la organització integral d'un casament (amb cerca d'hotels, previsió meteorològica, identificació de regals i fins i tot recordatoris de compres pendents), la generació de documents oficials o l'automatització de compres en línia. Ja no cal alternar entre múltiples pestanyes o aplicacions: l'agent ho integra tot en una sola conversa.

Entre les funcions més destacades es troben:

  • Creació i manipulació de fulls de càlcul i presentacions a partir de dades reals.
  • Planificació de sopars, llistes de la compra i coordinació d'enviaments.
  • Cerca i compra de productes a botigues online des de ChatGPT.
  • Reserva de restaurants, hotels o serveis tenint en compte preferències i pressupost.
  • Gestió personal (agendes, recordatoris, cites) i anàlisi professional de dades complexes.
Contingut exclusiu - Clic Aquí  Copilot Search: què és, com funciona i com aprofitar-ho al màxim

Un ordinador virtual a disposició de la intel·ligència artificial

agent de ChatGPT

La clau del funcionament del nou agent és l'accés permanent a un entorn virtual gestionat per OpenAI. Allí podeu utilitzar un navegador visual per interactuar amb webs com ho faria una persona, accedir a terminals per executar codi o manipular arxius, i connectar amb aplicacions externes (com Google Drive, GitHub o Gmail) si l'usuari ho autoritza. Cada tasca s'executa en una sessió temporal aïllada, que s'elimina en finalitzar per reforçar la seguretat i privadesa.

Aquest disseny us permet analitzar informació en temps real, editar documents i prendre decisions contextualitzades. Per exemple, podeu identificar una cita al vostre calendari i, si voleu, reorganitzar-la o preparar un informe vinculat a aquesta data.

Benchmark: Com rendeix l'agent davant humans i altres models?

Les primeres proves comparatives (SpreadsheetBench, DSBench y BrowseComp) han mostrat que el agent de ChatGPT supera models previs d'IA i molts humans en tasques d'anàlisi, edició i navegació. En benchmarks de fulls de càlcul i ciència de dades, l'agent ha aconseguit rècords de precisió i eficàcia, cosa que apunta a una notable maduresa tecnològica.

Contingut exclusiu - Clic Aquí  Gemma 3n: la nova aposta de Google per portar IA avançada a qualsevol dispositiu

En entorns reals, ha demostrat ser capaç d'analitzar grans volums de correus o missatges de clients, sintetitzar perfils d'usuari, automatitzar informes financers i gestionar tasques de màrqueting, tot això en minuts i sense intervenció constant de lusuari.

Privadesa i seguretat: control absolut de l'usuari

OpenAI ha posat especial èmfasi en la seguretat i en donar a l'usuari el control complet sobre les accions de l'agent. Qualsevol operació sensible (com enviar formularis, fer reserves o executar codi) requereix confirmació explícita abans de fer-se. L'agent està programat per rebutjar accions d'alt risc, com transaccions financeres o tasques potencialment perilloses. A més, tota l'activitat es pot suprimir amb un sol clic i les dades d'usuari no s'emmagatzemen després de la sessió.

El sistema supervisa tot el procés i permet observar en temps real els passos que fa la IA. Si l'usuari ho desitja, pot pausar o interrompre qualsevol acció abans de la seva execució final, cosa que reforça la transparència i la confiança en l'eina.