Binago ng OpenAI ang ChatGPT gamit ang isang autonomous na ahente na nagsasagawa ng mga kumplikadong gawain.

Huling pag-update: 18/07/2025

  • Nagdaragdag ang ChatGPT ng isang autonomous na ahente na nagsasagawa ng mga kumplikadong gawain sa isang secure na virtual na kapaligiran.
  • Maaaring magtalaga ang mga user ng mga gawain tulad ng paggawa ng mga presentasyon, pamimili online, o pagsusuri ng data.
  • Gumagana ang AI sa ilalim ng kontrol ng user na may pinahusay na mga hakbang sa seguridad at privacy.
  • Available na ang ahente sa mga plano ng Pro, Plus, at Team; mas maraming user ang makakagamit nito sa lalong madaling panahon.

ChatGPT Autonomous Agent in Action

Ang karera upang magbigay ng artipisyal na katalinuhan na may higit na mga kakayahan ay gumawa ng isang bagong hakbang sa pagtatanghal ng ChatGPT Standalone Agent, isang tampok na ganap na nagbabago sa karaniwang karanasan sa sikat na chatbot ng OpenAI. ngayon, Ang ChatGPT ay may kakayahang magsagawa ng mga gawain ng isang partikular na kumplikado autonomously gamit ang iyong sariling virtual na computer, na may access sa iba't ibang mga tool at kakayahang makipag-ugnayan sa real time sa mga website, file, at panlabas na serbisyo.

Ang pambihirang tagumpay na ito ay nangangahulugan ng paglampas sa simpleng pag-uusap: Ang ahente ay gumagawa ng mga desisyon, nag-navigate sa web, bumubuo ng mga dokumento at nag-o-automate ng mga proseso, nang hindi kinakailangang magbigay ang user ng mga sunud-sunod na tagubilin. Nangyayari ang lahat sa loob ng parehong kapaligiran ng ChatGPT, at palaging nasa ilalim ng pangangasiwa at pagpapatunay ng user, na maaaring makagambala o makapag-adjust sa gawain anumang oras.

Eksklusibong nilalaman - Mag-click Dito  Paano gamitin ang Google Gemini para malaman kung aling mga lugar ang bibisitahin sa isang lungsod

Isang function na batay sa pagsasama ng mga nakaraang teknolohiya

Ang pagdating ng ahente sa ChatGPT ay pinag-iisa ang ilang kamakailang pag-unlad ng OpenAI, gaya ng Opereytor (na pinayagan na ang chatbot na makipag-ugnayan sa mga web page) at Malalim na Pananaliksik (nakatuon sa advanced na pag-uulat mula sa maraming mapagkukunan). Binabago ng kumbinasyong ito ang system mula sa pagiging isang matalinong chat tungo sa isang isang collaborator na may kakayahang magsagawa ng mga gawain mula simula hanggang mataposMaaaring italaga ng user ang mga proseso tulad ng pangangalap ng impormasyon, pagpaplano ng mga kaganapan, paggawa ng mga spreadsheet, o pagbuo ng mga presentasyon, at pinangangasiwaan ng ahente ang buong daloy ng trabaho, humihiling ng kumpirmasyon kung kinakailangan.

Ano nga ba ang magagawa ng ahente ng ChatGPT?

Mga Ahente ng GPT

Sa panahon ng mga demonstrasyon, ang mga halimbawa ay iba-iba gaya ng komprehensibong pagpaplano ng kasal (na may mga paghahanap sa hotel, pagtataya ng panahon, pagkakakilanlan ng regalo, at kahit na mga paalala para sa mga nakabinbing pagbili), ang pagbuo ng mga opisyal na dokumento, o ang automation ng mga online na pagbili. Wala nang magpalipat-lipat sa maraming tab o app.: Isinasama ng ahente ang lahat sa isang pag-uusap.

Kabilang sa mga pinaka-kapansin-pansing mga tampok ay:

  • Paglikha at pagmamanipula ng mga spreadsheet at mga presentasyon batay sa totoong datos.
  • Pagpaplano ng hapunan, mga listahan ng pamimili, at koordinasyon sa pagpapadala.
  • Maghanap at bumili ng mga produkto sa mga online na tindahan mula sa ChatGPT.
  • Pagreserba ng mga restaurant, hotel o serbisyo na isinasaalang-alang ang mga kagustuhan at badyet.
  • Personal na pamamahala (mga agenda, paalala, appointment) at propesyonal na pagsusuri ng kumplikadong data.
Eksklusibong nilalaman - Mag-click Dito  Copilot Search: Ano ito, kung paano ito gumagana, at kung paano masulit ito

Isang virtual na computer sa pagtatapon ng artificial intelligence

Ahente ng ChatGPT

Ang susi sa operasyon ng bagong ahente ay ang permanenteng pag-access nito isang virtual na kapaligiran na pinamamahalaan ng OpenAIDoon ay maaari kang gumamit ng visual browser upang makipag-ugnayan sa mga website tulad ng ginagawa ng isang tao, mag-access ng mga terminal upang magpatakbo ng code o magmanipula ng mga file, at kumonekta sa mga panlabas na application (gaya ng Google Drive, GitHub, o Gmail) kung pinahihintulutan ito ng user. Ang bawat gawain ay tumatakbo sa isang nakahiwalay na pansamantalang sessionNa Ito ay tinanggal kapag nakumpleto upang palakasin ang seguridad at privacy.

Ang disenyong ito ay nagpapahintulot sa iyo na Suriin ang impormasyon sa real time, i-edit ang mga dokumento, at gumawa ng mga desisyon ayon sa kontekstoHalimbawa, maaari kang tumukoy ng appointment sa iyong kalendaryo at, kung gusto mo, muling iiskedyul ito o maghanda ng ulat na naka-link sa petsang iyon.

Benchmark: Paano gumaganap ang ahente laban sa mga tao at iba pang mga modelo?

Ang mga unang paghahambing na pagsusulit (SpreadsheetBench, DSBinch y BrowseComp) ay nagpakita na ang Nahigitan ng ahente ng ChatGPT ang mga nakaraang modelo ng AI at maraming tao sa mga gawain sa pagsusuri, pag-edit, at pag-navigateSa mga benchmark ng spreadsheet at agham ng data, nakamit ng ahente ang katumpakan at kahusayan sa pagsira ng rekord, na nagpapahiwatig ng isang makabuluhang teknolohikal na kapanahunan.

Eksklusibong nilalaman - Mag-click Dito  Gemma 3n: Ang bagong pakikipagsapalaran ng Google na magdala ng advanced na AI sa anumang device

Sa totoong kapaligiran, Ito ay napatunayang may kakayahang magsuri ng malalaking volume ng mga email o mensahe ng customer, pag-synthesize ng mga profile ng user, pag-automate ng mga ulat sa pananalapi at pamamahala sa mga gawain sa marketing., lahat sa ilang minuto at walang patuloy na interbensyon ng user.

Privacy at seguridad: ganap na kontrol ng user

Naglagay ng espesyal ang OpenAI diin sa seguridad at pagbibigay sa user ng kumpletong kontrol sa mga aksyon ng ahente. Anumang mga sensitibong operasyon (tulad ng pagsusumite ng mga form, paggawa ng mga reserbasyon, o pagpapatupad ng code) nangangailangan ng tahasang kumpirmasyon bago isagawa. Ang ahente ay naka-program sa tanggihan ang mga aksyon na may mataas na panganib, gaya ng mga transaksyon sa pananalapi o potensyal na mapanganib na mga gawain. Bukod pa rito, maaaring mabura ang lahat ng aktibidad sa isang pag-click, at hindi naiimbak ang data ng user pagkatapos ng session.

Sinusubaybayan ng system ang buong proseso at nagbibigay-daan sa real-time na pagmamasid sa mga hakbang na ginawa ng AI. Kung gugustuhin ng user, maaari nilang i-pause o matakpan ang anumang pagkilos bago ang huling pagpapatupad nito, na magpapatibay sa transparency at pagtitiwala sa tool.