Claude pro Chrome: Agent, který testuje akce v prohlížeči

Poslední aktualizace: 01.02.2024

  • Claudeův pilotní program Chrome s počátečním přístupem k 1.000 XNUMX předplatitelům tarifu Max a otevřenou čekací listinou.
  • Agent může číst kontext stránky a provádět akce v prohlížeči s oprávněními a potvrzeními.
  • Bezpečnostní opatření, která snižují míru promptních injekcí z 23,6 % na 11,2 % a zmírňují útoky specifické pro prohlížeč.
  • Omezený přístup k vysoce rizikovým kategoriím a kontrolám na úrovni pracovišť s cílem minimalizovat škody.

Claudeovo rozšíření pro Chrome

Po spuštění Claude 4.1, Anthropic se prosadil v asistované navigaci s Náhled Claude pro Chrome, agent, který pracuje přímo v prohlížeči, aby viděl, co je na obrazovce, sledoval postup a plnil úkoly pod kontrolou uživatele.

Společnost se rozhodne pro vysoce kontrolovaná implementace: začíná s 1.000 XNUMX uživateli tarifu Max a čekacím systémem pro opatrné rozšiřování přístupu, čímž se Zaměřte se na bezpečnost a shromážděte skutečnou zpětnou vazbu, než jej zpřístupníte veřejnosti..

Co je Claude pro Chrome?

Agent prohlížeče Claude

Toto je rozšíření, které přidat boční panel v Chromu kde si můžete povídat s Claudem a zároveň si udržet přehled o tom, co se děje na aktuální kartětext stránky, viditelné formuláře a interakce, kterou agent sám provádí.

Na rozdíl od prostého asistenta, který pouze odpovídá na otázky, Claude dokáže provádět akce v prohlížeči pokud jim dovolíte: klikat na tlačítka, vyplňovat formuláře, procházet proces nákupu nebo publikovat obsah, vždy s výhradou povolení a potvrzení.

Exkluzivní obsah – klikněte zde  Spotify se integruje s ChatGPT: jak to funguje a co můžete dělat

Anthropic tvrdí, že tento přístup je přirozený vývoj z jeho nedávné práce propojující Clauda s kalendáři, dokumenty a nástroji pro zvýšení produktivityPřenesení těchto funkcí do prohlížeče přináší kontinuitu úkolům v reálném světě.

V interním testování pomohly rané verze spravovat kalendáře a e-maily, automatizovat rutinní výkazy výdajů a ověřovat uživatelské toky na webových stránkách, a také psát odpovědi nebo shrnovat komentáře ve společných dokumentech.

Co můžete dělat v prohlížeči

Claude pro Chrome

Agent může vykonávat úkoly jako například vyhledávat reklamy s konkrétními kritérii na realitních portálech, shrnutí příspěvků v dokumentu Google nebo přidávání produktů do nákupního košíku v doručovací službě, aniž by se ztratil přehled o kontextu. Například v každodenních situacích to umožňuje vyplňte údaje o rezervaci z informací, které vidíte na stránce, a konečné potvrzení necháte ve svých rukou, nebo že Zkontrolujte odeslané e-maily, zda na ně čekají zprávy..

Pro opakované požadavky, jako např. zadávání dat a formulářů, agent zefektivňuje mechanické kroky a uvolňuje čas pro úkoly s vyšší hodnotou, vždy s možnostmi sledování nebo zastavení akcí, pokud něco nesedí.

Společnost již dříve zkoumala ovládání počítače pomocí funkce Použití počítače a nyní s rozhraním prohlížeče... hledá přesnější interakci což snižuje nejednoznačnosti a nabízí lepší sledovatelnost každé akce.

Bezpečnost: skutečná rizika a výsledky testů

Agenti používající prohlížeč klíčové riziko: okamžité injekce skryté na webových stránkách, v e-mailech nebo dokumentech, které se pokoušejí přimět model k provedení škodlivých instrukcí bez vědomí uživatele.

Exkluzivní obsah – klikněte zde  Co je umělá inteligence Wombo?

Anthropic spojil 123 testovacích případů, které pokrývají 29 scénářů útokuBez zmírňujících opatření byla míra úspěšnosti injekcí 23,6 %, což je u potenciálně citlivých akcií znepokojivá míra.

Mezi příklady předcházejícími obhajobě, jeden objednávka zamaskovaná v e-mailu vedlo agenta k odstranění uživatelových zpráv bez požádání o potvrzení, což ilustruje typ škody, kterou může způsobit dobře skrytý pokyn protivníka.

S opatřeními uplatňovanými v tzv. „„autonomní režim“, míra úspěšnosti těchto útoků klesla za stejných podmínek na 11,2 %a u sady problémů specifických pro prohlížeč (jako jsou neviditelná pole formuláře v DOM nebo instrukce v URL adrese či názvu karty) klesla úspěšnost z 35,7 % na 0 %.

Ochranná opatření a limity

Zabezpečení prohlížečového agenta

První bariérou je systém oprávnění na úrovni webuPřístup Clauda ke konkrétním doménám můžete kdykoli v nastavení udělit nebo odebrat a omezit jeho rozsah.

Kromě toho agent požaduje potvrzení pro vysoce rizikové akcie například zveřejňování, nákup nebo sdílení osobních údajů; i když povolíte samostatný režim, ochranná opatření pro nejcitlivější případy zůstávají v platnosti.

Antropický má vylepšené systémové výzvy aby model provedl citlivými daty a ve výchozím nastavení blokoval vysoce rizikové kategorie, jako jsou finanční služby, obsah pro dospělé nebo pirátské stránky.

Exkluzivní obsah – klikněte zde  Warner Music a Suno uzavírají průkopnickou alianci v oblasti regulace hudby generované umělou inteligencí

Společnost testuje pokročilé klasifikátory které detekují podezřelé vzorce a neobvyklé požadavky na přístup, a to i v případě, že jsou skryté v zdánlivě legitimních kontextech, a budou i nadále rozšiřovat pokrytí známých i nově vznikajících útoků.

Přístup, dostupnost a další kroky

Ovládací prvky a oprávnění agenta

Počáteční přístup je omezen na 1.000 XNUMX předplatitelů tarifu Max (cena se pohybuje mezi 100 a 200 dolary měsíčně, v závislosti na zemi). Pokud máte zájem, můžete se přihlásit na čekací listinu na adrese claude.ai/chrome.

Jakmile je přístup schválen, instalace se provede z Internetový obchod Chrome a ověřeno Claudovými údaji. Doporučuje se začít s důvěryhodnými weby a vyhnout se těm, které se zabývají finančními, právními nebo lékařskými informacemi.

Pilotovy poznatky poslouží k upřesnit klasifikátory vkládání, posílení oprávnění a úprava chování modelu v reálných situacích, které se nevyskytují v testovací laboratoři.

Hnutí přichází uprostřed závodu o „agent prohlížeče“: Perplexity nyní nabízí CometGoogle integruje Gemini do Chromu a další hráči pracují na podobných funkcích. Anthropic se rozhodla postupovat pomalu, s bezpečností jako nejvyšší prioritou.

Claude pro Chrome se rýsuje jako významný krok směrem k webovým asistentům, kteří nejen reagují, ale také responzivně jednají; Údaje o jeho postupném zavádění a zmírňování dopadů naznačují pokrok, ačkoli je před námi ještě dlouhá cesta. přiblížit operační riziko k přijatelným minimům.

Jazyk MU microsoft-0
Související článek:
Microsoft Mu: Nový jazykový model, který přináší lokální umělou inteligenci do Windows 11