Toto je algoritmus Grok s otvoreným zdrojovým kódom, ktorý poháňa X feed

Posledná aktualizácia: 01.02.2024

  • X zverejňuje na GitHub architektúru algoritmu Grok, ktorý objednáva kanál „Pre vás“.
  • Systém, založený na filme Transformers, sa učí relevantnosť z histórie interakcií
  • Open source sa snaží o väčšiu transparentnosť a reaguje na regulačný tlak, najmä v EÚ
  • Tvorcovia, inzerenti a regulačné orgány môžu kontrolovať, ako sa organický a propagovaný obsah miešajú.
open source algoritmus Grok

Platforma X, predtým Twitter a vo vlastníctve Elona Muska, urobila v tomto sektore nezvyčajný krok. publikovať algoritmus Grok ako open source ktorá určuje, čo sa zobrazí v používateľských kanáloch. Spoločnosť zverejnil na GitHub architektúru strojového učenia, ktorá poháňa kartu „Pre vás“, jeden z najcitlivejších softvérov na akejkoľvek sociálnej sieti.

S týmto pohybom, X Otvára externej kontrole logiku, ktorá mieša organický obsah a reklamy. v časových líniách, čo bolo doteraz považované za obchodné tajomstvo. Musk a inžiniersky tím tvrdia, že Transparentnosť pomôže zlepšiť kvalitu odporúčaní A mimochodom, posilňuje to pozíciu platformy u regulačných orgánov, najmä v Európskej únii.

Otvorený algoritmus založený na architektúre Grok

Open source algoritmu Grok

Inžiniersky tím X oznámil, že vydal nový algoritmus odporúčaníRepozitár GitHub, poháňaný rovnakou architektúrou Transformer, akú používa model Grok vyvinutý spoločnosťou xAI, opisuje komplexný systém strojového učenia, ktorý hodnotí príspevky v kanáli „Pre vás“ na základe pravdepodobnosti interakcie používateľa.

Z technického hľadiska, X podrobne opisuje a Model transformátora vyškolený na predpovedanie akcií ako sú lajky, odpovede, opätovné zverejnenia a iné formy zapojenia. Namiesto používania ručne písaných pravidiel sa systém učí priamo zo vzorcov správania používateľov, čím sa znižuje tzv. „manuálne inžinierstvo funkcií“ a zjednodušuje sa dátová infraštruktúra.

Implementácia sa spolieha na Rust a Python na vyhľadávanie a hodnotenie obsahuVyznačuje sa modulárnou architektúrou, ktorá oddeľuje počiatočnú fázu vyhľadávania publikácií od následného kroku hodnotenia. Kód obsahuje diagramy a prístupnú dokumentáciu, ktoré v širších súvislostiach vysvetľujú, ako sú rôzne vnútorné komponenty systému prepojené.

Sám Elon Musk verejne uznal, že algoritmus „je hlúpy a potrebuje masívne vylepšenia“, ale obhajoval to. zobraziť proces zlepšovania v reálnom čase A transparentnosť je lepšia ako udržiavanie čiernej skrinky. Podľa podnikateľa žiadna iná veľká sociálna sieť neotvára jadro svojho systému odporúčaní týmto spôsobom.

Odborníci z odvetvia, ako napríklad Midhun Krishna M, spoluzakladateľ a generálny riaditeľ platformy TknOps.io, poukazujú na to, že odhalenie tejto architektúry založenej na Grok Ponúka komunite referenčnú mapu pochopiť a zlepšiť odporúčacie systémy, ktoré boli tradične nedostupné. Pre európskych vývojárov a spoločnosti môžu tieto technické informácie slúžiť ako základ pre budovanie vlastných riešení alebo audítorských postupov na iných platformách.

Ako Grok rozhoduje o tom, čo sa zobrazí v kanáli „Pre vás“

Podľa zverejnenej dokumentácie, Algoritmus X načítava obsah z dvoch veľkých zdrojov: príspevky z účtov, ktoré používateľ sleduje a „offline“ publikácie nájdené pomocou modelov obnovy založených na strojovom učení. Obe kombinujú potom v jednom zozname pomocou systému hodnotenia, ktorý odhaduje pravdepodobnosť interakcie s každým tweetom.

Exkluzívny obsah – kliknite sem  Ako si pozrieť videá, ktoré sa mi páčili na TikToku

Proces zahŕňa fázu filtrovania, v ktorej sa vyraďujú nasledujúce látky Tweety z blokovaných účtov, stlmený obsah podľa kľúčových slov, príspevkov označených ako príliš násilné alebo klasifikovaných ako spam, okrem iných kategórií. Až po tomto preverení systém zoradí obsah na základe jeho očakávanej relevantnosti.

Model Transformera založený na Grokovi je poháňaný systémom história účasti každého používateľaToto sleduje, aké príspevky si používatelia prezerajú, na ktoré klikajú, ktoré tweety označujú ako obľúbené, na koho odpovedajú a aký obsah nakoniec zdieľajú. Na základe týchto vzorcov sa systém učí predvídať, ktoré typy správ s najväčšou pravdepodobnosťou vygenerujú interakciu v budúcich reláciách.

Grok dokonca zašiel tak ďaleko, že analyzoval svoj vlastný algoritmus a zdôraznil päť kľúčových faktorov virality príspevkov: predpovede interakcií na základe histórie používateľov, relevantnosť a aktuálnosť obsahu, rozmanitosť autorov Aby ste sa vyhli opakovaniam, vyvažujte po sebe idúce účty a návrhy modelov na jednej strane a negatívne signály, ako sú blokovania alebo umlčania, ktoré znižujú skóre určitých účtov.

Vďaka týmto informáciám môžu tvorcovia a spoločnosti lepšie pochopiť Prečo sú určité publikácie úspešné? A niektorí nie, bez toho, aby sa uchyľovali ku konšpiračným teóriám o „tieňových zákazoch“ alebo neviditeľných sankciách. Kód neodpovedá na všetky otázky, ale poskytuje pevnejší základ pre analýzu správania sa v informačných kanáloch.

Organický obsah, reklamy a metrika „sekundy bez ľútosti“

Jednou z nových funkcií tejto publikácie je, že X sľúbil otvoriť aj logika, ktorá riadi kombináciu organických príspevkov a reklám v informačnom kanáli. Uvedeným cieľom je objasniť, ako je propagovaný obsah integrovaný do každodenného zážitku používateľa bez toho, aby bol rušivý.

Medzi metrikami, ktoré sa objavujú v dokumentácii, vyniká koncept. „Sekundy bez ľútosti pre používateľov“Toto je miera času, ktorý človek strávi konzumáciou obsahu bez pocitu, že ho premárnil. Algoritmus používa túto metriku na posúdenie, či bol zážitok z tweetu alebo reklamy pozitívny alebo nie.

V praxi sa organické príspevky hodnotia na základe signálov, ako sú zobrazenia, lajky, odpovede a zdieľania, zatiaľ čo reklamy sa hodnotia pomocou veľmi podobných kritérií relevantnosti a výkonnosti. Systém sa tak snaží postupne integrujte reklamuvkladanie komerčných správ, ktoré teoreticky zodpovedajú zisteným záujmom každého používateľa.

Pre európskych inzerentov táto väčšia prehľadnosť eliminuje časť „slepého hrania“, ktoré je bežné na hlavných platformách. Vidia, aspoň vo všeobecnosti, aké signály algoritmus oceňuje a ako sa kombinujú s nepropagovaným obsahom, čo by mohlo ovplyvniť plánovanie kampane a kreatívny dizajn.

Exkluzívny obsah – kliknite sem  Ako sa odhlásiť z Facebooku na mobile

Zmeny ovplyvňujú aj priemerného používateľa: vedomie, že rovnaký systém relevantnosti ovplyvňuje bežné tweety aj reklamy, umožňuje lepšie posúdiť rozsah, v akom reklama ovplyvňuje informačný kanál a odhaliť možné excesy alebo zaujatosť pri šírení obchodných správ.

Open source pod silným regulačným tlakom EÚ

Open source algoritmu Grok

Rozhodnutie spoločnosti X otvoriť algoritmus Grok prichádza v chúlostivom čase. rastúci regulačný tlak zo strany BruseluPlatforma mala nezhody s Európskou úniou v otázkach transparentnosti a moderovania obsahu vrátane finančných sankcií spojených s dodržiavaním zákona o digitálnych službách (DSA).

DSA núti hlavné platformy v Európe, aby vysvetlite, ako fungujú ich odporúčacie systémy a ako zosilňujú určité typy obsahu. Zverejnenie kódu algoritmu sa interpretuje ako premyslený krok: X spĺňa, aspoň čiastočne, požiadavky na transparentnosť, pričom dôkazné bremeno presúva na regulačné orgány.

Ponukou otvoreného úložiska môže spoločnosť X požiadať európske orgány o zakladať akékoľvek obvinenie zo zaujatosti alebo manipulácie na v špecifických analýzach dostupného kódu. Týmto spôsobom spoločnosť nielen potvrdzuje svoju transparentnosť, ale tiež zdôrazňuje technické dohľadové schopnosti regulačných orgánov.

Kritici platformy opisujú tento manéver ako akúsi „pascu“ pre inštitúcie, ktorej cieľom je brániť právnym argumentom proti nej. Iní pozorovatelia to vidia ako príležitosť zvýšiť štandard zodpovednosti v celom technologickom sektore, čo núti konkurentov vysvetľovať, prečo nechávajú svoje algoritmy zatvorené.

V každom prípade zverejnenie algoritmu Groka otvára nový front v európskej diskusii o... Ako by mala byť regulovaná umelá inteligencia aplikovaná na sociálne siete?Odteraz budú môcť akademici, organizácie občianskej spoločnosti a úrady porovnať verejnú diskusiu X so skutočným fungovaním kódu zverejneného na GitHube.

Väčšia transparentnosť pre tvorcov a malé podniky

Pre tých, ktorí sa živia aktivitami na sociálnych sieťach, predstavuje otvorenie algoritmu významnú zmenu. Tvorcovia, novinári, malé podniky a profesionáli, ktorí sa spoliehajú na X pri oslovovaní svojho publika, majú teraz prístup k... oveľa presnejší röntgenový snímok rozloženia viditeľnosti na platforme.

Úložisko vám umožňuje identifikovať, ktoré akcie majú najväčšiu váhu pri zvyšovaní pozícií v informačnom kanáli: Reakcie, ktoré podnecujú konverzáciu, opätovné zverejnenia, ktoré rozširujú dosahDlhodobé interakcie alebo negatívne signály, ako sú bloky a umlčania, ktoré znižujú skóre účtu. S týmito údajmi je jednoduchšie navrhovať stratégie uverejňovania príspevkov s minimálnym základom.

Pre samostatne zárobkovo činné osoby a mikropodniky v Európe, ktoré často fungujú s veľmi obmedzenými zdrojmi, je možnosť porozumieť systému a auditovať ho bez sprostredkovateľov Môže to znížiť závislosť od externých konzultantov alebo agentúr. Analýza kódu a dokumentácie im umožňuje prispôsobiť formáty, harmonogramy a štýly obsahu správaniu, ktoré algoritmus odmeňuje.

Exkluzívny obsah – kliknite sem  Ako odstrániť video z TikToku: Kroky a úvahy

Spoločnosť sa tiež zaviazala k publikovaniu pravidelné aktualizácie (približne každé štyri týždne) s poznámkami vývojárov s podrobnosťami o vykonaných zmenách. Ak sa toto tempo zachová, tí, ktorí s X pracujú denne, budú môcť sledovať vývoj systému a rýchlo zistiť, či im nejaké úpravy prospievajú alebo škodia.

To neznamená, že sťažnosti alebo frustrácia zmiznú, ale na papieri to znižuje pocit boja proti úplne nepriehľadnému mechanizmu. Európska technická komunita po prvýkrát... skutočná kódová základňa na experimentovanie, navrhovať vylepšenia alebo dokonca vytvárať nezávislé analytické nástroje.

Hranice otvorenosti: transparentnosť áno, ale s výhradami

Algoritmus Grok s otvoreným zdrojovým kódom

Napriek pútavému charakteru oznámenia viacerí odborníci poukazujú na to, že Otvorenie kódu neznamená odhalenie celého systémuArchitektúra algoritmu Grok je k dispozícii, ale dáta použité na trénovanie a infraštruktúra vykonávania na strane servera zostávajú súkromné.

Niektorí analytici definujú túto situáciu ako „sklenenú skrinku“: môžete vidieť štruktúru a všeobecnú logiku, ale Úplný tok údajov nie je možné sledovať v reálnom časeBez prístupu k trénovacej sade alebo aktualizovaným parametrom je ťažké presne overiť, ako sa v praxi korigujú odchýlky alebo ako sa spracováva citlivý obsah.

Tento hybridný prístup vyvoláva otázky, či je prechod na open source skôr reakciou na cvičenie v oblasti vzťahov s verejnosťou než k plnej zodpovednosti. Kritici pripomínajú, že keď Twitter pred rokmi prvýkrát čiastočne zverejnil svoj algoritmus, mnohí tento krok označili za „divadlo transparentnosti“ kvôli množstvu vynechaných údajov.

Situáciu komplikuje nedávny kontext: spoločnosť X je pod drobnohľadom kvôli používaniu svojho chatbota Grok na generovanie a úprava sexuálne motivovaných obrázkovvrátane obrázkov maloletých, čo viedlo prokurátorov a regulačné orgány vo viacerých krajinách k začatiu vyšetrovaní. V reakcii na tieto problémy spoločnosť obmedzila určité funkcie generovania a úpravy obrázkov na platiacich používateľov a zaviedla technické opatrenia na zabránenie manipulácii s fotografiami skutočných ľudí.

Súbežne spoločnosť X zrušila prístup k API niektorým projektom, ktoré finančne motivovali používateľov k publikovaniu obsahu, pričom tvrdila, že riziká spamu generovaného umelou inteligenciouVšetky tieto kroky teraz koexistujú s diskurzom o otvorenosti algoritmu, čo podporuje pocit, že spoločnosť kombinuje gestá transparentnosti s reštriktívnejšími rozhodnutiami v iných oblastiach.

Zverejnením algoritmu Grok ako open source spoločnosť X odhalila jeden zo svojich najcitlivejších technologických aktív a zároveň si stanovila základy, na základe ktorých chce byť posudzovaná: auditovateľný systém odporúčaní vo svojom návrhuJeho skutočné uplatnenie však stále závisí od interných údajov a rozhodnutí. Pre európskych používateľov, tvorcov, regulačné orgány a spoločnosti bude výzvou využiť toto informačné okno bez toho, aby stratili zo zreteľa aspekty, ktoré zostávajú mimo dohľadu verejnosti.