- Il-Wikipedija qed tesperjenza tagħbija żejda tat-traffiku kkawżata minn bots tal-IA li jinjoraw ir-regoli tal-aċċess.
- It-tkaxkir jiġbdu l-kontenut biex iħarrġu mudelli, jaħkmu servers u jissostitwixxu lill-utenti umani.
- Proġetti ta' softwer b'xejn huma affettwati wkoll minn żieda fit-traffiku u spejjeż assoċjati.
- Qed jiġu kkunsidrati miżuri u ftehimiet ġodda bejn pjattaformi miftuħa u kumpaniji tal-IA biex tiġi żgurata s-sostenibbiltà tal-ekosistema diġitali.

F'dawn l-aħħar xhur, il-pjattaformi diġitali ffukaw fuq il-qsim ħieles tal-għarfien bdew juru sinjali ta għeja quddiem l-attività dejjem tikber tal- trackers tal-intelliġenza artifiċjali. Servizzi bħall-Wikipedija qed jesperjenzaw pressjoni bla preċedent fuq l-infrastruttura tagħhom, ġenerata mhux minn żieda ġenwina fl-utenti umani, iżda minn L-attività bla heda tal-bots iffokat fuq il-qbid tad-dejta biex jitimgħu mudelli ġenerattivi tal-AI.
Dawn it-trackers, spiss moħbija jew mhux identifikata b'mod ċar, L-iskop tagħhom huwa li jiġbru bil-kbir testi, stampi, vidjows u materjali pubbliċi oħra disponibbli fuq il-web. bil-għan li jitjieb it-taħriġ tal-mudelli tal-lingwa u s-sistemi tal-ġenerazzjoni tal-kontenut viżiv.
Wikipedija u l-ispiża li tkun miftuħa
Il-Fondazzjoni Wikimedia, li żżomm il-Wikipedija u proġetti relatati, ħabbret dan Mill-bidu tal-2024, it-traffiku fuq is-servers tiegħu żdied b'50%.. Din iż-żieda ma tkunx immexxija minn interess spontanju tal-qarrejja, iżda minn bots li huma ddedikati għall-iskannjar sistematiku tal-kontenut disponibbli. Fil-fatt, huwa stmat li Madwar żewġ terzi tat-traffiku dirett lejn iċ-ċentri tad-dejta l-aktar għaljin ġej minn dawn l-għodod awtomatizzati..
Il-problema hija aggravata mill-fatt li ħafna minn dawn il-bots jinjora l-linji gwida stabbiliti fil-fajl 'robots.txt', li huwa tradizzjonalment użat biex jimmarka liema partijiet ta' websajt jistgħu jew ma jistgħux jiġu indiċjati minn magni. Dan il-ksur tar-regola kabbar ir-riżorsi tal-Wikimedia, ixekkel l-aċċess normali tal-utent u kellu impatt fuq il-prestazzjoni ġenerali tas-servizz. Dan it-tip ta 'attività tista' tkun komparabbli ma ' spyware li jaffettwa l-privatezza tal-utenti.
"Il-kontenut huwa miftuħ, iżda li jżommu disponibbli huwa għali."L-organizzazzjoni tispjega. L-ospitar, is-servizz, u l-protezzjoni ta 'miljuni ta' artikli u fajls mhumiex b'xejn, minkejja li kulħadd jista 'jaċċessahom mingħajr ma jħallas.
Il-problema testendi għal irkejjen oħra tal-ekosistema ħielsa
Mhux biss il-Wikipedija li qed issofri l-effetti tal-ħsad tad-dejta indiskriminat mill-bots tal-AI.. Il-komunitajiet u l-iżviluppaturi tas-softwer b'xejn huma wkoll affettwati b'mod negattiv. Siti li jospitaw dokumentazzjoni teknika, libreriji tal-kodiċi, jew għodod open source qed jirrappurtaw żidiet f'daqqa fit-traffiku, ħafna drabi impossibbli li jiġu mmaniġġjati mingħajr konsegwenzi finanzjarji. It-tħassib dwar min qed jispia fuqek waqt li tibbrawżja huwa dejjem aktar rilevanti..
L-inġinier Gergely Orosz, pereżempju, Huwa ra kif fi kwistjoni ta’ ġimgħat wieħed mill-proġetti tiegħu mmultiplika l-konsum tal-bandwidth tiegħu b’sebgħa.. Din is-sitwazzjoni spiċċat tiġġenera spejjeż mhux mistennija minħabba traffiku żejjed li kellu jassumi hu stess.
Biex jikkontrobattu din is-sitwazzjoni, l-iżviluppaturi bħal Xe Iaso ħolqu għodod bħal Anubis, prokura inversa li iġiegħel lill-viżitaturi għal websajt biex jgħaddu minn test qasir qabel jaċċessaw il-kontenut. L-għan huwa li jiġu ffiltrati l-bots, li ġeneralment ifallu dawn it-testijiet, u jagħtu prijorità lill-aċċess tal-bniedem. Madankollu, dawn il-metodi għandhom effettività limitata, peress It-tkaxkir tal-AI qed jevolvu kontinwament biex jevitaw dawn l-ostakli., bl-użu ta’ tekniki bħall-użu ta’ indirizzi IP residenzjali jew bidliet frekwenti fl-identità.
Mid-difiża għall-offiża: nases għall-bots
Xi żviluppaturi adottaw strateġiji aktar proattivi. Għodod bħal Nepenthes o Labirint tal-AI, dawn tal-aħħar imħaddma minn servizzi bħal Cloudflare, ġew iddisinjati biex jattiraw bots f'labirint ta' kontenut falz jew irrilevanti. B'dan il-mod, it-tkaxkir jaħlu r-riżorsi jippruvaw jinbarax informazzjoni bla siwi, filwaqt li s-sistemi leġittimi huma inqas mgħobbija.
Id-dilemma tal-web ħielsa u l-mudelli AI
Din is-sitwazzjoni fiha kunflitt sottostanti: Il-paradoss li l-ftuħ tal-Internet, li ffaċilita l-iżvilupp tal-intelliġenza artifiċjali, issa jhedded il-vijabbiltà tal-ispazji diġitali li jitimgħu dik l-istess AI.. Kumpaniji kbar tat-teknoloġija jagħmlu profitti kbar billi jħarrġu l-mudelli tagħhom fuq kontenut b'xejn, iżda Normalment ma jikkontribwixxux għall-manutenzjoni tal-infrastruttura li tagħmilha possibbli.
Il-fondazzjonijiet u l-komunitajiet affettwati jinsistu li Huwa meħtieġ patt ġdid ta' koeżistenza diġitali. Dan għandu jinkludi, mill-inqas, l-aspetti li ġejjin:
- Kontribuzzjonijiet finanzjarji minn kumpaniji tal-IA għall-pjattaformi li jużaw bħala sors tad-dejta.
- Implimentazzjoni ta' APIs speċifiċi biex taċċessa l-kontenut b'mod regolat, skalabbli u sostenibbli.
- Osservanza skrupluża tar-regoli tal-esklużjoni tal-bot, bħal 'robots.txt', li ħafna għodod bħalissa jinjoraw.
- Attribuzzjoni ta' kontenut użat mill-ġdid, sabiex il-valur tal-kontributuri oriġinali jiġi rikonoxxut.
Wikimedia u oħrajn iħeġġu azzjoni
Lil hinn mill-inizjattivi individwali, Il-Fondazzjoni Wikimedia qed tappoġġja miżuri kkoordinati biex jipprevjenu l-kollass tal-infrastruttura tagħhom. Pjattaformi bħal Stack Overflow diġà bdew iċċarġjaw għall-aċċess awtomatizzat għall-kontenut tagħhom, u huwa possibbli li oħrajn isegwu l-istess jekk is-sitwazzjoni ma titjiebx.
Il-pressjoni eċċessiva li l-bots tal-IA jeżerċitaw fuq proġetti volontarji u mhux għall-profitt jistgħu jispiċċaw jaċċelleraw l-għeluq jew ir-restrizzjoni tal-aċċess liberu għal ħafna mill-għarfien onlajn. Konsegwenza paradossali, meta wieħed iqis li dawn is-sorsi kienu ewlenin għall-avvanz tat-teknoloġija li llum thedded l-eżistenza tagħhom. Il-ħtieġa għal browser sigur hija essenzjali f'din is-sitwazzjoni..
L-isfida attwali hija issib mudell għal użu responsabbli tar-riżorsi diġitali miftuħa, li tiżgura s-sostenibbiltà kemm tal-mudelli tal-IA kif ukoll tan-netwerk tal-għarfien kollaborattiv li jappoġġjahom.
Jekk ma jintlaħaqx bilanċ ġust bejn l-isfruttament u l-kollaborazzjoni, L-ekosistema tal-web li tat l-akbar avvanzi fl-AI tista’ ssir ukoll waħda mill-vittmi ewlenin tagħha..
Jien dilettant tat-teknoloġija li bidlet l-interessi "geek" tiegħu fi professjoni. Għamilt aktar minn 10 snin minn ħajti nuża teknoloġija avvanzata u nagħmel tbagħbis ma’ kull tip ta’ programmi għal kurżità pura. Issa speċjajtejt fit-teknoloġija tal-kompjuter u l-logħob tal-kompjuter. Dan għaliex ilni aktar minn 5 snin naħdem nikteb għal diversi websajts dwar teknoloġija u video games, noħloq artikli li jfittxu li jagħtuk l-informazzjoni li għandek bżonn b’lingwa li tinftiehem minn kulħadd.
Jekk għandek xi mistoqsijiet, l-għarfien tiegħi jvarja minn dak kollu relatat mas-sistema operattiva Windows kif ukoll Android għat-telefowns ċellulari. U l-impenn tiegħi huwa għalik, jien dejjem lest li nqatta' ftit minuti u ngħinek issolvi kwalunkwe mistoqsija li jista' jkollok f'din id-dinja tal-internet.


Il-kummenti huma magħluqa.