- Reddit je vložil tožbo proti Anthropicu, ker naj bi brez dovoljenja uporabljal uporabniške podatke za učenje modelov umetne inteligence.
- V tožbi se Anthropic obtožuje, da je večkrat dostopal do strežnikov Reddit in zaobšel tehnične omejitve ter predhodne dogovore.
- Reddit poudarja, da imajo druga podjetja v sektorju, kot sta OpenAI in Google, licence za uporabo njihovih podatkov, česar Anthropic ni storil.
- Vrednost podatkov Reddita za umetno inteligenco je v raznolikosti in avtentičnosti pogovorov, zaradi česar so zelo iskani za učenje naprednih modelov.
Reddit je prekinil molk in se odločil, da bo Anthropic tožil., znani razvijalec umetne inteligence, glede na to, da je zlorabil podatke, ki so jih ustvarili uporabniki platformePrimer je sprožil razpravo o omejitvah in obveznostih, ki jih morajo prevzeti tako razvijalci umetne inteligence kot velike spletne skupnosti.
Sprožilec je bil domnevno množično pridobivanje informacij z antropnimi sistemi, brez formalne licenčne pogodbe ali izrecnega soglasja Reddita. Glede na tožbo, vloženo na višjem sodišču v San Franciscu, Antropik bi ignoriral, ob večkratnih priložnostih, pravila in mehanizmi, ki jih Reddit uporablja za zaščito vsebin, ki jih ustvarijo njegovi uporabniki.
Obtožbe o nezakonitem dostopu in spor glede licenciranja

Forumska platforma trdi, da Anthropic je do svojih strežnikov dostopal več kot 100.000-krat., tudi po javnih obljubah Anthropica, da tega ne bo storil. Reddit vztraja, da bi se to vedenje zgodilo kljub poskusom pogajanj o licenci, kot so to že dosegli s podjetji, kot sta OpenAI in Google, ki so formalizirala sporazume o uporabi javnega arhiva Reddita pri usposabljanju svojih modelov.
Reddit poudarja, da Anthropično vedenje je v nasprotju javna podoba, ki jo podjetje z umetno inteligenco projicira, ki se opredeljuje kot etični standard v sektorju. Vendar pa družbeno omrežje v sodnih dokumentih obtožuje Anthropic, da deluje "dvolično" in da svoje komercialne interese postavlja pred pravila in pravice uporabnikov.
Razmere so povzročile posebno nelagodje pri Reddit, ki se spominja, da je njegova platforma Gosti eno največjih in najrazličnejših podatkovnih zbirk človeških pogovorov na internetu.Te razprave, organizirane v tisočih tematskih podforumih ali subredditih, so zaradi svoje avtentičnosti in raznolikosti mnenj izjemno dragocene za učenje sistemov naravnega jezika.
Podatki Reddita, veliko bogastvo za umetno inteligenco

Privlačnost Reddita za razvijalce umetne inteligence je v bogastvu vsebine. Objave in komentarji odražajo način, kako si ljudje izmenjujejo informacije, razpravljajo, se šalijo in izražajo čustva v različnih kontekstih, kar omogoča modelom umetne inteligence, da se naučijo odtenkov vsakdanjega jezika in človeške argumentacije.
Reddit je izrazil pripravljenost za sodelovanje s podjetji v sektorju umetne inteligence., pod pogojem, da obstaja transparenten in obojestransko koristen sporazum. Družbeno omrežje zato opozarja, da je sklenilo formalne licenčne sporazume z velikani, kot sta Google in OpenAI – slednji je podpisal maja 2024 –, ki jim omogočajo strukturiran in reguliran dostop do njihovih podatkov za izboljšanje sistemov, kot sta Gemini ali ChatGPT.
Primer Anthropica je bil zelo drugačen. Po poročanju Reddita je Anthropic kljub poskusom doseganja dogovora še naprej pridobival podatke. tudi po tem, ko so javno zagotovili, da bodo svojim botom onemogočili dostop do platforme. Reddit trdi, da podjetje z umetno inteligenco tudi ni spoštovalo brisanja objav, ki so jih izbrisali uporabniki., kar so obljubila in izpolnila druga tehnološka podjetja.
Poslovni kontekst in odziv na povpraševanje

Redditova tožba poziva sodišče, naj prepovedati Anthropicu nadaljnjo uporabo nelicenciranega odlomka gradiva in da se dodeli odškodnina za povzročeno škodo. Medtem je tiskovni predstavnik podjetja Anthropic izjavil, da se podjetje z obtožbami ne strinja in da se namerava odločno braniti, čeprav ni navedlo podrobnosti o svoji strategiji.
Anthropic je ameriško podjetje za umetno inteligenco., ki so ga ustanovili nekdanji člani OpenAI. Njihov najbolj znani izdelek, Claude, neposredno konkurira klepetalnim robotom, kot je ChatGPT. Poleg tega podjetje ponuja tako brezplačne kot plačljive storitve, kar je povečalo njihovo tržno vrednost, čeprav še naprej povzroča polemike glede upravljanja podatkov, ki jih uporabljajo za usposabljanje svojih sistemov.
S svoje strani, Reddit poudarja svojo politiko glede rudarjenja podatkov se utrjeno leta 2024 da bi preprečili neselektivni dostop zunanjih organizacij, čeprav to odpira vrata pogajanjem in reguliranim licencam. Te vrste sporazumov, kot so tisti, sklenjeni z Googlom in OpenAI, veljajo za bistvene za diverzifikacijo njihovega modela prihodkov, zlasti po prvih javnih ponudbah delnic.
Redditova pritožba proti Anthropicu je pretresla tehnološki sektor in ga ponovno odprla. razprava o tem, kdo lahko in bi moral imeti koristi od ogromnega arhiva znanja, ustvarjenega na odprtih forumih na internetuPravna bitka bo določila tako meje rudarjenja podatkov kot tudi pravice skupnosti v dobi umetne inteligence.
Sem tehnološki navdušenec, ki je svoja "geek" zanimanja spremenil v poklic. Več kot 10 let svojega življenja sem porabil za uporabo vrhunske tehnologije in premleval najrazličnejše programe iz čiste radovednosti. Zdaj sem se specializiral za računalniško tehnologijo in video igre. To je zato, ker že več kot 5 let pišem za različna spletna mesta o tehnologiji in video igrah ter ustvarjam članke, ki vam želijo dati informacije, ki jih potrebujete, v jeziku, ki je razumljiv vsem.
Če imate kakršna koli vprašanja, moje znanje sega od vsega v zvezi z operacijskim sistemom Windows kot tudi Androidom za mobilne telefone. In moja zaveza je vam, vedno sem pripravljen porabiti nekaj minut in vam pomagati razrešiti kakršna koli vprašanja, ki jih morda imate v tem internetnem svetu.
