- Reddit podal žalobu na spoločnosť Anthropic za údajné používanie používateľských údajov na trénovanie modelov umelej inteligencie bez jej povolenia.
- Sťažnosť obviňuje spoločnosť Anthropic z opakovaného prístupu k serverom Redditu a obchádzania technických obmedzení a predchádzajúcich dohôd.
- Reddit poukazuje na to, že iné spoločnosti v tomto sektore, ako napríklad OpenAI a Google, majú licencie na používanie jeho údajov, čo Anthropic neurobil.
- Hodnota dát z Redditu pre umelú inteligenciu spočíva v rozmanitosti a autenticite ich konverzácií, vďaka čomu sú veľmi vyhľadávané na trénovanie pokročilých modelov.
Reddit prerušil mlčanie a rozhodol sa žalovať spoločnosť Anthropic., známy vývojár umelej inteligencie, vzhľadom na to, že zneužil údaje vygenerované používateľmi platformyPrípad vyvolal diskusiu o obmedzeniach a povinnostiach, ktoré musia prevziať vývojári umelej inteligencie aj veľké online komunity.
Spúšťačom bol údajné hromadné získavanie informácií antropickými systémami, bez formálnej licenčnej zmluvy alebo výslovného súhlasu spoločnosti Reddit. Podľa žaloby podanej na Najvyššom súde v San Franciscu, Antropický by ignoroval, pri opakovaných príležitostiach, pravidlá a mechanizmy, ktoré Reddit uplatňuje na ochranu obsahu vytvoreného jeho používateľmi.
Obvinenia z nezákonného prístupu a spor o licenciu

Platforma fóra tvrdí, že Anthropic pristupoval k svojim serverom viac ako 100.000 XNUMX-krát., a to aj po verejných sľuboch spoločnosti Anthropic, že tak neurobí. Reddit tvrdí, že k tomuto správaniu by došlo aj napriek pokusom o vyjednanie licencie., ako to už dosiahli so spoločnosťami ako OpenAI a Google, ktoré formalizovali dohody o používaní verejného archívu Redditu pri trénovaní svojich modelov.
Reddit zdôrazňuje, že Správanie Anthropicu je v rozpore verejný obraz, ktorý spoločnosť zaoberajúca sa umelou inteligenciou premieta, pričom sa definuje ako etický štandard v danom sektore. V súdnych dokumentoch však sociálna sieť obviňuje spoločnosť Anthropic z „dvojstranného“ konania a uprednostňovania svojich obchodných záujmov pred pravidlami a právami používateľov.
Situácia spôsobila mimoriadne nepohodlie v facebook, ktorý si pripomína, že jeho platforma Hostuje jednu z najväčších a najrozmanitejších databáz ľudských konverzácií na internete.Tieto diskusie, organizované v tisíckach tematických podfór alebo subredditov, majú obrovskú hodnotu pre trénovanie systémov prirodzeného jazyka, vzhľadom na ich autentickosť a rozmanitosť názorov.
Dáta z Redditu, veľký poklad pre umelú inteligenciu

Príťažlivosť Redditu pre vývojárov umelej inteligencie spočíva v bohatstve obsahu. Príspevky a komentáre odrážajú spôsob, akým si ľudia vymieňajú informácie, diskutujú, žartujú a vyjadrujú emócie v rôznych kontextoch, čo... umožňuje modelom umelej inteligencie učiť sa nuansy každodenného jazyka a ľudskej argumentácie.
Reddit vyjadril ochotu spolupracovať so spoločnosťami v sektore umelej inteligencie., za predpokladu, že existuje transparentná a vzájomne výhodná dohoda. Sociálna sieť preto pripomína, že uzavrela formálne licenčné zmluvy s gigantmi ako Google a OpenAI – tá druhá podpísala v máji 2024 – ktoré im umožňujú štruktúrovaný a regulovaný prístup k ich údajom s cieľom zlepšiť systémy ako Gemini alebo ChatGPT.
Prípad Anthropic bol veľmi odlišný. Podľa Redditu, napriek pokusom o dosiahnutie porozumenia, Anthropic pokračoval v získavaní údajov. aj po verejnom uistení, že svojim botom zablokujú prístup k platforme. Reddit tvrdí, že spoločnosť s umelou inteligenciou tiež nerešpektovala odstraňovanie príspevkov vymazaných používateľmi., čo sľúbili a splnili aj iné technologické firmy.
Obchodný kontext a reakcia na dopyt

Reddit vo svojej žalobe žiada súd, aby zakázať spoločnosti Anthropic ďalšie používanie nelicencovaného úryvkového materiálu a aby bola priznaná kompenzácia za spôsobené škody. Medzitým hovorca spoločnosti Anthropic uviedol, že spoločnosť s obvineniami nesúhlasí a plánuje sa dôrazne brániť, hoci neposkytla konkrétne podrobnosti o svojej stratégii.
Anthropic je americká spoločnosť zaoberajúca sa umelou inteligenciou., ktorú založili bývalí členovia OpenAI. Jej najznámejší produkt, Claude, priamo konkuruje chatbotom ako ChatGPT. Okrem toho spoločnosť ponúka bezplatné aj platené služby, čo zvýšilo jej trhovú hodnotu, hoci naďalej vyvoláva kontroverzie ohľadom správy údajov, ktoré používajú trénovať svoje systémy.
Pre jeho časť, Reddit zdôrazňuje svoju politiku týkajúcu sa dolovania dát se stvrdnuté v roku 2024 zabrániť nerozlišujúcemu prístupu externých organizácií, hoci to otvára dvere rokovaniam a regulovaným licenciám. Tieto typy dohôd, ako napríklad tie, ktoré boli dosiahnuté so spoločnosťami Google a OpenAI, sa považujú za nevyhnutné pre diverzifikáciu ich modelu príjmov, najmä po ich IPO.
Sťažnosť Redditu na Anthropic otriasla technologickým sektorom a znovu ho otvorila. debata o tom, kto môže a mal by mať úžitok z obrovského archívu vedomostí vytvorených na otvorených fórach na internetePrávna bitka určí limity dolovania dát aj práva komunít vo veku umelej inteligencie.
Som technologický nadšenec, ktorý zo svojich „geekovských“ záujmov urobil povolanie. Strávil som viac ako 10 rokov svojho života používaním špičkových technológií a hraním so všetkými druhmi programov z čistej zvedavosti. Teraz som sa špecializoval na počítačovú techniku a videohry. Je to preto, že už viac ako 5 rokov píšem pre rôzne webové stránky o technológiách a videohrách a vytváram články, ktoré sa snažia poskytnúť vám potrebné informácie v jazyku, ktorý je zrozumiteľný pre každého.
Ak máte nejaké otázky, moje znalosti siahajú od všetkého, čo súvisí s operačným systémom Windows, ako aj Androidom pre mobilné telefóny. A môj záväzok je voči vám, vždy som ochotný venovať pár minút a pomôcť vám vyriešiť akékoľvek otázky, ktoré môžete mať v tomto internetovom svete.
