- Reddit podal žalobu na Anthropic za údajné zneužívání uživatelských dat k trénování modelů umělé inteligence bez povolení.
- Stížnost obviňuje společnost Anthropic z opakovaného přístupu k serverům Redditu a obcházení technických omezení a předchozích dohod.
- Reddit poukazuje na to, že další společnosti v tomto odvětví, jako například OpenAI a Google, mají licence k používání jeho dat, což Anthropic neudělala.
- Hodnota dat z Redditu pro umělou inteligenci spočívá v rozmanitosti a autenticitě jejich konverzací, což je činí velmi vyhledávanými pro trénování pokročilých modelů.
Reddit prolomil mlčení a rozhodl se žalovat Anthropic., známý vývojář umělé inteligence, vzhledem k tomu, že zneužil data generovaná uživateli platformyPřípad vyvolal debatu o limitech a povinnostech, které musí převzít jak vývojáři umělé inteligence, tak i velké online komunity.
Spouštěčem byl údajné hromadné vytěžování informací antropickými systémy, bez formální licenční smlouvy nebo výslovného souhlasu Redditu. Podle žaloby podané u vrchního soudu v San Franciscu, Antropický by ignoroval, při opakovaných příležitostech, pravidla a mechanismy, které Reddit používá k ochraně obsahu vytvořeného jeho uživateli.
Obvinění z nelegálního přístupu a spor o licenci

Platforma fóra tvrdí, že Anthropic přistupoval ke svým serverům více než 100.000 XNUMXkrát., a to i po veřejných slibech společnosti Anthropic, že tak neučiní. Reddit tvrdí, že k tomuto chování by došlo i přes pokusy o vyjednání licence., jak již dosáhli se společnostmi jako OpenAI a Google, které formalizovaly dohody o používání veřejného archivu Redditu při trénování svých modelů.
Reddit zdůrazňuje, že Chování Anthropice je v rozporu veřejný obraz, který společnost s umělou inteligencí vytváří, která se definuje jako etický standard v daném odvětví. V soudních dokumentech však sociální síť obviňuje Anthropic z „dvoustranného“ jednání a upřednostňování svých komerčních zájmů před pravidly a právy uživatelů.
Situace způsobila zvláštní nepohodlí v reddit, který si vzpomíná, že jeho platforma Hostuje jednu z největších a nejrozmanitějších databází lidských konverzací na internetu.Tyto diskuse, organizované v tisících tematických subfór nebo subredditů, mají pro trénování systémů přirozeného jazyka obrovskou hodnotu, a to vzhledem k jejich autenticitě a rozmanitosti názorů.
Data z Redditu, velký poklad pro umělou inteligenci

Atraktivita Redditu pro vývojáře umělé inteligence spočívá v bohatství obsahu. Příspěvky a komentáře odrážejí způsob, jakým si lidé vyměňují informace, debatují, vtipkují a vyjadřují emoce v různých kontextech, což… umožňuje modelům umělé inteligence učit se nuance každodenního jazyka a lidské argumentace.
Reddit vyjádřil ochotu spolupracovat se společnostmi v sektoru umělé inteligence., za předpokladu, že bude uzavřena transparentní a vzájemně výhodná dohoda. Sociální síť proto připomíná, že uzavřela formální licenční smlouvy s giganty, jako jsou Google a OpenAI – ta druhá byla podepsána v květnu 2024 – které jim umožňují strukturovaný a regulovaný přístup k jejich datům za účelem vylepšení systémů, jako jsou Gemini nebo ChatGPT.
Případ Anthropic byl velmi odlišný. Podle Redditu Anthropic i přes snahy o dosažení dohody pokračoval v extrakci dat. i poté, co veřejně ujistili, že svým botům zablokují přístup k platformě. Reddit tvrdí, že společnost s umělou inteligencí také nerespektovala mazání příspěvků smazaných uživateli., což slíbily a splnily i jiné technologické firmy.
Obchodní kontext a reakce na poptávku

Reddit ve své žalobě žádá soud, aby zakázat společnosti Anthropic další používání nelicencovaného výňatkového materiálu a aby byla přiznána náhrada způsobených škod. Mluvčí společnosti Anthropic mezitím uvedl, že společnost s obviněními nesouhlasí a plánuje se důrazně bránit, ačkoli neposkytla konkrétní podrobnosti o své strategii.
Anthropic je americká společnost zabývající se umělou inteligencí., založenou bývalými členy OpenAI. Její nejznámější produkt, Claude, přímo konkuruje chatbotům, jako je ChatGPT. Společnost navíc nabízí bezplatné i placené služby, což sice zvýšilo její tržní hodnotu, ačkoli nadále vyvolává kontroverze ohledně správy dat, která používají trénovat své systémy.
Pro jeho část, Reddit zdůrazňuje svou politiku týkající se těžby dat se zpevněno v roce 2024 aby se zabránilo nerozlišujícímu přístupu externích organizací, ačkoli to otevírá dveře k vyjednávání a regulovaným licencím. Tyto typy dohod, jako například ty uzavřené se společnostmi Google a OpenAI, jsou považovány za nezbytné pro diverzifikaci jejich modelu příjmů, zejména po jejich prvních veřejných nabídkách akcií (IPO).
Stížnost Redditu na Anthropic otřásla technologickým sektorem a znovu otevřela... debata o tom, kdo může a měl by mít prospěch z obrovského archivu znalostí generovaných na otevřených fórech na internetuPrávní bitva určí jak limity těžby dat, tak i práva komunit ve věku umělé inteligence.
Jsem technologický nadšenec, který ze svých „geekovských“ zájmů udělal profesi. Strávil jsem více než 10 let svého života používáním nejmodernějších technologií a vrtáním se všemi druhy programů z čisté zvědavosti. Nyní se specializuji na počítačovou techniku a videohry. Je to proto, že již více než 5 let píšu pro různé webové stránky o technologiích a videohrách a tvořím články, které se vám snaží poskytnout informace, které potřebujete, v jazyce, který je srozumitelný všem.
Pokud máte nějaké dotazy, mé znalosti sahají od všeho, co se týká operačního systému Windows a také Androidu pro mobilní telefony. A můj závazek je vůči vám, jsem vždy ochoten strávit pár minut a pomoci vám vyřešit jakékoli otázky, které můžete mít v tomto internetovém světě.
