- Reddit har stämt Anthropic för att ha använt användardata för att träna modeller av artificiell intelligens utan tillstånd.
- I klagomålet anklagas Anthropic för att upprepade gånger ha använt sig av Reddits servrar och kringgått tekniska begränsningar och tidigare avtal.
- Reddit påpekar att andra företag i sektorn, såsom OpenAI och Google, har licenser för att använda deras data, något som Anthropic inte har gjort.
- Värdet av Reddit-data för AI ligger i mångfalden och autenticiteten i dess konversationer, vilket gör den mycket eftertraktad för att träna avancerade modeller.
Reddit har brutit sin tystnad och beslutat att stämma Anthropic., den välkände utvecklaren av artificiell intelligens, med tanke på att har missbrukat data som genererats av plattformens användareFallet har utlöst en debatt om de begränsningar och skyldigheter som både AI-utvecklare och stora onlinegemenskaper måste ta på sig.
Utlösaren har varit en påstådd massutvinning av information av antropiska system, utan ett formellt licensavtal eller uttryckligt medgivande från Reddit. Enligt stämningsansökan som lämnats in till San Francisco Superior Court, Antropisk skulle ha ignorerat, vid upprepade tillfällen, de regler och mekanismer som Reddit tillämpar för att skydda innehåll som skapats av dess användare.
Påståenden om olaglig åtkomst och licenstvist

Forumplattformen hävdar att Anthropic besökte sina servrar mer än 100.000 XNUMX gånger., även efter offentliga löften från Anthropic att inte göra det. Reddit hävdar att detta beteende skulle ha inträffat trots försök att förhandla fram en licens., vilket de redan uppnått med företag som OpenAI och Google, som formaliserade avtal om att använda Reddits offentliga arkiv för att träna sina modeller.
Reddit framhäver det Antropikers beteende motsäger den offentliga bilden som AI-företaget projiceraroch definierar sig själva som en etisk riktmärke inom sektorn. I domstolsdokument anklagar dock det sociala nätverket Anthropic för att agera "tvåsidigt" och sätta sina kommersiella intressen före användarnas regler och rättigheter.
Situationen har orsakat särskilt obehag i Reddit, som minns att hans plattform Den är värd för en av de största och mest varierade databaserna över mänskliga konversationer på internet.Dessa diskussioner, organiserade i tusentals tematiska underforum eller subreddits, är av enormt värde för att träna naturliga språksystem, med tanke på deras autenticitet och mångfald av åsikter.
Reddit-data, den stora skatten för AI

Reddits dragningskraft för AI-utvecklare ligger i dess rikedom av innehåll. Inlägg och kommentarer återspeglar hur människor utbyter information, debatterar, skämtar och uttrycker känslor i olika sammanhang, vilket låter AI-modeller lära sig nyanserna i vardagsspråk och mänsklig argumentation.
Reddit har uttryckt sin vilja att samarbeta med företag inom AI-sektorn., förutsatt att det finns ett transparent och ömsesidigt fördelaktigt avtal. Således påminner det sociala nätverket om att det har ingått formella licensavtal med jättar som Google och OpenAI – det senare undertecknades i maj 2024 – vilket ger dem strukturerad och reglerad åtkomst till sina data för att förbättra system som Gemini eller ChatGPT.
Fallet med Anthropic har varit väldigt annorlunda. Enligt Reddit fortsatte Anthropic att utvinna data, trots försök att nå en förståelse. även efter att offentligt försäkrat att de skulle stänga av sina bottars åtkomst till plattformen. Reddit hävdar att AI-företaget också inte respekterade borttagningen av inlägg som raderats av användare., något som andra teknikföretag har lovat och levererat.
Affärskontext och reaktion på efterfrågan

Reddits stämningsansökan begär att domstolen ska förbjuda Anthropic att vidare använda olicensierat utdraget material och att ersättning ska utgå för de orsakade skadorna. Samtidigt uppgav en talesperson för Anthropic att företaget inte håller med om anklagelserna och planerar att kraftfullt försvara sig, även om de inte gav några specifika detaljer om sin strategi.
Anthropic är ett USA-baserat företag inom artificiell intelligens., grundat av tidigare OpenAI-medlemmar. Dess mest kända produkt, Claude, konkurrerar direkt med chatbotar som ChatGPT. Dessutom erbjuder företaget både gratis och betalda tjänster, vilket har ökat dess marknadsvärde, även om fortsätter att skapa kontroverser kring hanteringen av de uppgifter de använder att träna sina system.
För deras del, Reddit betonar sin policy gällande datautvinning se härdades år 2024 att förhindra urskillningslös åtkomst från externa organisationer, även om det öppnar dörren för förhandlingar och reglerade licenser. Den här typen av avtal, som de som ingåtts med Google och OpenAI, ses som avgörande för att diversifiera deras intäktsmodell, särskilt efter deras börsintroduktioner.
Reddits klagomål mot Anthropic har skakat techsektorn och öppnat upp igen debatt om vem som kan och bör dra nytta av det enorma arkiv av kunskap som genereras i öppna forum på internetDen rättsliga striden kommer att avgöra både gränserna för datautvinning och samhällens rättigheter i den artificiella intelligensens tidsålder.
Jag är en teknikentusiast som har gjort sina "nördar"-intressen till ett yrke. Jag har tillbringat mer än 10 år av mitt liv med att använda den senaste tekniken och mixtrat med alla typer av program av ren nyfikenhet. Nu har jag specialiserat mig på datateknik och tv-spel. Detta beror på att jag i mer än 5 år har arbetat med att skriva för olika webbplatser om teknik och videospel, skapa artiklar som försöker ge dig den information du behöver på ett språk som är begripligt för alla.
Om du har några frågor sträcker sig min kunskap från allt som rör operativsystemet Windows samt Android för mobiltelefoner. Och mitt engagemang är för dig, jag är alltid villig att spendera några minuter och hjälpa dig att lösa alla frågor du kan ha i den här internetvärlden.
