- Reddit har anlagt sak mot Anthropic for angivelig å ha brukt brukerdata til å trene kunstig intelligens-modeller uten tillatelse.
- Klagen anklager Anthropic for gjentatte ganger å ha tilgang til Reddit-servere og omgått tekniske restriksjoner og tidligere avtaler.
- Reddit påpeker at andre selskaper i sektoren, som OpenAI og Google, har lisenser til å bruke dataene deres, noe Anthropic ikke har gjort.
- Verdien av Reddit-data for AI ligger i mangfoldet og autentisiteten i samtalene, noe som gjør dem svært ettertraktet for trening av avanserte modeller.
Reddit har brutt tausheten og besluttet å ta Anthropic for retten., den velkjente utvikleren av kunstig intelligens, med tanke på at har misbrukt data generert av brukere av plattformenSaken har utløst en debatt om begrensningene og forpliktelsene som både AI-utviklere og store nettsamfunn må påta seg.
Utløseren har vært en påstått masseutvinning av informasjon av antropiske systemer, uten en formell lisensavtale eller eksplisitt samtykke fra Reddit. Ifølge klagen som ble innlevert til San Francisco Superior Court, Antropisk ville ha ignorert, ved gjentatte anledninger, reglene og mekanismene som Reddit bruker for å beskytte innhold laget av brukerne.
Påstander om ulovlig tilgang og lisenstvist

Forumplattformen hevder at Anthropic besøkte serverne sine mer enn 100.000 XNUMX ganger., selv etter offentlige løfter fra Anthropic om ikke å gjøre det. Reddit hevder at denne oppførselen ville ha skjedd til tross for forsøk på å forhandle frem en lisens., slik de allerede har oppnådd med selskaper som OpenAI og Google, som formaliserte avtaler om å bruke Reddits offentlige arkiv i treningen av modellene sine.
Reddit fremhever det Antropikers oppførsel motsier det offentlige bildet som AI-selskapet projiserer, og definerer seg selv som en etisk referansepunkt innenfor sektoren. I rettsdokumenter anklager imidlertid det sosiale nettverket Anthropic for å opptre «tosidig» og sette sine kommersielle interesser foran brukernes regler og rettigheter.
Situasjonen har forårsaket særlig ubehag i Reddit, som husker at plattformen hans Den er vert for en av de største og mest varierte databasene over menneskelige samtaler på Internett.Disse diskusjonene, organisert i tusenvis av tematiske underforum eller subreddits, er av enorm verdi for trening av naturlige språksystemer, gitt deres autentisitet og mangfold av meninger.
Reddit-data, den store skatten for AI

Reddits appell til AI-utviklere ligger i innholdsrikdommen. Innlegg og kommentarer gjenspeiler måten folk utveksler informasjon, debatterer, spøker og uttrykker følelser i ulike sammenhenger, noe som lar AI-modeller lære nyansene i hverdagsspråk og menneskelig argumentasjon.
Reddit har uttrykt sin vilje til å samarbeide med selskaper innen AI-sektoren., forutsatt at det finnes en transparent og gjensidig fordelaktig avtale. Dermed minner det sosiale nettverket om at det har inngått formelle lisensavtaler med giganter som Google og OpenAI – sistnevnte signert i mai 2024 – som gir dem strukturert og regulert tilgang til dataene sine for å forbedre systemer som Gemini eller ChatGPT.
Tilfellet med Anthropic har vært veldig annerledes. Ifølge Reddit fortsatte Anthropic å hente ut data til tross for forsøk på å komme til en forståelse. selv etter å offentlig ha forsikret at de ville kutte av robotenes tilgang til plattformen. Reddit hevder at AI-selskapet heller ikke respekterte fjerningen av innlegg slettet av brukere., noe andre teknologiselskaper har lovet og levert.
Forretningskontekst og reaksjon på etterspørsel

Reddits søksmål ber retten om å forby Anthropic å bruke ulisensiert utdrag av materiale videre og at det tilkjennes erstatning for skadene som er forårsaket. I mellomtiden uttalte en talsperson for Anthropic at selskapet er uenig i påstandene og planlegger å forsvare seg kraftig, selv om de ikke ga spesifikke detaljer om strategien sin.
Anthropic er et amerikansk selskap innen kunstig intelligens., grunnlagt av tidligere OpenAI-medlemmer. Det mest kjente produktet, Claude, konkurrerer direkte med chatboter som ChatGPT. Videre tilbyr selskapet både gratis og betalte tjenester, noe som har økt markedsverdien, selv om fortsetter å skape kontroverser rundt håndteringen av dataene de bruker å trene systemene sine.
For deres del, Reddit understreker sin policy angående datautvinning se herdet i 2024 å forhindre vilkårlig tilgang fra eksterne organisasjoner, selv om det åpner døren for forhandlinger og regulerte lisenser. Denne typen avtaler, som de som er inngått med Google og OpenAI, blir sett på som essensielle for å diversifisere inntektsmodellen deres, spesielt etter børsnoteringene deres.
Reddits klage mot Anthropic har rystet teknologisektoren og gjenåpnet debatt om hvem som kan og bør dra nytte av det enorme kunnskapsarkivet som genereres i åpne fora på internettDen juridiske kampen vil avgjøre både grensene for datautvinning og rettighetene til lokalsamfunn i den kunstige intelligensens tidsalder.
Jeg er en teknologientusiast som har gjort sine "geek"-interesser til et yrke. Jeg har brukt mer enn 10 år av livet mitt på å bruke banebrytende teknologi og fikse med alle slags programmer av ren nysgjerrighet. Nå har jeg spesialisert meg på datateknologi og videospill. Dette er fordi jeg i mer enn 5 år har skrevet for forskjellige nettsteder om teknologi og videospill, og laget artikler som prøver å gi deg den informasjonen du trenger på et språk som er forståelig for alle.
Hvis du har spørsmål, spenner min kunnskap fra alt relatert til Windows-operativsystemet samt Android for mobiltelefoner. Og mitt engasjement er til deg, jeg er alltid villig til å bruke noen minutter og hjelpe deg med å løse eventuelle spørsmål du måtte ha i denne internettverdenen.
