- Reddit падаў пазоў супраць Anthropic за нібыта выкарыстанне карыстальніцкіх дадзеных для навучання мадэляў штучнага інтэлекту без дазволу.
- У скарзе Anthropic абвінавачваецца ў неаднаразовым доступе да сервераў Reddit і абыходзе тэхнічных абмежаванняў і папярэдніх дамоўленасцей.
- Reddit адзначае, што іншыя кампаніі ў гэтым сектары, такія як OpenAI і Google, маюць ліцэнзіі на выкарыстанне яго дадзеных, чаго Anthropic не зрабіла.
- Каштоўнасць дадзеных Reddit для штучнага інтэлекту заключаецца ў разнастайнасці і аўтэнтычнасці іх размоў, што робіць іх вельмі запатрабаванымі для навучання перадавых мадэляў.
Reddit парушыў сваё маўчанне і вырашыў падаць у суд на Anthropic., вядомы распрацоўшчык штучнага інтэлекту, улічваючы, што няправільна выкарыстаў дадзеныя, атрыманыя карыстальнікамі платформыГэтая справа выклікала дыскусію аб абмежаваннях і абавязацельствах, якія павінны ўзяць на сябе як распрацоўшчыкі штучнага інтэлекту, так і буйныя анлайн-супольнасці.
Трыгерам стала меркаванае масавае выманне інфармацыі антрапічнымі сістэмамібез афіцыйнай ліцэнзійнай дамовы або відавочнай згоды Reddit. Згодна са скаргай, пададзенай у Вышэйшы суд Сан-Францыска, Антропік бы праігнараваў, неаднаразова, правілы і механізмы, якія Reddit ужывае для абароны кантэнту, створанага яго карыстальнікамі.
Абвінавачванні ў незаконным доступе і спрэчка аб ліцэнзаванні

Платформа форуму сцвярджае, што Anthropic атрымліваў доступ да сваіх сервераў больш за 100.000 XNUMX разоў., нават пасля публічных абяцанняў Anthropic гэтага не рабіць. Reddit сцвярджае, што такая паводзіна мела месца, нягледзячы на спробы дамовіцца аб ліцэнзіі., як яны ўжо дасягнулі з такімі кампаніямі, як OpenAI і Google, якія сапраўды заключылі пагадненні аб выкарыстанні публічнага архіва Reddit для навучання сваіх мадэляў.
Reddit падкрэслівае, што Паводзіны Антропіка супярэчаць публічны вобраз, які праектуе кампанія штучнага інтэлекту, вызначаючы сябе як этычны эталон у гэтым сектары. Аднак у судовых дакументах сацыяльная сетка абвінавачвае Anthropic у «двухбаковых» дзеяннях і ў тым, што яна ставіць свае камерцыйныя інтарэсы вышэй за правілы і правы карыстальнікаў.
Сітуацыя выклікала асаблівы дыскамфорт у Reddit, які ўспамінае сваю платформу Ён змяшчае адну з найбуйнейшых і найбольш разнастайных баз дадзеных чалавечых размоў у ІнтэрнэцеГэтыя дыскусіі, арганізаваныя ў тысячы тэматычных падфорумаў або subreddits, маюць велізарную каштоўнасць для навучання сістэм натуральнай мовы, улічваючы іх аўтэнтычнасць і разнастайнасць меркаванняў.
Дадзеныя Reddit, вялікі скарб для штучнага інтэлекту

Прывабнасць Reddit для распрацоўшчыкаў штучнага інтэлекту заключаецца ў багацці кантэнту. Паведамленні і каментарыі адлюстроўваюць тое, як людзі абменьваюцца інфармацыяй, дыскутуюць, жартуюць і выказваюць эмоцыі ў розных кантэкстах, што... дазваляе мадэлям штучнага інтэлекту вывучаць нюансы паўсядзённай мовы і чалавечую аргументацыю.
Reddit выказаў гатоўнасць супрацоўнічаць з кампаніямі ў сектары штучнага інтэлекту.пры ўмове наяўнасці празрыстага і ўзаемавыгаднага пагаднення. Такім чынам, сацыяльная сетка нагадвае, што яна заключыла афіцыйныя ліцэнзійныя пагадненні з такімі гігантамі, як Google і OpenAI (апошні падпісаны ў маі 2024 года), якія дазваляюць ім структураваны і рэгуляваны доступ да сваіх дадзеных для паляпшэння такіх сістэм, як Gemini або ChatGPT.
Выпадак з Anthropic быў зусім іншым. Паводле звестак Reddit, нягледзячы на спробы дасягнуць паразумення, Anthropic працягвала здабываць дадзеныя. нават пасля публічных абяцанняў, што яны адключаць сваім ботам доступ да платформы. Reddit сцвярджае, што кампанія, якая займаецца штучным інтэлектам, таксама не паважала выдаленне паведамленняў, выдаленых карыстальнікамі.тое, што абяцалі і выканалі іншыя тэхналагічныя кампаніі.
Бізнес-кантэкст і рэакцыя на попыт

У пазове Reddit просіць суд забараніць Anthropic далейшае выкарыстанне неліцэнзаваных урыўкаў матэрыялаў і каб была прысуджана кампенсацыя за прычыненую шкоду. Тым часам прадстаўнік Anthropic заявіў, што кампанія не згодная з абвінавачваннямі і плануе рашуча абараняцца, хоць і не ўдакладніла канкрэтных звестак аб сваёй стратэгіі.
Anthropic — амерыканская кампанія, якая займаецца штучным інтэлектам., заснаваная былымі ўдзельнікамі OpenAI. Яе самы вядомы прадукт, Claude, непасрэдна канкуруе з чат-ботамі, такімі як ChatGPT. Акрамя таго, кампанія прапануе як бясплатныя, так і платныя паслугі, што павялічыла яе рынкавую вартасць, хоць працягвае выклікаць спрэчкі наконт кіравання дадзенымі, якія яны выкарыстоўваюць трэніраваць свае сістэмы.
Са свайго боку, Reddit падкрэслівае сваю палітыку адносна здабычы дадзеных se загартаваны ў 2024 годзе каб прадухіліць невыбарчы доступ знешніх арганізацый, хоць гэта адкрывае дзверы для перамоваў і рэгуляваных ліцэнзій. Такія пагадненні, як тыя, што былі дасягнуты з Google і OpenAI, лічацца неабходнымі для дыверсіфікацыі іх мадэлі даходу, асабліва пасля іх IPO.
Скарга Reddit супраць Anthropic пахіснула тэхналагічны сектар і аднавіла працу... дыскусія пра тое, хто можа і павінен атрымаць карысць з велізарнага архіва ведаў, атрыманых на адкрытых форумах у ІнтэрнэцеЮрыдычная бітва вызначыць як межы здабычы дадзеных, так і правы супольнасцей у эпоху штучнага інтэлекту.
Я энтузіяст тэхналогій, які ператварыў свае інтарэсы "гікаў" у прафесію. Я правёў больш за 10 гадоў свайго жыцця, выкарыстоўваючы перадавыя тэхналогіі і важдаючыся з рознымі праграмамі з чыстай цікаўнасці. Цяпер я спецыялізаваўся на камп'ютарных тэхналогіях і відэагульнях. Гэта таму, што больш за 5 гадоў я працаваў для розных вэб-сайтаў, прысвечаных тэхналогіям і відэагульням, ствараючы артыкулы, якія імкнуцца даць вам неабходную інфармацыю на мове, зразумелай кожнаму.
Калі ў вас ёсць якія-небудзь пытанні, я ведаю ўсё, што звязана з аперацыйнай сістэмай Windows і Android для мабільных тэлефонаў. І я перад вамі абавязаны: я заўсёды гатовы выдаткаваць некалькі хвілін і дапамагчы вам вырашыць любыя пытанні, якія могуць узнікнуць у гэтым свеце Інтэрнэту.
