- Redditは、ユーザーデータを許可なく人工知能モデルのトレーニングに使用したとして、Anthropicに対して訴訟を起こした。
- 訴状は、アントロピックが繰り返しRedditのサーバーにアクセスし、技術的制限や事前の合意を回避したと非難している。
- Reddit は、OpenAI や Google など、この分野の他の企業はデータを使用するライセンスを保有しているが、Anthropic はそうしていないと指摘している。
- AI にとっての Reddit データの価値は、会話の多様性と信頼性にあり、高度なモデルのトレーニングに非常に求められています。
Redditは沈黙を破り、Anthropicを訴えることを決定した。有名な人工知能開発者である プラットフォームのユーザーによって生成されたデータを不正に使用したこの事件は、AI開発者と大規模オンラインコミュニティの両方が負わなければならない制限と義務についての議論を巻き起こした。
きっかけは 大量の情報抽出の疑い 人類システムによるRedditからの正式なライセンス契約や明確な同意なしに、サンフランシスコ上級裁判所に提出された訴状によると、 アントロピックは無視しただろう何度も、 Redditがユーザーによって作成されたコンテンツを保護するために適用するルールとメカニズム.
不正アクセスの疑惑とライセンス紛争

フォーラムプラットフォームは、 Anthropic はサーバーに 100.000 万回以上アクセスしました。アントロピック社がそうしないと公に約束したにもかかわらずである。 Redditは、ライセンス交渉の試みにもかかわらず、この行動が起こったと主張している。これは、OpenAIやGoogleなどの企業とすでに実現しており、Redditのパブリックアーカイブをモデルのトレーニングに使用する契約を正式に締結している。
Redditは、 アントロピックの行動は矛盾している AI企業が投影する公共イメージは、業界における倫理的なベンチマークとして自らを位置づけています。しかし、裁判所の文書では、このソーシャルネットワークはアントロピックが「二枚舌」で行動し、ユーザーのルールや権利よりも商業的利益を優先していると非難しています。
この状況は、特に Reddit彼は、自分のプラットフォームが インターネット上で最大かつ最も多様な人間の会話のデータベースの一つをホストしています。何千ものテーマ別のサブフォーラムやサブレディットにまとめられたこれらのディスカッションは、その信憑性と意見の多様性を考えると、自然言語システムのトレーニングにとって非常に価値があります。
RedditデータはAIにとっての宝物

RedditがAI開発者にとって魅力的なのは、豊富なコンテンツにあります。投稿やコメントは、人々が様々な状況で情報を交換し、議論し、冗談を言い、感情を表現する様子を反映しています。 AIモデルが日常言語や人間の議論のニュアンスを学習できるようにする.
RedditはAI分野の企業と協力する意欲を表明した。ただし、透明性があり相互に利益のある合意があればの話です。そのため、このソーシャルネットワークは、GoogleやOpenAIといった巨大企業と正式なライセンス契約を締結したことを改めて表明します。OpenAIは2024年XNUMX月に締結され、GeminiやChatGPTといったシステムの改善のために、データへの構造化され規制されたアクセスを可能にしています。
Anthropic のケースは非常に異なっています。 Redditによると、合意に至る試みにもかかわらず、Anthropicはデータの抽出を続けた。 ボットによるプラットフォームへのアクセスを遮断すると公に保証した後でも、この措置は取られる。 Redditは、AI企業がユーザーによって削除された投稿の削除も尊重しなかったと主張している。これは他のテクノロジー企業が約束し、実現してきたことだ。
ビジネス環境と需要への対応

Redditの訴訟は裁判所に アントロピックが無許可で抜粋した素材を今後使用することを禁止する そして、発生した損害に対する賠償が支払われるべきだと訴えました。一方、アントロピック社の広報担当者は、同社はこれらの申し立てに異議を唱え、積極的に抗弁するつもりだと述べましたが、具体的な戦略については明らかにしませんでした。
Anthropic は米国を拠点とする人工知能企業です。は、元OpenAIメンバーによって設立されました。同社の最も有名な製品であるClaudeは、ChatGPTのようなチャットボットと直接競合しています。さらに、同社は無料サービスと有料サービスの両方を提供しており、市場価値を高めています。 彼らが使用するデータの管理をめぐって論争が続いている システムをトレーニングするため。
その部分については、 Redditはデータマイニングに関するポリシーを強調している se 2024年に強化 外部組織による無差別アクセスを防止するため、交渉や規制されたライセンス取得への道が開かれる。GoogleやOpenAIと締結したようなこうした合意は、特にIPO後の収益モデルの多様化に不可欠と見られている。
RedditのAnthropicに対する苦情はテクノロジー業界を揺るがし、 インターネット上のオープンフォーラムで生成された膨大な知識のアーカイブから誰が利益を得ることができるか、また誰が利益を得るべきかについての議論この法廷闘争は、データマイニングの限界と人工知能時代のコミュニティの権利の両方を決定することになるだろう。
私はテクノロジー愛好家であり、その「オタク」の興味を職業に変えています。私は 10 年以上、純粋な好奇心から最先端のテクノロジーを使用し、あらゆる種類のプログラムをいじくり回してきました。現在はコンピューター技術とビデオゲームを専門にしています。これは、私が 5 年以上、テクノロジーやビデオ ゲームに関するさまざまな Web サイトに執筆し、誰にでも理解できる言語で必要な情報を提供することを目的とした記事を作成しているためです。
ご質問がございましたら、私の知識は Windows オペレーティング システムから携帯電話用の Android に関連するあらゆるものまで多岐にわたります。そして、私はあなたに対して、いつでも喜んで数分を費やして、このインターネットの世界であなたが抱いている疑問を解決するお手伝いをしたいと考えています。
