Reddit kiện Anthropic vì sử dụng dữ liệu không được phép trong AI

Reddit đã đệ đơn kiện Anthropic vì cáo buộc sử dụng dữ liệu người dùng để đào tạo các mô hình trí tuệ nhân tạo mà không được phép.
Khiếu nại cáo buộc Anthropic liên tục truy cập vào máy chủ Reddit và bỏ qua các hạn chế kỹ thuật cũng như các thỏa thuận trước đó.
Reddit chỉ ra rằng các công ty khác trong lĩnh vực này, chẳng hạn như OpenAI và Google, có giấy phép sử dụng dữ liệu của Reddit, điều mà Anthropic chưa làm.
Giá trị của dữ liệu Reddit đối với AI nằm ở tính đa dạng và tính xác thực của các cuộc trò chuyện, khiến nó trở nên rất được ưa chuộng để đào tạo các mô hình tiên tiến.

Reddit đã phá vỡ sự im lặng và quyết định đưa Anthropic ra tòa., nhà phát triển trí tuệ nhân tạo nổi tiếng, xem xét rằng đã sử dụng sai dữ liệu do người dùng nền tảng tạo raVụ việc đã làm dấy lên cuộc tranh luận về những giới hạn và nghĩa vụ mà cả các nhà phát triển AI và cộng đồng trực tuyến lớn phải đảm nhận.

Kích hoạt đã được một cáo buộc khai thác thông tin hàng loạt bởi hệ thống nhân học, không có thỏa thuận cấp phép chính thức hoặc sự đồng ý rõ ràng từ Reddit. Theo đơn khiếu nại được đệ trình lên Tòa án cấp cao San Francisco, Anthropic sẽ bỏ qua, trong những dịp lặp đi lặp lại, các quy tắc và cơ chế mà Reddit áp dụng để bảo vệ nội dung do người dùng tạo ra.

Các cáo buộc về truy cập bất hợp pháp và tranh chấp cấp phép

Vụ kiện Reddit Anthropic

Nền tảng diễn đàn duy trì rằng Anthropic đã truy cập vào máy chủ của mình hơn 100.000 lần., ngay cả sau khi Anthropic đã công khai hứa sẽ không làm như vậy. Reddit khẳng định rằng hành vi này sẽ xảy ra mặc dù đã có nỗ lực đàm phán giấy phép, như họ đã đạt được với các công ty như OpenAI và Google, những công ty đã chính thức hóa các thỏa thuận sử dụng kho lưu trữ công khai của Reddit để đào tạo các mô hình của họ.

Nội dung độc quyền - Bấm vào đây Meta tăng cường tuyển dụng nhân tài AI để dẫn đầu siêu trí tuệ

Reddit nhấn mạnh rằng Hành vi của Anthropic trái ngược với hình ảnh công chúng mà công ty AI dự án, tự định nghĩa mình là chuẩn mực đạo đức trong ngành. Tuy nhiên, trong các tài liệu của tòa án, mạng xã hội cáo buộc Anthropic hành động "hai mặt" và đặt lợi ích thương mại của mình lên trên các quy tắc và quyền của người dùng.

Tình hình đã gây ra sự khó chịu đặc biệt trong Reddit, người nhớ lại rằng nền tảng của mình Nó lưu trữ một trong những cơ sở dữ liệu lớn nhất và đa dạng nhất về các cuộc trò chuyện của con người trên InternetNhững cuộc thảo luận này, được tổ chức trong hàng nghìn diễn đàn phụ theo chủ đề hoặc subreddit, có giá trị to lớn trong việc đào tạo các hệ thống ngôn ngữ tự nhiên, xét đến tính xác thực và sự đa dạng về ý kiến.

Dữ liệu Reddit, kho báu lớn cho AI

Giá trị AI của dữ liệu Reddit

Sự hấp dẫn của Reddit đối với các nhà phát triển AI nằm ở lượng nội dung phong phú của nó. Các bài đăng và bình luận phản ánh cách mọi người trao đổi thông tin, tranh luận, nói đùa và thể hiện cảm xúc trong các bối cảnh khác nhau, cho phép các mô hình AI học được các sắc thái của ngôn ngữ hàng ngày và lập luận của con người.

Nội dung độc quyền - Bấm vào đây Google Maps sẽ quét ảnh chụp màn hình của bạn để giúp bạn lập kế hoạch cho chuyến đi

Reddit đã bày tỏ mong muốn hợp tác với các công ty trong lĩnh vực AI., với điều kiện là có một thỏa thuận minh bạch và cùng có lợi. Do đó, mạng xã hội nhớ lại rằng họ đã ký kết các thỏa thuận cấp phép chính thức với những gã khổng lồ như Google và OpenAI—thỏa thuận sau đã được ký vào tháng 2024 năm XNUMX—cho phép họ truy cập có cấu trúc và được quản lý vào dữ liệu của họ để cải thiện các hệ thống như Gemini hoặc ChatGPT.

Trường hợp của Anthropic thì lại rất khác. Theo Reddit, bất chấp những nỗ lực để đạt được sự hiểu biết, Anthropic vẫn tiếp tục trích xuất dữ liệu. thậm chí sau khi công khai đảm bảo rằng họ sẽ cắt quyền truy cập của bot vào nền tảng. Reddit tuyên bố công ty AI này cũng không tôn trọng việc xóa các bài đăng do người dùng xóa., điều mà các công ty công nghệ khác đã hứa và thực hiện.

OpenAI thay đổi thành Công ty lợi ích công cộng-4

Bối cảnh kinh doanh và phản ứng với nhu cầu

nhân loại

Vụ kiện của Reddit yêu cầu tòa án cấm Anthropic tiếp tục sử dụng tài liệu trích xuất chưa được cấp phép và bồi thường thiệt hại gây ra. Trong khi đó, người phát ngôn của Anthropic tuyên bố rằng công ty không đồng ý với các cáo buộc và có kế hoạch tự bảo vệ mình một cách mạnh mẽ, mặc dù không cung cấp thông tin chi tiết cụ thể về chiến lược của mình.

Nội dung độc quyền - Bấm vào đây SearchGPT là gì và cách thức hoạt động của công cụ tìm kiếm dựa trên AI mới

Anthropic là một công ty trí tuệ nhân tạo có trụ sở tại Hoa Kỳ., được thành lập bởi các cựu thành viên OpenAI. Sản phẩm nổi tiếng nhất của công ty, Claude, cạnh tranh trực tiếp với các chatbot như ChatGPT. Hơn nữa, công ty cung cấp cả dịch vụ miễn phí và trả phí, điều này đã làm tăng giá trị thị trường của công ty, mặc dù tiếp tục gây tranh cãi về việc quản lý dữ liệu họ sử dụng để đào tạo hệ thống của họ.

Về phần mình, Reddit nhấn mạnh chính sách của mình liên quan đến khai thác dữ liệu se cứng lại vào năm 2024 để ngăn chặn sự truy cập bừa bãi của các tổ chức bên ngoài, mặc dù nó mở ra cánh cửa cho đàm phán và giấy phép được quản lý. Những loại thỏa thuận này, chẳng hạn như những thỏa thuận đã đạt được với Google và OpenAI, được coi là cần thiết để đa dạng hóa mô hình doanh thu của họ, đặc biệt là sau khi IPO.

Khiếu nại của Reddit đối với Anthropic đã làm rung chuyển ngành công nghệ và mở lại cuộc tranh luận về việc ai có thể và nên được hưởng lợi từ kho lưu trữ kiến thức khổng lồ được tạo ra trong các diễn đàn mở trên InternetCuộc chiến pháp lý sẽ xác định cả giới hạn của việc khai thác dữ liệu và quyền của cộng đồng trong thời đại trí tuệ nhân tạo.