Thứ 6, 17/05/2024, 17:57[GMT+7]

New York Times kiện OpenAI vì sử dụng hàng triệu nội dung

Thứ 6, 29/12/2023 | 11:44:10
2,493 lượt xem
OpenAI, công ty phát triển ChatGPT, và Microsoft đã bị New York Times kiện vì thu thập và sử dụng trái phép bài viết để huấn luyện AI.

Sam Altman, đồng sáng lập và CEO OpenAI. Ảnh: TechCrunch

Trong đơn kiện gửi lên Tòa án liên bang ở Manhattan ngày 27/12, báo này cáo buộc OpenAI và Microsoft sử dụng "hàng triệu bài báo" để đào tạo các mô hình ngôn ngữ lớn (LLM) mà không xin phép, cũng như tạo ra nội dung mới dựa trên những gì AI "học" được, quay lại cạnh tranh trực tiếp với các dịch vụ của báo.

"Trong nhiều tháng, chúng tôi đã thương lượng và cố gắng đạt thỏa thuận nhưng không thành công. Các cuộc đàm phán không đi đến giải pháp chung nào cả", New York Times nêu trong đơn kiện.

Theo Washington Post, các mô hình LLM như ChatGPT hoạt động bằng cách thu thập lượng lớn tài nguyên lấy trên Internet, sau đó phân tích các mối liên hệ, phát triển khả năng dự đoán từ nào sẽ nói tiếp theo trong câu, cho phép chúng bắt chước lời nói của con người. OpenAI, Microsoft và Google nhiều lần từ chối tiết lộ họ dùng dữ liệu gì để đào tạo AI, nhưng các LLM trước đây được chứng minh đã sử dụng lượng lớn nội dung từ các tổ chức tin tức và danh mục sách.

New York Times cho rằng các mô hình AI của OpenAI và Microsoft có thể đe dọa báo chí chất lượng cao khi sinh ra nội dung chứa nhiều đoạn "trích dẫn nguyên văn bài báo, tóm tắt hoặc bắt chước văn phong". Bên cạnh đó, điều này "gây tổn hại năng lực" đến báo, như mất độc giả, mất doanh thu trả phí và mất doanh thu quảng cáo.

"Thông qua Bing Chat (gần đây đổi thành Copilot) của Microsoft và ChatGPT của OpenAI, họ tìm cách tận dụng khoản đầu tư khổng lồ của chúng tôi vào các hoạt động báo chí để xây dựng các sản phẩm thay thế mà không xin phép hoặc trả tiền", trang này cho hay. Họ yêu cầu hai công ty phải chịu trách nhiệm pháp lý "trước hàng tỷ USD thiệt hại" do sao chép nội dung, đồng thời chấm dứt việc dùng bài báo để huấn luyện LLM. Ngoài ra, các bài viết đã dùng cho đào tạo AI cũng phải bị loại bỏ khỏi hệ thống.

OpenAI và Microsoft chưa đưa ra bình luận.

Dẫn ý kiến từ giới chuyên gia pháp lý, The Verge đánh giá nếu thành công, vụ kiện sẽ mở đường cho các tổ chức tin tức khác khởi kiện các công ty có mô hình LLM dùng nội dung báo chí hiện nay. Thực tế, các tác phẩm báo chí do AI tạo ra đang tăng mạnh, nhưng nhiều trong đó không chính xác.

Theo NewsGuard, tổ chức ở New York chuyên theo dõi thông tin sai lệch, AI khiến việc sản xuất và lan truyền tin giả lên cấp độ mới, khi có thể tạo nội dung sai sự thật về bầu cử, chiến tranh, thiên tai với tốc độ nhanh. Kể từ tháng 5, các website chứa tin giả do AI tạo đã tăng 1.000%, từ 49 trang lên hơn 600 trang.

Với việc kiện OpenAI và Microsoft, New York Times đã gia nhập nhóm chống lại các công ty dùng tác phẩm của họ để đào tạo AI, gồm các nghệ sĩ, nhà làm phim, nhà văn, nhạc sĩ và các nhà sáng tạo nội dung khác. Kể từ tháng 8, ít nhất 583 tổ chức tin tức, trong đó có New York Times, Washington Post và Reuters, cũng đã đặt trình chặn để ngăn các công ty công nghệ thu thập bài viết.

"Chúng tôi đang xem xét khiếu nại của New York Times và ủng hộ quyết định của họ trong việc bảo vệ nguyên tắc bản quyền quan trọng này", Washington Post cho biết.

OpenAI hiện hợp tác với một số tổ chức tin tức để trả tiền cho các nội dung dùng cho AI. Vào tháng 7, công ty ký thỏa thuận với Associated Press. Đầu tháng này, nhà xuất bản Axel Springer của Đức, sở hữu Politico và Business Insider, cũng có thỏa thuận tương tự với công ty đứng sau ChatGPT.

Theo vnexpress.net