Meta dùng bot thu thập dữ liệu web để huấn luyện AI
Fortune dẫn nguồn từ ba công ty chuyên theo dõi bot, phần mềm này có tên Meta External Agent, được Meta triển khai từ tháng trước. Bot về cơ bản sẽ sao chép, hay "thu thập" tất cả dữ liệu công khai trên mọi website, kể cả các bài báo trên trang tin tức hay các bình luận trên hội nhóm mạng xã hội.
Dark Visitors, công ty chuyên cung cấp công cụ tự động chặn bot thu thập dữ liệu website, cho biết Meta External Agent hoạt động tương đồng với GPTBot của OpenAI.
Dựa trên bản lưu Internet Archive cuối tháng 7 cho thấy Meta cũng đã cập nhật website dành cho nhà phát triển, với một tab đề cập đến sự tồn tại của công cụ thu thập dữ liệu mới. Tuy nhiên, công ty của Mark Zuckerberg chưa công bố về công cụ này.
Phát ngôn viên của Meta xác nhận công ty đã triển khai công cụ thu thập dữ liệu nhưng với tên gọi khác là Facebook External Hit "trong nhiều năm". Tuy nhiên, phần mềm này kiêm nhiệm nhiều tính năng thay vì chỉ cho mục đích lấy dữ liệu.
"Giống như các công ty khác, chúng tôi huấn luyện mô hình AI tạo sinh bằng nội dung có sẵn và công khai trên mạng", phát ngôn viên Meta nói.
Theo thống kê từ Dark Visitors, gần 25% website phổ biến nhất thế giới chặn GPTBot, nhưng chỉ 2% chặn Meta External Agent. Đầu năm nay, Zuckerberg cho biết các nền tảng xã hội của công ty ông đã tích lũy được một tập dữ liệu để huấn luyện AI lớn hơn cả Common Crawl - một đơn vị đã thu thập khoảng 3 tỷ website mỗi tháng kể từ năm 2011.
Giới chuyên gia đánh giá sự xuất hiện của Meta External Agent cho thấy kho dữ liệu rộng lớn mà công ty đang có không còn đủ trong bối cảnh họ phải liên tục nâng cấp mô hình ngôn ngữ lớn LLaMA, mới nhất là LLaMA 3.1, cũng như mở rộng Meta AI. Công ty đang trên đà chi 40 tỷ USD năm nay, chủ yếu vào cơ sở hạ tầng, chip AI và các chi phí liên quan.
Theo vnexpress.net
Tin cùng chuyên mục
- Nokia chuẩn bị triển khai 5G tại Việt Nam 24.09.2024 | 13:58 PM
- Sinh động các chương trình trực tiếp tại Fanpage Báo Tuyên Quang online 03.01.2023 | 08:16 AM
- Thực hiện quy định về chuẩn hóa thông tin thuê bao di động 31.03.2023 | 16:13 PM
- Hưởng ứng ngày Chuyển đổi số quốc gia 10/10Chuyển đổi số vì một cuộc sống tốt đẹp hơn 09.10.2022 | 21:42 PM
- Sở Thông tin và Truyền thông: Diễn tập ứng phó sự cố an toàn thông tin mạng năm 2022 04.10.2022 | 17:30 PM
- Hướng dẫn trẻ em sử dụng mạng internet an toàn và hiệu quả 05.08.2022 | 08:27 AM
- Người dùng nên cập nhật Chrome 92 ngay để vá 9 lỗ hổng nghiêm trọng 21.08.2021 | 15:47 PM
- UBND tỉnh nghe báo cáo dự thảo đề án chuyển đổi số tỉnh Thái Bình giai đoạn 2021 - 2025, định hướng đến năm 2030 21.07.2021 | 19:16 PM
- Thiết bị đầu tiên chuyển suy nghĩ thành câu nói 19.07.2021 | 09:47 AM
- Tại sao không gộp các ứng dụng chống dịch thành một 'super app' 19.07.2021 | 09:48 AM
Xem tin theo ngày
- Tỉnh ủy, HĐND, UBND tỉnh: Gặp mặt và chúc tết các doanh nghiệp nhân dịp tết Nguyên đán Ất Tỵ 2025
- Thường trực HĐND tỉnh: Thông qua kết quả thẩm tra một số tờ trình
- Đổi mới, sáng tạo trong hành động với tinh thần “Kỷ cương trách nhiệm, chủ động kịp thời, tinh gọn hiệu quả, tăng tốc bứt phá”
- Đồng chí Nguyễn Mạnh Hùng, Ủy viên Ủy ban Kiểm tra Trung ương giữ chức Phó Bí thư Tỉnh ủy Thái Bình nhiệm kỳ 2020 - 2025
- Đồng chí Nguyễn Khắc Thận, Bí thư Tỉnh ủy, Chủ tịch UBND tỉnh: Thăm, tặng quà Mẹ Việt Nam anh hùng, người cao tuổi, người có hoàn cảnh khó khăn trên địa bàn thành phố Thái Bình
- Đảng ủy Khối Các cơ quan và doanh nghiệp tỉnh: Khen thưởng 113 tập thể, cá nhân đạt thành tích tiêu biểu xuất sắc trong công tác xây dựng Đảng năm 2024
- Đồng chí Nguyễn Khắc Thận, Bí thư Tỉnh ủy, Chủ tịch UBND tỉnh: Dự chương trình tết sum vầy với đoàn viên, người lao động
- Trên 978.500 đại biểu tham gia hội nghị quán triệt, triển khai về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia
- Toàn văn: Nghị quyết số 57-NQ/TW về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia
- Đánh giá kết quả triển khai công tác xóa nhà tạm, nhà dột nát trên phạm vi cả nước