Dùng chatbot 'bẻ khóa' chatbot khác
Logo ChatGPT hiển thị trên màn hình điện thoại. Ảnh: AFP
Nhóm nghiên cứu Đại học Công nghệ Nanyang (NTU - Singapore), gồm giáo sư Liu Yang, hai nghiên cứu sinh Deng Gelei và Liu Yi, công bố phương pháp Masterkey với khả năng bẻ khóa các AI phổ biến hiện nay như ChatGPT, Google Bard và Copilot (Bing Chat).
Chatbot bị nhắm mục tiêu sẽ tạo phản hồi hợp lệ kể cả với các truy vấn độc hại - cách kiểm tra giới hạn đạo đức của bất kỳ mô hình ngôn ngữ lớn (LLM) nào. Cụ thể, Masterkey gồm hai phần, trong đó kẻ tấn công đảo ngược cơ chế bảo vệ của LLM bằng cách sử dụng một chatbot khác. Thông thường, LLM sẽ được trang bị lớp bảo vệ để chống lại lời nói mang tính tiêu cực, thông qua một danh sách từ khóa bị cấm. Tuy vậy, nhờ khả năng tự học hỏi và thích ứng, nhóm có thể dùng một chatbot khác để "tiêm nhiễm" nội dung xấu vào chatbot mục tiêu.

Nhóm nghiên cứu của NTU. Ảnh: NTU Singapore
Theo giáo sư Yang, cách "đi đường vòng" này đạt hiệu quả gấp ba lần so với các phương pháp đánh lừa khác hiện nay. Với khả năng tự học hỏi, Masterkey khiến mọi bản sửa lỗi mà nhà phát triển áp dụng cho chatbot mục tiêu cuối cùng cũng sẽ trở nên vô dụng theo thời gian.
Có hai phương pháp được nhóm áp dụng để huấn luyện AI tấn công các chatbot khác. Cách đầu tiên liên quan đến việc "hình dung" một nhân vật tạo lời nhắc bằng cách thêm dấu cách sau mỗi ký tự, bỏ qua danh sách các từ bị cấm. Cách thứ hai là khiến chatbot trả lời "với tư cách là người không bị hạn chế về mặt đạo đức".
Giáo sư Yang cho biết nhóm đã liên hệ và gửi kết quả nghiên cứu tới các nhà cung cấp dịch vụ chatbot toàn cầu, gồm OpenAI, Google và Microsoft. Đề tài này cũng được chấp nhận trình bày tại Hội nghị chuyên đề về bảo mật hệ thống phân tán và mạng tổ chức tại San Diego (Mỹ) vào tháng 2.
Theo Tom's Hardware, với làn sóng chatbot đang nở rộ, tấn công nhắm vào LLM đang có xu hướng tăng nhanh chóng. Tuy nhiên, nếu như trước đây, chúng có thể được hạn chế sau một hoặc một vài bản vá, Masterkey đáng lo ngại hơn khi có thể tự học để vượt qua giới hạn bảo mật. Khi bị can thiệp, chúng có thể tạo nội dung tiêu cực, gây hại, tin giả, tin sai lệch và nhiều mục đích xấu khác.
Theo vnexpress.net
Tin cùng chuyên mục
- Nokia chuẩn bị triển khai 5G tại Việt Nam 24.09.2024 | 13:58 PM
- Sinh động các chương trình trực tiếp tại Fanpage Báo Tuyên Quang online 03.01.2023 | 08:16 AM
- Thực hiện quy định về chuẩn hóa thông tin thuê bao di động 31.03.2023 | 16:13 PM
- Hưởng ứng ngày Chuyển đổi số quốc gia 10/10Chuyển đổi số vì một cuộc sống tốt đẹp hơn 09.10.2022 | 21:42 PM
- Sở Thông tin và Truyền thông: Diễn tập ứng phó sự cố an toàn thông tin mạng năm 2022 04.10.2022 | 17:30 PM
- Hướng dẫn trẻ em sử dụng mạng internet an toàn và hiệu quả 05.08.2022 | 08:27 AM
- Người dùng nên cập nhật Chrome 92 ngay để vá 9 lỗ hổng nghiêm trọng 21.08.2021 | 15:47 PM
- UBND tỉnh nghe báo cáo dự thảo đề án chuyển đổi số tỉnh Thái Bình giai đoạn 2021 - 2025, định hướng đến năm 2030 21.07.2021 | 19:16 PM
- Thiết bị đầu tiên chuyển suy nghĩ thành câu nói 19.07.2021 | 09:47 AM
- Tại sao không gộp các ứng dụng chống dịch thành một 'super app' 19.07.2021 | 09:48 AM
Xem tin theo ngày
-
Ban Chấp hành Đảng bộ tỉnh thống nhất cao với nội dung Đề án hợp nhất tỉnh Hưng Yên và tỉnh Thái Bình, Đề án sắp xếp đơn vị hành chính cấp xã với số phiếu tuyệt đối 100%
- Ban Chấp hành Đảng bộ tỉnh Thái Bình ban hành Nghị quyết số 11-NQ/TU về Đề án hợp nhất tỉnh Hưng Yên và tỉnh Thái Bình và Đề án sắp xếp đơn vị hành chính cấp xã
- Hội nghị Ban Chấp hành Đảng bộ tỉnh, kỳ họp thứ 42
- Ban Thường vụ Tỉnh ủy Hưng Yên làm việc với Ban Thường vụ Tỉnh ủy Thái Bình về hợp nhất hai tỉnh
- Gặp mặt cựu chiến binh, cựu thanh niên xung phong và chiến sĩ cách mạng bị địch bắt tù đày
- Thống nhất nội dung, chương trình kỳ họp để giải quyết công việc phát sinh đột xuất HĐND tỉnh khoá XVII
- Tập huấn về phát triển khoa học, công nghệ và đổi mới sáng tạo, chuyển đổi số
- Tiếp tục nâng cao hiệu quả công tác phòng, chống và kiểm soát ma tuý
- UBND tỉnh: Làm việc với Tổng công ty Khí Việt Nam – Công ty Cổ phần (PV GAS) về phương án cấp khí LNG trên địa bàn tỉnh
- Giới thiệu cuốn sách “Đỗ Ngọc Quán - Người cộng sản trung kiên”