Bí mật của ChatGPT

11/8/2024 Gốc

Công cụ của OpenAI có thể phát hiện nội dung được tạo tự động bởi ChatGPT với độ chính xác lên đến 99,9%. Tuy nhiên, họ quyết định không công bố.

Không lâu sau thời điểm tháng 11/2022, khi OpenAI đưa ChatGPT lên nền tảng web và cho phép mọi người sử dụng, nhiều trường học cấm học sinh dùng công cụ này vì lo ngại gian lận.

Học sinh có thể sử dụng AI để tạo ra bài viết theo nhiều chủ đề khác nhau hoặc giải các bài tập được giao. Đến nay, chưa có bất kỳ công cụ nào xác định được văn bản do AI tạo ra.

Tuy nhiên, theo WSJ, một ứng dụng “chống ChatGPT” thật sự tồn tại.

Phát hiện chính xác 99,9%

OpenAI thảo luận nội bộ về công cụ "đóng dấu văn bản" ChatGPT trong 2 năm qua. Nguồn tin của WSJ cho biết ứng dụng đã hoàn chỉnh từ cách đây ít nhất một năm. Nó có thể phát hiện văn bản được tạo bằng ChatGPT với độ chính xác 99,9%. Bước cuối cùng để ra mắt chỉ là “nhấn nút”.

“ChatGPT vận hành trên một hệ thống AI có khả năng dự đoán từ hoặc cụm từ nào (được gọi là token) sẽ xuất hiện tiếp theo trong câu. Công cụ chống gian lận do OpenAI phát triển điều chỉnh nhỏ cách chọn token.

Những thay đổi này sẽ để lại một dấu hiệu được gọi là watermark”, nguồn tin của WSJ, người đã đọc qua tài liệu mô tả công cụ chống ChatGPT, tiết lộ.

Bằng mắt thường, không thể thấy được các watermark này trên văn bản, nhưng công nghệ phát hiện của OpenAI thì nhận ra. Công cụ thậm chí còn đưa ra tỷ lệ toàn bộ hay một phần tài liệu được viết bởi ChatGPT.

Nhiều trường học cấm cửa ChatGPT vì lo ngại gian lận. Ảnh: iStock.

"Khả năng Mặt Trời bốc hơi vào ngày mai còn cao hơn là bài luận (do AI tạo ra) không để lại dấu hiệu", John Thickstun, một nhà nghiên cứu tại Stanford, thành viên của nhóm phát triển phương pháp đóng dấu tương tự cho văn bản AI, cho biết.

Tuy nhiên, có nhân viên OpenAI cho rằng phương pháp này có thể bị qua mặt bằng kĩ thuật đơn giản như dịch bằng Google sang ngôn ngữ khác rồi chuyển ngược trở lại hoặc yêu cầu ChatGPT thêm biểu tượng cảm xúc vào văn bản sau đó xóa thủ công.

Ai được dùng công cụ phát hiện ChatGPT?

Trong nội bộ OpenAI, cuộc bàn luận về việc cung cấp cho ai công cụ phát hiện văn bản tạo ra bởi ChatGPT thu hút sự quan tâm lớn. Hầu hết đều nghĩ điều này là lựa chọn khó khăn.

Nếu ít người dùng, công cụ sẽ không hữu ích. Nếu quá nhiều người có quyền truy cập, những kẻ xấu có thể giải mã kỹ thuật đóng watermark, từ đó tìm cách vượt qua.

OpenAI cân nhắc cung cấp trực tiếp cho các đơn vị giáo dục hoặc công ty bên thứ 3 giúp trường xác định nội dung do AI viết.

Google phát triển công cụ đóng dấu bản quyền SynthID, có thể phát hiện văn bản do Gemini AI tạo ra. SynthID đang trong giai đoạn thử nghiệm và chưa được cung cấp rộng rãi.

OpenAI cũng có một công cụ để xác định hình ảnh có phải tạo ra từng ứng dụng chuyển văn bản thành hình ảnh DALL-E 3 hay không. Công ty ưu tiên chèn watermark vào âm thanh và hình ảnh hơn là văn bản vì tác hại đáng kể hơn, đặc biệt là trong năm bầu cử ở Mỹ.

OpenAI cũng phát triển công cụ 'đóng dấu' ảnh tạo bởi DALL-E 3. Ảnh Zdnet.

Vào tháng 1/2023, OpenAI từng phát hành thuật toán giúp phát hiện văn bản được viết bởi một số mô hình AI, bao gồm cả mô hình của chính họ. Nhưng thuật toán chỉ thành công 26%. Chỉ sau 7 tháng, OpenAI đã gỡ bỏ.

Có những công cụ khác do một số đơn vị và nhà nghiên cứu độc lập phát triển để phát hiện văn bản được tạo bằng AI, được nhiều giáo viên sử dụng. Nhưng đôi khi chúng không phát hiện văn bản được sinh bởi các mô hình ngôn ngữ lớn tiên tiến và có thể tạo ra kết quả giả.

Mối đe dọa với chính ChatGPT

OpenAI lo việc phát hành công cụ có khả năng phát hiện văn bản tạo bởi ChatGPT sẽ là một quyết định “tự bắn vào chân”. Một cuộc khảo sát cho thấy khoảng 1/3 người dùng sẽ từ bỏ chatbot này nếu biện phát chống gian lận được triển khai.

Cụ thể, OpenAI ủy quyền thực hiện một nghiên cứu vào tháng 4/2023. Kết quả cho thấy sự ủng hộ trên toàn thế giới đối với một công cụ có thể phát hiện văn bản ChatGPT. Trung bình cứ 4 người được hỏi thì 3 người muốn có, chỉ một người không.

Tuy nhiên, một nghiên cứu khác của OpenAI trong cùng tháng cho thấy 69% người dùng ChatGPT nghĩ rằng công nghệ phát hiện gian lận sẽ dẫn đến cáo buộc sai lầm.

Quan trọng hơn, 30% số người được hỏi cho biết sẽ sử dụng ChatGPT ít hơn nếu công ty triển khai hệ thống đóng dấu văn bản mà các chatbot AI đối thủ không có.

Kể từ đó, đội ngũ phát triển tại OpenAI tranh luận về lợi ích của việc cung cấp công cụ chống gian lận cho công chúng.

Vào đầu tháng 6, các thành viên cấp cao và nhà nghiên cứu của OpenAI lại thảo luận về dự án. Nhóm nhất trí rằng công nghệ watermark hoạt động tốt, nhưng kết quả của cuộc khảo sát người dùng ChatGPT từ năm ngoái vẫn còn rất đáng lưu tâm.

OpenAI đang xem xét các phương án tiếp cận khác, ít gây tranh cãi hơn. Tuy nhiên, mọi thứ vẫn chưa có hướng đi rõ ràng.

Nguyễn Hiếu

Theo WSJ