Vì sao AI Trung Quốc ngộ nhận thành ChatGPT?
Việc một mô hình AI tự nhận là ChatGPT không phải điều xa lạ trong lĩnh vực trí tuệ nhân tạo vì đa số công cụ chatbot hiện tại đều được đào tạo từ nguồn dữ liệu chung.
DeepSeek, một phòng thí nghiệm AI của Trung Quốc đã phát hành mô hình trí tuệ nhân tạo sở hữu sức mạnh vượt trội so với nhiều đối thủ trên thị trường. DeepSeek V3 có thể xử lý hiệu quả các tác vụ dựa trên văn bản như mã hóa hoặc viết luận theo yêu cầu từ người dùng.
Trong một số bài đăng trên X, người dùng đã khiến DeepSeek V3 tự nhận mình là ChatGPT, chatbot của OpenAI. Khi được yêu cầu giải thích thêm, AI của Trung Quốc khẳng định nó là phiên bản của mô hình GPT-4 được phát hành vào năm 2023.
TechCrunch đánh giá đây là sự ảo tưởng khá nghiêm trọng. Nếu người dùng hỏi DeepSeek V3 về nguồn dữ liệu đầu vào, nó sẽ liên kết sang cách sử dụng API của OpenAI. Thậm chí, chatbot này còn kể một số câu chuyện cười giống như cách tương tác của GPT-4.
Các mô hình như ChatGPT và DeepSeek V3 có thể được gọi chung là hệ thống thống kê. Chúng sử dụng hàng tỷ ví dụ thực tế để học hỏi, từ đó đưa ra dự đoán về từ tiếp theo dựa trên đầu vào là câu lệnh của người dùng.
“Rõ ràng DeepSeek V3 đang sử dụng phản hồi thô từ ChatGPT tại một thời điểm nhất định. Chúng tôi đã thấy những trường hợp kỹ sư trực tiếp đào tạo mô hình của họ bằng kết quả từ các mô hình khác”, Mike Cook, nhà nghiên cứu tại Đại học King's College London nói với TechCrunch.
Cook lưu ý rằng việc lạm dụng dữ liệu đào tạo từ các mô hình AI đối thủ có thể là con dao 2 lưỡi đối với chất lượng mô hình gốc, vì nó dẫn đến tình trạng ảo giác và tạo ra nhiều câu trả lời gây hiểu lầm. Nghiên cứu viên này cho biết thêm rằng việc tự ý sử dụng thông tin của bên thứ 3 cũng vi phạm các điều khoản dịch vụ của hệ thống đó.
Trong đó, các điều khoản của OpenAI cấm người dùng sử dụng kết quả đầu ra để phát triển các mô hình cạnh tranh với ChatGPT.
Heidy Khlaaf, nhà nghiên cứu trí tuệ nhân tạo hàng đầu tại Viện AI Now cho biết việc tiết kiệm chi phí bằng cách chắt lọc kiến thức từ mô hình hiện có đang làm gia tăng rủi ro đối với các nhà phát triển.
“Ngay cả khi thông tin trên Internet đang tràn ngập trong dữ liệu đầu vào của ChatGPT, các mô hình khác vô tình sử dụng nội dung này sẽ bị lẫn các thông điệp tùy chỉnh từ OpenAI. Nếu DeepSeek có hành động như trên, việc mô hình V3 tự nhận là ChatGPT không có gì đáng ngạc nhiên”, Heidy Khlaaf nói.