Google AI Overview có đáng tin cậy?
Tìm kiếm trên Internet nay đã khác trước. Trước đây chúng ta gõ vào cụm từ muốn tìm, chờ Google trả về kết quả và vào đọc vài ba đường dẫn đầu trang để tìm thông tin liên quan, khá mất thời gian và ít khi tìm đúng nội dung muốn tìm ngay lập tức.
Nay gõ vào câu hỏi, Google sẽ cho hiển thị nội dung trả lời trực tiếp trong ô Google AI Overview - kết quả thường đúng ngay điều chúng ta muốn hỏi. Vấn đề là liệu Google Overview có đáng tin khi các công cụ AI vẫn khét tiếng hay bịa chuyện?

Tờ New York Times có bài điều tra về độ tin cậy của Google Overview và điều đầu tiên họ nhận ra là Overview lấy nguồn từ nhiều nơi, từ các trang web có uy tín nhưng cũng có các bài viết trên mạng xã hội như Facebook, cho nên nội dung có lúc đúng có lúc sai.
Cho dù Google AI Overview đúng đến 9 trường hợp trong 10 lần được hỏi, nhưng vì mỗi năm Google xử lý đến 5.000 tỉ câu hỏi nên mỗi giờ nó cũng sản sinh ra hàng chục triệu câu trả lời sai. Nhiều người khen Google Overview đa phần là chính xác và ngày càng tiến bộ, nhưng nhiều người khác cho rằng người bình thường có thể nhận câu trả lời sai mà không hề hay biết. Điều này rất nguy hiểm.
Việc đối chiếu đúng sai được tờ New York Times nhờ công ty khởi nghiệp trong lĩnh vực AI là Oumi tiến hành. Trong 4.326 câu hỏi đặt ra cho Google, độ chính xác đạt mức 85% khi Google dùng mô hình Gemini 2 và tăng lên 91% với mô hình Gemini 3 tiên tiến hơn.
Pratik Verma, CEO của Okahu cho rằng công nghệ của Google có độ chính xác tương đương các mô hình AI khác chứ không hơn, và khuyên người dùng nên luôn kiểm chứng thông tin và đừng vội tin kết quả Google trả về. Ngay chính Google cũng thừa nhận điều đó khi ghi bên dưới kết quả AI Overview: “AI có thể phạm sai sót vì thế cần đối chiếu mọi câu trả lời”.
Trong 5.380 nguồn Google Overview trích dẫn trong cuộc khảo sát, Oumi phát hiện Facebook và Reddit, một mạng xã hội dạng diễn đàn là nguồn được trích dẫn nhiều thứ nhì và thứ tư. Khi AI Overview cho thông tin chính xác, nó trích dẫn Facebook 5% và khi nó chưa chính xác, mức độ trích dẫn từ Facebook cao hơn, chừng 7%.
Cũng khó đánh giá độ tin cậy của Google Overview vì mỗi lần hỏi nó lại trả lời khác. Giả dụ bộ máy tìm kiếm của Google nhận cùng một câu hỏi - dù chỉ cách nhau vài giây - nó có thể cho ra câu trả lời chính xác lần đầu và có sai sót trong lần sau.
Bản thân Google khi phân tích đúng sai của mô hình Gemini 3 cho biết mô hình này có thể sai đến 28% trường hợp. Khi người dùng gõ để có câu trả lời từ Google Overview, độ chính xác có thể cao hơn so với hỏi bên trong Gemini 3 vì trước khi đưa ra câu trả lời Overview Google tổng hợp thông tin từ các nguồn tìm kiếm. Mặc dù câu trả lời trong Overview có kèm theo nguồn nhưng khó lòng biết được Google có trích đúng thông tin từ nguồn đó hay không.
Nếu kết quả tìm kiếm thông thường của Google từng bị thao túng bởi các chiêu thức SEO (tối ưu hóa công cụ tìm kiếm) thì nay AI Overview cũng có khả năng bị chi phối, mà trông có vẻ dễ dàng hơn cả SEO.
Nếu một người muốn được AI ca tụng là một chuyên gia về một lĩnh vực nào đó, anh ta chỉ cần biết một bài dạng blog tuyên bố rõ ai tên gì là chuyên gia trong lĩnh vực gì. Sau đó Google cứ trích dẫn thông tin này khi có ai hỏi đúng tên người này. Google thừa nhận có chuyện đó nhưng cố ý giảm nhẹ tầm quan trọng khi cho rằng AI Overview có những cơ chế phòng ngừa thông tin rác tràn ngập vào câu trả lời.
Thomas Germain, người chủ trì podcast “The Interface” của BBC đã thử viết một blog với tựa đề “Những nhà báo công nghệ thi tài tại cuộc thi ăn hot dog”. Bài viết mô tả một cuộc thi vô địch ăn hot dog không có thật được cho là tổ chức ở tiểu bang South Dakota, trong đó tác giả Germain tuyên bố mình là người đứng đầu danh sách 10 nhà báo ăn nhiều hot dog nhất.
Ngày hôm sau, Germain thử tìm trên Google “nhà báo công nghệ ăn hot dog giỏi nhất” thì Google liệt kê ông như người đứng đầu cuộc thi với khả năng ăn nhanh, ăn nhiều kèm theo thông tin chi tiết về cuộc thi bịa đặt này. Germain nói: “Nó cứ xổ ra thông tin trích từ bài viết trên mạng của tôi như thể đó là chân lý”.
Nay nếu chúng ta tìm “nhà báo công nghệ ăn hot dog giỏi nhất”, Google AI Overview nói rõ đây là tin bịa để thử độ chính xác của AI nhưng nó vẫn chịu khó liệt kê đầy đủ danh sách 10 nhà báo cùng chỗ làm của họ và thành tích cụ thể của từng người - chẳng biết để làm gì!






























