AI mới 'tốt hơn DeepSeek' thực tế chỉ là sự cường điệu?

So sánh Manus với DeepSeek khá khập khiễng. Có vẻ như Manus là một trường hợp điển hình của 'cường điệu chạy trước đổi mới công nghệ'.

 Dù vậy, không thể phủ nhận Manus sở hữu một số tính năng nổi bật mà ít AI agent nào trước đây đạt được. Ảnh: Zaobao.

Dù vậy, không thể phủ nhận Manus sở hữu một số tính năng nổi bật mà ít AI agent nào trước đây đạt được. Ảnh: Zaobao.

Ngày 6/3, Manus, hệ thống AI do start-up Monica của Trung Quốc phát triển, đã chính thức ra mắt. Chỉ trong vài ngày, Manus đã tạo ra làn sóng thảo luận sôi nổi trên toàn cầu.

Là “AI tổng quát có thể chuyển hóa ý tưởng thành hành động”, Manus được quảng bá là vượt xa các chatbot truyền thống như ChatGPT hay Claude. AI này vừa trợ giúp người dùng tìm kiếm thông tin, tạo nội dung, vừa thực hiện tất cả công đoạn cần thiết để hoàn thành một nhiệm vụ.

Manus là gì và tại sao nó gây sốt?

Ví dụ, nếu người dùng yêu cầu Manus viết một bài nghiên cứu về biến đổi khí hậu, Manus tạo ra văn bản, tìm kiếm thông tin, viết bài, tạo biểu đồ và yếu tố tương tác trực quan. Cuối cùng, nó đóng gói mọi thứ thành một sản phẩm hoàn chỉnh mà không cần yêu cầu thêm từ người dùng.

Nó có thể áp dụng cách này cho nhiều tác vụ khác như phân tích cổ phiếu, viết mã lập trình, xây dựng khóa học trực tuyến hoặc lập kế hoạch du lịch chi tiết. Chatbot của Monica có thể hiển thị tiến trình làm việc của mình khi duyệt web, sử dụng công cụ và tổng hợp kết quả. Nhờ đó, người dùng có thể thấy rõ từng bước AI này thực hiện.

Video lan truyền trên mạng xã hội vì Manus AI thực hiện hàng loạt tác vụ cùng lúc. Ảnh: Barsee.

Nhóm phát triển tuyên bố Manus đã vượt qua DeepResearch của OpenAI trên thang đánh giá GAIA. Đây là tiêu chuẩn đánh giá khả năng thực hiện nhiệm vụ thực tế của các trợ lý AI tổng quát.

Dù hệ thống DeepSearch của OpenAI cũng có các tính năng nghiên cứu tương tự, những người dùng đầu tiên cho biết Manus là hệ thống AI tự động tiên tiến nhất mà họ đã trải nghiệm.

Trong một video demo, Manus hoạt động trên 50 màn hình khác nhau, thu thập thông tin từ các nguồn như X và Telegram, thậm chí còn chụp ảnh màn hình trong quá trình này.

Đâu là giới hạn của Manus?

Hiện tại, Manus chỉ được phát hành qua bản thử nghiệm có giới hạn và yêu cầu người dùng phải có mã mời để truy cập. Dù chưa có ngày phát hành chính thức, tốc độ phát triển nhanh chóng của Manus khiến nhiều người dự đoán việc phát hành rộng rãi sẽ không còn lâu nữa. Ngoài ra, Monica cũng có kế hoạch mở mã nguồn của mô hình này, cho phép các nhà phát triển tích hợp Manus vào các dự án của họ.

 Trải nghiệm của những người dùng đầu tiên khá tích cực về Manus AI. Ảnh: DeryaTR.

Trải nghiệm của những người dùng đầu tiên khá tích cực về Manus AI. Ảnh: DeryaTR.

Trưởng bộ phận sản phẩm của Hugging Face gọi đây là "công cụ AI ấn tượng nhất tôi từng thử nghiệm”. Nhà nghiên cứu chính sách AI Dean Ball mô tả Manus là "hệ thống máy tính sử dụng AI tinh vi nhất”.

Kênh Discord chính thức của AI này cũng đạt hơn 138.000 thành viên chỉ trong vài ngày. Các mã mời truy cập vào nền tảng này được rao bán với giá hàng nghìn USD trên ứng dụng Xianyu của Trung Quốc.

Tuy nhiên, không phải ai cũng bị tiềm năng của Manus thuyết phục.

Một số thử nghiệm cho thấy AI này có thể không hoàn toàn là một công nghệ mới mà dựa vào kết hợp và tinh chỉnh các mô hình AI có sẵn như Claude của Anthropic và Qwen của Alibaba. Lập luận này làm dấy lên nghi vấn liệu Manus thực sự là một đột phá hay chỉ là một sự kết hợp khéo léo giữa các công nghệ hiện có, theo TechCrunch.

 Lỗi khi trò chuyện giả lập kiểu "Human:" và "Assistant:". Ảnh: Alexander Doria.

Lỗi khi trò chuyện giả lập kiểu "Human:" và "Assistant:". Ảnh: Alexander Doria.

Các bài đánh giá thực tế cũng mang đến một cái nhìn khác về Manus. Đồng sáng lập start-up AI Pleias Alexander Doria cho biết anh đã gặp nhiều lỗi khi thử nghiệm hệ thống này như AI rơi vào vòng lặp vô tận và không thể hoàn thành nhiệm vụ.

"Có vẻ như Manus chính là Claude 3.7. Khi sử dụng kiểu hội thoại "Human:" và "Assistant:" thì xảy ra lỗi prompt injection (chèn câu lệnh), khiến nó bị kẹt trong vòng lặp vô tận. Nó không thể tạo ra một file đầy đủ với các đoạn hội thoại nhân tạo kiểu Human, Assistant.

Thay vào đó, nó liên tục gặp lỗi và chỉ xuất ra các ví dụ về cách tạo nội dung thông qua injection. Ngược lại, các token đặc biệt của Qwen hay DeepSeek lại xử lý bình thường", trích bài đánh giá.

Một số người dùng trên X cũng nhận thấy Manus mắc sai lầm khi trả lời các câu hỏi thực tế và đôi khi không trích dẫn nguồn dữ liệu chính xác, dù rất dễ tìm trên Internet.

Cây viết công nghệ Kyle Wiggers của TechCrunch đã thử yêu cầu Manus thực hiện các nhiệm vụ đơn giản nhưng kết quả không như mong đợi. Khi yêu cầu đặt một chiếc bánh sandwich gà rán từ cửa hàng đồ ăn nhanh trong khu vực của mình, AI này mất 10 phút rồi bị lỗi. Khi thử lần thứ 2, Manus chỉ có thể tìm thấy mục phù hợp trên menu nhưng không thể hoàn tất quá trình đặt hàng hay thanh toán.

Khi yêu cầu đặt vé máy bay từ New York đến Tokyo, AI này chỉ trả về một danh sách các đường dẫn đến các trang web đặt vé. Một số trong số đó bị lỗi. Yêu cầu đặt bàn tại một nhà hàng gần đó cũng không thành công. Khi được giao nhiệm vụ lập trình một trò chơi đối kháng lấy cảm hứng từ Naruto, AI này đã mắc lỗi và bị treo sau hơn 30 phút.

Manus có phải là "DeepSeek thứ 2"

Việc Manus nhanh chóng nổi tiếng cũng đặt ra loạt câu hỏi về sự cường điệu xung quanh AI này. Nhiều phương tiện truyền thông Trung Quốc gọi đây là "niềm tự hào của AI nội địa”. Những KOL trong ngành AI trên mạng xã hội liên tục thổi phồng khả năng của nó.

Một video nổi tiếng trên X nhờ quay lại cảnh Manus có thể thao tác trên nhiều ứng dụng smartphone. Nhưng sau đó, trưởng nhóm nghiên cứu của Manus Yichao “Peak” Ji đã xác nhận rằng video này không thực sự phản ánh chức năng thực tế của AI.

 Thử nghiệm của TechCrunch cho thấy Manus AI vẫn còn nhiều lỗi. Ảnh: TechCrunch.

Thử nghiệm của TechCrunch cho thấy Manus AI vẫn còn nhiều lỗi. Ảnh: TechCrunch.

Với thành công của DeepSeek, nhiều người ví Manus là phiên bản tiếp theo của AI Trung Quốc có thể cạnh tranh với phương Tây. Song, so sánh Manus với DeepSeek cũng có phần khập khiễng.

Nếu DeepSeek phát triển các mô hình AI từ đầu và công bố mã nguồn mở, công ty đứng sau Manus là Butterfly Effect không hề xây dựng mô hình AI của riêng mình và chưa có kế hoạch mở mã nguồn rộng rãi.

Butterfly Effect có trụ sở tại Singapore, theo Axios. Tuy nhiên, theo một số nguồn tin, đội ngũ phát triển của Manus lại chủ yếu làm việc tại Trung Quốc.

Do đó, chuyên gia về chính sách AI Luiza Jarovsky đặt nghi vấn liệu các máy chủ của Manus có được đặt ở Trung Quốc hay không và liệu có bất kỳ việc chuyển giao dữ liệu nào về Trung Quốc. Thế nên, có vẻ như Manus là một trường hợp điển hình của “cường điệu chạy trước đổi mới công nghệ”, TechCrunch kết luận.

Thúy Liên

Nguồn Znews: https://znews.vn/manus-ai-chua-du-de-lap-lai-thanh-cong-cua-deepseek-post1537145.html
Zalo