Perplexity tuyên bố có Deep Research tốt hơn Google Gemini, o1 của OpenAI và DeepSeek-R1

Deep Research của Perplexity như trợ lý nghiên cứu, đảm nhận công việc khó nhọc là tra cứu các nguồn, ghi chú và sau đó nộp một báo cáo được chuẩn bị kỹ lưỡng.

Sẽ thế nào nếu bạn yêu cầu chatbot trí tuệ nhân tạo (AI) tìm kiếm trên web, tra cứu một loại nguồn nhất định, sau đó tạo báo cáo chi tiết dựa trên tất cả thông tin mà nó thu thập được? Google Gemini có thể làm điều đó với giá 20 USD một tháng.

Trong khi công ty khởi nghiệp Perplexity sẽ giúp bạn làm điều đó miễn phí 5 lần mỗi ngày bằng công cụ AI mới nhất mang tên Deep Research (nghiên cứu sâu), giống cách mà OpenAI và Google gọi.

Perplexity cung cấp công cụ tìm kiếm kiểu hội thoại dựa vào chatbot AI để tóm tắt kết quả tìm kiếm, liệt kê các trích dẫn cho câu trả lời và giúp người dùng tinh chỉnh các truy vấn để nhận được phản hồi tốt nhất.

Thay vì trả kết quả tìm kiếm bằng những liên kết màu xanh da trời theo kiểu của Google, Perplexity tạo ra câu trả lời dạng tường thuật nội dung với các trích dẫn có kèm theo liên kết chứa thông tin nguồn. Sau đó, người dùng có thể đặt các câu hỏi cụ thể hơn để tìm các thông tin chi tiết.

Bằng cách nhấn mạnh vào độ chính xác, Perplexity nhanh chóng tạo ra sự khác biệt cho chatbot của công ty trong một thị trường ngày càng đông đúc, thu hút được những người nổi tiếng. Jensen Huang, Giám đốc điều hành Nvidia, từng cho biết sử dụng chatbot AI của Perplexity hầu như mỗi ngày.

Deep Research của Perplexity có gì khiến nhiều người chú ý? Hãy nghĩ về Deep Research như trợ lý nghiên cứu, đảm nhận công việc khó nhọc là tra cứu các nguồn, ghi chú và sau đó nộp một báo cáo được chuẩn bị kỹ lưỡng.

Thực hiện một nhiệm vụ như vậy đòi hỏi rất nhiều sức mạnh tính toán và do đó rất tốn kém. Perplexity sẽ cung cấp số lượng truy vấn Deep Research không giới hạn cho những người đăng ký gói Pro với giá 20 USD/tháng, nhưng người dùng miễn phí có thể tận hưởng "một số câu trả lời giới hạn mỗi ngày".

"Deep Research vượt trội ở nhiều nhiệm vụ cấp độ chuyên gia, từ tài chính và tiếp thị đến nghiên cứu sản phẩm, và đạt điểm chuẩn cao trong Humanity's Last Exam", Perplexity cho biết.

Deep Research của Perplexity hiện chỉ giới hạn phiên bản trên web, nhưng sẽ sớm có trên ứng dụng di động cho Android và iOS.

Humanity's Last Exam (HLE) là bài kiểm tra đánh giá năng lực của các mô hình ngôn ngữ lớn trong lĩnh vực AI. Nó được thiết kế để trở thành chuẩn mực cuối cùng cho các bài kiểm tra học thuật khép kín, gồm nhiều chủ đề khác nhau.

Đặc điểm nổi bật của Humanity's Last Exam

Độ khó cao: HLE bao gồm các câu hỏi phức tạp, đòi hỏi khả năng suy luận sâu sắc và kiến thức chuyên môn rộng rãi, vượt xa khả năng của các bài kiểm tra thông thường.

Đa dạng chủ đề: HLE bao gồm 3.000 câu hỏi trên nhiều lĩnh vực như toán học, khoa học tự nhiên, khoa học xã hội và nhân văn.

Tính khách quan: Các câu hỏi trong HLE được thiết kế rõ ràng, có đáp án chính xác và dễ dàng kiểm chứng, đảm bảo tính khách quan trong đánh giá.

Tính toàn diện: HLE đánh giá nhiều khía cạnh của AI, gồm khả năng hiểu, suy luận, giải quyết vấn đề và áp dụng kiến thức.

Mục tiêu của Humanity's Last Exam

Đo lường tiến bộ của AI: HLE cung cấp một thước đo chính xác để đánh giá sự tiến bộ của các mô hình AI theo thời gian.

Xác định giới hạn của AI: HLE giúp xác định những lĩnh vực mà AI còn hạn chế và cần cải thiện.

Thúc đẩy nghiên cứu AI: HLE tạo ra động lực cho các nhà nghiên cứu AI phát triển các mô hình mạnh mẽ hơn, có khả năng giải quyết các vấn đề phức tạp.

Tóm lại Humanity's Last Exam là bài kiểm tra quan trọng, đóng vai trò như một chuẩn mực đánh giá năng lực của AI, đồng thời thúc đẩy sự phát triển của lĩnh vực này.

Để khởi chạy truy vấn Deep Research, người dùng Perplexity chọn từ danh sách xổ xuống khi lựa mô hình bên trái khung nhập văn bản. Sau khi hoàn tất công việc nghiên cứu, người dùng sẽ có thể xuất nội dung trực tiếp dưới dạng tài liệu hoặc file PDF.

Chọn Deep Research từ giao diện của Perplexity

Chọn Deep Research từ giao diện của Perplexity

Xuất nội dung nghiên cứu dưới dạng file PDF

Xuất nội dung nghiên cứu dưới dạng file PDF

Ngoài ra, bạn còn thấy tùy chọn chuyển đổi thành trang Perplexity trực tuyến, có thể chia sẻ với bất kỳ ai dưới dạng liên kết web.

Với Gemini Deep Research, người dùng cũng có thể nhập trực tiếp vào Google Docs.

Perplexity tuyên bố Deep Research của họ tốt hơn mô hình Google Gemini phiên bản có khả năng tư duy, o3-mini và o1 của OpenAI và cả DeepSeek-R1. Nó chỉ xếp hạng thấp hơn Deep Research của OpenAI trên điểm chuẩn Humanity's Last Exam.

Cây viết Nadeem Sarwar của trang Digital Trends đã sử dụng Gemini Deep Research rộng rãi để xem qua các bài báo và kho lưu trữ khoa học. Theo Nadeem Sarwar, Gemini Deep Research rất tốt trong việc tìm kiếm thông tin có liên quan và đơn giản hóa nó. Gemini Deep Research cũng đặc biệt hiệu quả trong việc tìm kiếm thông báo từ các cơ quan chính phủ và xử lý các cập nhật pháp lý khá tốt.

"Deep Research có thể thực hiện khoảng 5% nhiệm vụ trong nền kinh tế hiện nay"

Sam Altman, Giám đốc điều hành OpenAI, đã xác nhận cách đây vài ngày rằng công ty sẽ cung cấp hai truy vấn Deep Research cho người dùng miễn phí mỗi tháng. Với những người dùng ChatGPT Plus (trả phí 20 USD/tháng), họ sẽ nhận được 10 lượt truy vấn Deep Research mỗi tháng. Người dùng gói ChatGPT Pro của OpenAI (giá 200 USD/tháng) sẽ có 100 truy vấn Deep Research mỗi tháng.

Khi trò chuyện trên podcast The Times Tech gần đây, Sam Altman đã thảo luận Deep Research của OpenAI, tác tử AI có khả năng tự tìm kiếm thông tin trực tuyến và thực hiện các nhiệm vụ nghiên cứu phức tạp, nhiều bước thay mặt cho người dùng.

Tác tử AI là hệ thống hoặc chương trình máy tính được thiết kế để thực hiện các tác vụ tự động bằng cách sử dụng AI. Các tác tử AI có khả năng tương tác với môi trường, thu thập thông tin, xử lý dữ liệu, ra quyết định và thực hiện các hành động dựa trên mục tiêu được đặt ra.

Deep Research là tác tử AI được tối ưu hóa cho duyệt web và phân tích dữ liệu, có khả năng thực hiện nghiên cứu nhiều bước trên internet cho các nhiệm vụ phức tạp mà theo OpenAI, "hoàn thành trong vài chục phút những gì con người phải mất nhiều giờ".

Bạn chỉ cần cung cấp một yêu cầu là Deep Research sẽ "tìm kiếm, phân tích và tổng hợp hàng trăm nguồn trực tuyến để tạo ra một báo cáo toàn diện ở cấp độ của nhà phân tích nghiên cứu".

Deep Research phục vụ cho các chuyên gia trong lĩnh vực tài chính, khoa học, chính sách và kỹ thuật, cung cấp những thông tin chi tiết đáng tin cậy và toàn diện. Tính năng này cũng hữu ích với những người mua sắm đang tìm kiếm các đề xuất được cá nhân hóa về giao dịch mua đòi hỏi phải nghiên cứu cẩn thận, chẳng hạn ô tô, đồ gia dụng và đồ nội thất.

Kết quả gồm các trích dẫn và tóm tắt rõ ràng, giúp dễ dàng xác minh. Về cơ bản, Deep Research giúp tinh giản quá trình nghiên cứu tốn thời gian, cung cấp thông tin chuyên sâu hiệu quả chỉ từ một truy vấn.

Trong loạt bài đăng trên mạng xã hội X, Sam Altman đã mô tả Deep Research là "giống một siêu năng lực, hoạt động như nhóm chuyên gia sẵn sàng hỗ trợ bạn".

Sam Altman cho biết Deep Research có thể "sử dụng internet, thực hiện nghiên cứu, lập luận phức tạp và trả về cho bạn một báo cáo", xử lý các nhiệm vụ "mất nhiều giờ/ngày và tốn hàng trăm USD".

Dù rất tốn nhiều tài nguyên tính toán và hoạt động còn chậm, ông tuyên bố "Deep Research là hệ thống AI đầu tiên có thể thực hiện nhiều nhiệm vụ phức tạp, có giá trị như vậy".

Deep Research mất từ 5 đến 30 phút để hoàn thành công việc và bạn sẽ nhận được thông báo khi nghiên cứu xong. Kết quả cuối cùng là một báo cáo được gửi qua ChatGPT.

Hiện báo cáo chỉ có văn bản nhưng OpenAI cho biết trong những tuần tới, họ sẽ thêm hình ảnh nhúng, biểu đồ dữ liệu và các kết quả phân tích khác để tăng thêm độ rõ ràng và ngữ cảnh.

Deep Research sẽ có trên ứng dụng dành cho thiết bị di động và PC vào cuối tháng 2. Tính năng này cũng sẽ sớm khả dụng với khách hàng Plus, Team và Enterprise trước khi đến với gói miễn phí của OpenAI.

Sam Altman kêu gọi mọi người "hãy thử nghiệm Deep Research với công việc khó khăn nhất mà bạn phải giải quyết bằng cách sử dụng internet và xem điều gì sẽ xảy ra".

Tuy nhiên, OpenAI cảnh báo rằng Deep Research "có thể gặp khó khăn trong việc phân biệt thông tin có thẩm quyền với tin đồn và đang có điểm yếu trong việc hiệu chỉnh độ tin cậy (chưa thể đánh giá chính xác mức độ đáng tin cậy của thông tin đưa ra – PV), không thể hiện rõ thông tin chưa chắc chắn khiến người dùng có thể hiểu nhầm".

Theo OpenAI, khi Deep Research mới ra mắt, người dùng cũng có thể thấy các lỗi định dạng nhỏ trong báo cáo và trích dẫn, với các nhiệm vụ có thể mất nhiều thời gian hơn để bắt đầu.

"Chúng tôi kỳ vọng tất cả những vấn đề này sẽ nhanh chóng được cải thiện khi có thêm người dùng và thời gian", OpenAI cho hay.

Sam Altman tin rằng Deep Research sẽ có tác động đáng kể và có thể thực hiện "khoảng 5% nhiệm vụ trong nền kinh tế hiện nay".

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/perplexity-tuyen-bo-co-deep-research-tot-hon-google-gemini-o1-cua-openai-va-deepseek-r1-229341.html
Zalo