Mô hình AI y tế của Alibaba đạt chuẩn phó trưởng khoa trong kỳ thi, vượt DeepSeek-R1 và GPT-4o

28/5/2025 Gốc

Dữ liệu chuẩn do Quark cung cấp cho thấy mô hình trí tuệ nhân tạo (AI) chăm sóc sức khỏe của Alibaba có độ chính xác vượt trội so với DeepSeek-R1 và V3, cũng như GPT-4o của OpenAI.

Mô hình AI chuyên dụng cho chăm sóc sức khỏe của gã khổng lồ thương mại điện tử Alibaba đã thể hiện năng lực tương đương các bác sĩ giàu kinh nghiệm và hiện được tích hợp vào Quark – ứng dụng trợ lý AI hàng đầu hướng tới người tiêu dùng.

Theo thông tin từ Alibaba, mô hình AI này đã vượt qua kỳ thi chứng nhận hành nghề y tế của Trung Quốc, đạt chuẩn phó trưởng khoa trong 12 chuyên ngành y khoa phổ biến, gồm cả y học tổng quát, nội khoa, ngoại khoa, sản phụ khoa và nhi khoa.

Hệ thống chứng nhận chuyên môn y tế của Trung Quốc xếp hạng nhân viên thành 5 cấp bậc, trong đó phó trưởng khoa đứng thứ 4.

Mô hình AI chăm sóc sức khỏe này có nền tảng là Qwen 2.5-32B của Alibaba, được đào tạo nhiều giai đoạn với dữ liệu phong phú và chất lượng cao, theo thông tin từ công ty.

Dữ liệu đánh giá do Quark cung cấp cho thấy mô hình chăm sóc sức khỏe của Alibaba đạt độ chính xác cao hơn DeepSeek-R1 và V3 cũng như GPT-4o của OpenAI.

Mô hình này làm bài kiểm tra và đưa ra 74,8% câu trả lời đúng ở cấp độ phó trưởng khoa, cùng tỷ lệ 56,4% ở cấp cao nhất là trưởng khoa.

Theo Alibaba, mô hình chăm sóc sức khỏe của hãng đã được tích hợp hoàn toàn vào Quark. Trợ lý AI phổ biến này sẽ tự động kích hoạt mô hình mỗi khi người dùng đặt câu hỏi liên quan đến sức khỏe.

Alibaba cho biết mô hình này đã được tinh chỉnh để nâng cao độ chính xác với sự hợp tác của các bệnh viện và cơ sở y tế. Đó là những nơi cũng đang áp dụng nó vào ứng dụng riêng của họ.

Quảng cáo Quark trên màn hình 3D tại một khu mua sắm ở thành phố Trùng Khánh, Trung Quốc - Ảnh: Weibo

Trợ lý “tất cả trong một”

Ban đầu được Alibaba phát triển như một công cụ tìm kiếm trực tuyến và lưu trữ đám mây, Quark đã được tái định vị vào tháng 3 để trở thành trợ lý “tất cả trong một” khi cạnh tranh ngày càng gia tăng trong thị trường ứng dụng AI tiêu dùng tại Trung Quốc.

Vào tháng 5, Quark giới thiệu chức năng “tìm kiếm sâu”, sử dụng mô hình AI Qwen của Alibaba để kết hợp khả năng suy luận nâng cao với tìm kiếm trực tuyến, nhằm mang đến câu trả lời chính xác cho các truy vấn phức tạp. Đó là bước cải tiến so với các công cụ tìm kiếm dựa trên từ khóa truyền thống.

Khi người dùng nhập truy vấn vào Quark, hệ thống sẽ phân tích câu hỏi và thực hiện tìm kiếm trực tuyến theo từng giai đoạn. Sau đó, Quark sử dụng kết quả tìm kiếm để tinh chỉnh và điều chỉnh quá trình suy luận rồi đưa ra câu trả lời cuối cùng.

Gã khổng lồ công nghệ có trụ sở tại thành phố Hàng Châu (Trung Quốc) đang tận dụng sức mạnh của các mô hình nền tảng Qwen để nâng cao trải nghiệm ứng dụng cho người dùng phổ thông.

“Quark sẽ tập trung vào nhu cầu của người dùng và liên tục cải tiến tính năng 'tìm kiếm sâu' nhằm trở thành trợ lý AI toàn diện”, ông Zhang Fan, người đứng đầu mảng tìm kiếm của Quark, tuyên bố.

Tính năng “tìm kiếm sâu” hiện có mặt trên Quark ở nhiều nền tảng khác nhau, gồm cả thiết bị di động và máy tính cá nhân.

Được mệnh danh là “siêu trợ lý”, Quark đã nhanh chóng trở thành ứng dụng AI phổ biến nhất tại Trung Quốc kể từ tháng 3, vượt qua các đối thủ như Doubao thuộc ByteDance (công ty mẹ TikTok) và DeepSeek, theo dữ liệu từ Aicpb.

Aicpb là nền tảng trực tuyến chuyên theo dõi và xếp hạng mức độ phổ biến của các sản phẩm AI, gồm ứng dụng, chatbot và các công cụ khác. Trang web này thường tổng hợp dữ liệu từ nhiều nguồn như lượt tải, mức độ sử dụng, xếp hạng của người dùng và các chỉ số tương tác để đưa ra bảng xếp hạng cập nhật theo thời gian thực.

Hiện tại, Aicpb chủ yếu được biết đến trong cộng đồng công nghệ Trung Quốc như một nguồn tham khảo nhanh về xu hướng ứng dụng AI được ưa chuộng.

Alibaba cho biết Quark đã có hơn 200 triệu người dùng trước khi được tái định vị thành trợ lý AI "tất cả trong một". Ứng dụng này hiện cung cấp các tính năng gồm lưu trữ đám mây, dịch vụ trình duyệt, công cụ tìm kiếm nâng cao với AI, tạo ảnh và viết nội dung bằng AI, cùng các công cụ tóm tắt và phiên âm bản ghi (chuyển nội dung từ bản ghi âm thành văn bản).

Trọng tâm của các hãng công nghệ Trung Quốc

Lĩnh vực chăm sóc sức khỏe tiếp tục là trọng tâm của các hãng công nghệ Trung Quốc trong việc tích hợp khả năng AI vào ứng dụng riêng, từ phát triển thuốc, hỗ trợ chẩn đoán đến trợ lý sức khỏe cá nhân hóa.

Đầu tháng 5, tập đoàn truyền thông mạng xã xã hội và game Tencent Holdings đã phát hành phiên bản beta trợ lý quản lý sức khỏe, được hỗ trợ bởi mô hình AI Hunyuan của công ty. Baichuan, công ty khởi nghiệp AI do chuyên gia ngành internet Vương Hiểu Xuyên sáng lập, cũng đang tập trung vào các ứng dụng AI liên quan đến chăm sóc sức khỏe.

Vương Hiểu Xuyên là doanh nhân và nhà đầu tư internet nổi tiếng người Trung Quốc. Ông được biết đến nhiều nhất với vai trò người sáng lập và cựu giám đốc điều hành Sogou, công cụ tìm kiếm internet lớn thứ hai Trung Quốc (sau Baidu) trước khi được Tencent Holdings mua lại vào năm 2021.

Sau khi rời Sogou, Vương Hiểu Xuyên đã chuyển hướng sang lĩnh vực AI. Vào tháng 4.2023, ông đã thành lập Baichuan, công ty khởi nghiệp tập trung vào việc phát triển các mô hình ngôn ngữ lớn và các ứng dụng AI. Baichuan nhanh chóng trở thành một trong những kỳ lân công nghệ (startup được định giá trên 1 tỉ USD) lĩnh vực AI của Trung Quốc.

Không những thế, Baichuan được đánh giá là một trong "bốn con hổ AI” của nước này cùng với Zhipu AI, Moonshot AI, MiniMax.

Vương Hiểu Xuyên là nhân vật có tầm ảnh hưởng ở ngành công nghệ Trung Quốc và được tạp chí Time (Mỹ)vinh danh trong danh sách "100 người có ảnh hưởng nhất trong AI năm 2024". Ông đặc biệt quan tâm đến việc ứng dụng AI vào lĩnh vực chăm sóc sức khỏe, với tầm nhìn sử dụng AI để giải quyết các thách thức hệ thống như thiếu hụt bác sĩ tay nghề cao trên toàn cầu.

Alibaba tiết lộ phương pháp giảm 88% chi phí đào tạo AI tìm kiếm

Giữa tháng 5, Alibaba đã giới thiệu ZeroSearch - phương pháp mới đào tạo mô hình AI không cần liên tục kết nối với các công cụ tìm kiếm bên ngoài.

Alibaba đã công bố bước đột phá trong việc giảm chi phí đào tạo các mô hình AI phục vụ tìm kiếm tới gần 90%. Động thái này diễn ra trong bối cảnh các công ty đang nỗ lực nâng cao năng lực AI, đồng thời giảm thiểu chi phí phát triển.

Cụ thể hơn, các nhà nghiên cứu tại Alibaba giới thiệu phương pháp mới có tên ZeroSearch, giúp cải thiện khả năng tìm kiếm của mô hình AI thông qua mô phỏng, mà không cần tương tác trực tiếp với công cụ tìm kiếm thực tế.

Phương pháp này loại bỏ chi phí cao thường phát sinh khi chuyển truy vấn thông qua các công cụ tìm kiếm thương mại. Thay vào đó, ZeroSearch cho phép các mô hình AI, vốn được đào tạo trên các cơ sở dữ liệu tri thức rộng lớn, tự tạo nội dung chất lượng để phản hồi truy vấn.

Bằng cách biến một mô hình tham chiếu thành công cụ tìm kiếm có thể đào tạo các hệ thống AI khác trong việc trả lời câu hỏi, ZeroSearch giúp giảm sự phụ thuộc vào cơ sở hạ tầng tìm kiếm bên ngoài đắt đỏ. Từ đó, phương pháp này làm cho việc đào tạo AI trong lĩnh vực tìm kiếm trở nên dễ tiếp cận hơn, đặc biệt là với các nhóm nhỏ có nguồn lực hạn chế.

Mô hình tham chiếu đã được huấn luyện trước và có khả năng hoạt động tốt, đóng vai trò làm chuẩn hoặc nguồn dữ liệu để đào tạo mô hình AI khác.

Ví dụ, việc gửi truy vấn tới Google 64.000 lần thông qua giao diện lập trình ứng dụng (API) sẽ tốn khoảng 586,70 USD, trong khi sử dụng một mô hình AI với 14 tỉ tham số để tạo phản hồi phục vụ huấn luyện chỉ tiêu tốn khoảng 70,80 USD, tương đương mức giảm chi phí lên tới 88%.

Google tính phí cho mỗi truy vấn gửi qua API. Trong ví dụ này, nếu hệ thống gửi 64.000 câu hỏi, tổng chi phí phải trả cho Google sẽ là 586,70 USD.

Đổi mới nêu trên có thể thúc đẩy khả năng tìm kiếm của AI, một yếu tố mà các nhà nghiên cứu cho rằng rất quan trọng để nâng cao năng lực suy luận và tạo sinh nội dung cho mô hình.

Sơn Vân