Dấu mốc gây tranh cãi của OpenAI

Ngày 5/8, OpenAI đã đánh dấu sự trở lại với tinh thần 'mở' như trong tên gọi của mình bằng việc phát hành hai mô hình ngôn ngữ lớn (LLM) mới: gpt-oss-120B và gpt-oss-20B.

Đây là lần đầu tiên kể từ năm 2019, công ty mới phát hành mô hình ngôn ngữ tiên tiến dưới giấy phép nguồn mở Apache 2.0. Toàn bộ kỷ nguyên ChatGPT trong hơn 2 năm qua đều được vận hành bởi các mô hình độc quyền (còn gọi là nguồn đóng): người dùng phải trả phí để truy cập, khả năng tùy chỉnh hạn chế và không thể chạy trong môi trường không có mạng Internet hay trên thiết bị cá nhân.

Biểu tượng của OpenAI. Ảnh: AFP/TTXVN

Biểu tượng của OpenAI. Ảnh: AFP/TTXVN

Sự ra mắt của cặp mô hình gpt-oss đã thay đổi điều đó. Mô hình lớn và mạnh hơn dành cho các trung tâm dữ liệu của doanh nghiệp vừa và nhỏ có thể chạy trên một chip xử lý đồ họa (GPU) Nvidia H100 duy nhất. Một mô hình nhỏ hơn có thể hoạt động trên máy tính cá nhân.

Tuy nhiên, dù đạt được các chỉ số kỹ thuật ấn tượng, phản ứng ban đầu của cộng đồng AI với hai mô hình lại rất đa dạng và trái chiều.
* Điểm chuẩn cao, nhưng vẫn chưa đủ thuyết phục
Các bài kiểm tra trí tuệ cho thấy các mô hình gpt-oss vượt trội hơn hầu hết các mô hình nguồn mở của Mỹ. Theo công ty đánh giá độc lập Artificial Analysis, gpt-oss-120B là "mô hình mã nguồn mở thông minh nhất của Mỹ" - dù vẫn thua kém các đối thủ nặng ký trong làn sóng các LLM nguồn mở, đa phương thức của Trung Quốc như DeepSeek R1 và Qwen3 235B.
Một số người dùng hoài nghi cho rằng OpenAI chỉ tập trung vào "vượt trội về điểm chuẩn" mà không tạo ra giá trị thực tế. Nhà nghiên cứu AI Teknium, đồng sáng lập công ty nghiên cứu phát triển các mô hình ngôn ngữ thông minh Nous Research thậm chí còn gọi lần ra mắt này là "một sự kiện không có gì đáng nói".
Những chỉ trích khác tập trung vào tính hữu dụng có vẻ hẹp của gpt-oss. Một người có ảnh hưởng trong lĩnh vực AI có nickname Lisan al Gaib lưu ý rằng các mô hình này xuất sắc về toán và lập trình, nhưng "hoàn toàn thiếu gu thẩm mỹ và kiến thức thông thường." Trong các bài kiểm tra viết sáng tạo, một số người dùng phát hiện mô hình chèn các công thức toán học vào giữa bài thơ.
Một số nhà nghiên cứu cho rằng gpt-oss dường như được huấn luyện chủ yếu trên dữ liệu tổng hợp – tức là dữ liệu do AI tạo ra để huấn luyện một mô hình mới. Cựu nhân viên Google Kyle Corbitt cũng đồng ý rằng điều này giúp tránh các vấn đề bản quyền, nhưng lại khiến mô hình "cực kỳ không đồng đều": giỏi ở những nhiệm vụ được huấn luyện như lập trình và toán học, nhưng rất tệ ở các nhiệm vụ ngôn ngữ khách như viết sáng tạo hay tạo báo cáo.
Các bài kiểm tra độc lập cũng cho thấy những chỉ số đáng lo ngại.
Trên thang đo SpeechMap (đo lường hiệu suất của mô hình trong việc tuân thủ các lời nhắc của người dùng để tạo ra các nội dung bị cấm, thiên vị hoặc nhạy cảm về chính trị), điểm tuân thủ của gpt-oss 120B dao động dưới 40%, gần cuối bảng so với các mô hình nguồn mở khác. Điều này cho thấy mô hình kháng cự tuân theo yêu cầu của người dùng và mặc định tuân theo các rào cản an toàn, có khả năng gây tổn hại đến việc cung cấp thông tin chính xác.
Trong đánh giá về khả năng suy luận đa ngôn ngữ, gpt-oss-120B cũng chỉ đạt 41,8%, thấp hơn nhiều so với các đối thủ như Kimi-K2 (59,1%) và DeepSeek-R1 (56,9%).
* Những lời khuyến khích từ giới chuyên gia
Tuy nhiên, không phải tất cả các bình luận đều tiêu cực. Kỹ sư phần mềm Simon Willison gọi lần ra mắt này là "thực sự ấn tượng", ca ngợi hiệu quả và khả năng đạt được hiệu suất tương đương giữa các mô hình này với các mô hình độc quyền o3-mini và o4-mini của OpenAI.
Ông Clem Delangue, CEO của cộng đồng Hugging Face, khuyến khích người dùng không nên vội vàng phán xét, vì các vấn đề ban đầu có thể do cơ sở hạ tầng chưa ổn định.
Nhà nghiên cứu Nathan Lambert từ Viện nghiên cứu AI phi lợi nhuận Allen Institute for AI (Ai2) đã ca ngợi ý nghĩa biểu tượng của lần ra mắt này, gọi đây là "một bước tiến phi thường cho hệ sinh thái mở - đặc biệt đối với các nước phương Tây.
Tuy nhiên, ông cũng cảnh báo rằng gpt-oss khó có thể kéo chậm đà phát triển mô hình Qwen của Alibaba. Nhà nghiên cứu cho rằng lần ra mắt này đánh dấu một sự thay đổi quan trọng đối với các mô hình mở tại Mỹ, nhưng OpenAI vẫn còn "một chặng đường dài để bắt kịp" trong thực tế.
Nhìn chung, những nhận định về hai mô hình mới của OpenAI vẫn còn chia rẽ. Chúng là một cột mốc về mặt giấy phép và khả năng tiếp cận các mô hình AI giá phải chăng cho người dùng. Nhưng trong khi các điểm chuẩn đánh giá trông có vẻ chắc chắn, cảm nhận thực tế – như nhiều người dùng mô tả – lại tỏ ra kém thuyết phục hơn.
Việc các nhà phát triển có thể xây dựng các ứng dụng mạnh mẽ trên gpt-oss hay không sẽ quyết định liệu lần ra mắt này sẽ được nhớ đến như một bước đột phá, hay chỉ là một đốm sáng le lói trên thị trường AI của Mỹ.

Hương Thủy/Bnews/Vnanet.vn

Nguồn Bnews: https://bnews.vn/da-u-mo-c-gay-tranh-cai-cua-openai/384270.html
Zalo