Thảm họa ChatGPT-5

4 giờ trước Gốc

Ngay sau khi ra mắt, mô hình tiên tiến nhất của OpenAI bị người dùng Internet chỉ trích vì quá vô cảm, trong khi giới chuyên môn không ấn tượng như mong đợi.

GPT-5 là một trong những sản phẩm được chờ đón nhất của OpenAI. Nhiều tháng qua, CEO Sam Altman liên tục nói về các cải tiến của nó. Tuy nhiên chỉ trong 24 giờ sau khi phát hành, mô hình tiên tiến từ OpenAI nhận phải nhiều đánh giá trái chiều.

Công ty cho biết GPT-5 có khả năng lập trình, suy luận các vấn đề phức tạp tốt hơn. Họ nhấn mạnh mô hình có thể hoạt động tương đương chuyên gia trình độ tiến sĩ. Dù vậy, đánh giá chung về mô hình mới của OpenAI rất khác nhau.

“Đây là mô hình ưa thích mới của tôi”, lập trình viên Simon Willison viết trên blog cá nhân. Dù vậy, ông lưu ý GPT-5 “không thay đổi quá nhiều so với những gì chúng ta có trước đây”.

Trên Internet, người dùng ChatGPT bày tỏ thất vọng khi GPT-5 liên tục bịa đặt thông tin, thậm chí không thể trả lời những câu hỏi toán học, chính tả đơn giản.

GPT-5 "vô hồn"

Trong diễn đàn r/ChatGPT trên Reddit, nhiều người chỉ trích GPT-5 với những từ ngữ như “thảm họa”, “kinh khủng” và “vô giá trị kể cả với người dùng trả phí”. “GPT-5 là một thảm họa”, tài khoản u/GALAXY_12321 khẳng định. Người này viết rằng bản mới dường như thiếu “cá tính” so với GPT-4o, câu trả lời ngắn gọn và lạnh lùng hơn.

“GPT-4o có... sự ấm áp. Nó dí dỏm, sáng tạo và cá nhân hóa một cách bất ngờ, cứ ngỡ như nói chuyện với một người thấu hiểu bạn. Không chỉ trả lời, nó cho cảm giác chúng ta được lắng nghe. Giờ thì sao? Mọi thứ thật... vô hồn”, tài khoản trên cho biết.

Một tài khoản phàn nàn khi GPT-5 quá vô cảm. Ảnh: Reddit.

Tương tự, tài khoản u/spring_Living4355 ghi rằng GPT-5 “thiếu đi bản sắc và linh hồn, vốn là yếu tố khác biệt giữa ChatGPT với những chatbot AI khác”. Người này mong muốn OpenAI bổ sung tùy chọn sử dụng GPT-4o cũ.

“Tôi dùng thử GPT-5 được vài ngày. Kể cả sau khi tùy chỉnh, nó vẫn không giống trước đây. Mô hình mang tính kỹ thuật, khái quát và tạo cảm giác xa cách về cảm xúc”, một tài khoản cho biết, dù bài đăng sau đó bị xóa.

Trong thời gian đầu phát hành GPT-5, OpenAI không cho phép người dùng chuyển mô hình, khiến một số người tuyên bố ngừng trả tiền cho ChatGPT.

“Khi thức dậy sáng nay, tôi thấy OpenAI xóa 8 mô hình chỉ sau một đêm. Không có thông báo hay lựa chọn nào”, người dùng u/Nipurn_1234 cho biết. Một tài khoản khác nhấn mạnh đã hủy gói thuê bao ChatGPT bởi lý do này.

Một số bài viết chỉ trích GPT-5 sau khi phát hành. Ảnh: Digit.

Trên trang gây quỹ Change.org, một nhóm người kêu gọi chữ ký để OpenAI mang trở lại GPT-4o. Họ đã thành công khi OpenAI quyết định bổ sung tùy chọn chuyển về GPT-4o, nhưng chỉ dành cho người dùng ChatGPT Plus.

Bản thân OpenAI từng bị chỉ trích bởi tích hợp quá nhiều tùy chọn mô hình, nhưng kế hoạch thay đổi khi GPT-5 không được đón nhận.

Không quá ấn tượng

Các chuyên gia trong lĩnh vực AI cũng không quá ấn tượng với GPT-5. Trả lời Bloomberg, Noah Giansiracusa, PGS lĩnh vực toán học tại Đại học Bentley (Mỹ), cho rằng dù mang đến một số cải tiến, GPT-5 vẫn “khá khiêm tốn so với mong đợi của tôi”.

Viết trên Substack, Gary Marcus, nhà khoa học nổi tiếng với những nghiên cứu về AI, nhấn mạnh GPT-5 “tiến bộ về nhiều mặt” nhưng gây thất vọng về một số chi tiết khác.

“GPT-5 vẫn chưa phải bước tiến vượt bậc mà mọi người mong đợi từ lâu”, Marcus chia sẻ. Ông lưu ý OpenAI đã đầu tư hàng tỷ USD để phát triển mô hình, chưa kể kỳ vọng cao từ người dùng và cộng đồng công nghệ sau thành công của thế hệ tiền nhiệm.

GPT-4 lần đầu ra mắt tháng 3/2023. Kể từ đó, một số đối thủ như Google, Anthropic, xAI, Meta và DeepSeek dần bắt kịp mô hình của OpenAI về độ hiệu quả, tính năng và lòng trung thành của người dùng. Do đó, GPT-5 được xem là bước ngoặt có thể củng cố vị thế, hoặc khiến OpenAI đánh mất ngôi đầu.

Theo Bloomberg, một số phản ứng tiêu cực có thể đến từ nhầm lẫn về cách hoạt động của mô hình. Khác với những phiên bản trước, GPT-5 tự động chuyển đổi mô hình phù hợp dựa trên truy vấn của người dùng

Cách tiếp cận này có thể tối ưu mức sử dụng tài nguyên máy chủ OpenAI, nhưng đồng nghĩa người dùng không phải lúc nào cũng tương tác với phiên bản tốt nhất của GPT.

Sam Altman, CEO OpenAI. Ảnh: Bloomberg.

Ví dụ, khi được yêu cầu đếm số lần xuất hiện chữ cái “b” trong từ “blueberry”, GPT-5 ban đầu chỉ trả lời “3 lần”. Tuy nhiên, khi được yêu cầu “suy nghĩ kỹ hơn”, GPT-5 sử dụng phiên bản có tính suy luận cao để đưa ra câu trả lời đúng.

Viết trên mạng xã hội X ngày 9/8, CEO Sam Altman phản hồi một số đánh giá, tuyên bố hệ thống của OpenAI gặp sự cố

“Hôm qua, tính năng chuyển đổi tự động giữa các mô hình bị hỏng và ngừng hoạt động trong một thời gian, khiến GPT-5 có vẻ ngớ ngẩn hơn rất nhiều... GPT-5 sẽ thông minh hơn kể từ hôm nay”, Altman nhấn mạnh.

CEO OpenAI cho biểts sẽ tiếp tục lắng nghe phản hồi và cải thiện hệ thống ổn định hơn.

“Như đề cập, chúng tôi dự kiến gặp một số khó khăn khi triển khai nhiều thứ cùng lúc. Nhưng mọi thứ có phần khó khăn hơn dự báo”, Altman nói thêm.

Đánh giá dựa trên cảm xúc

GPT-5 ra mắt trong bối cảnh OpenAI đối mặt nhiều thách thức. Công ty cần duy trì vị thế dẫn đầu trước sức ép cạnh tranh từ các đối thủ tại Mỹ và Trung Quốc. OpenAI cũng tìm giải pháp thu phí từ người dùng cá nhân, doanh nghiệp để bù đắp chi phí khổng lồ cho nhân lực, chip và trung tâm dữ liệu phục vụ AI.

OpenAI khơi mào xu hướng AI tạo sinh cách đây gần 3 năm khi ra mắt ChatGPT, ban đầu sử dụng mô hình GPT-3.5. Kể từ đó, công ty phát hành các hệ thống với độ tinh vi cao, gồm các mô hình tạo ảnh và mô phỏng quá trình suy luận của con người.

Khi hệ thống AI phát triển, việc đánh giá chính xác chất lượng mô hình ngày càng phức tạp. Tính đến ngày 8/8, GPT-5 dẫn đầu nhiều hạng mục trên LMArena, bảng xếp hạng chất lượng mô hình AI dựa trên đánh giá từ người dùng. Tuy nhiên với bảng đo lường ARC-AGI-2, GPT-5 xếp sau phiên bản Grok mới nhất từ xAI.

Do thiếu những đánh giá chuẩn xác, sự cạnh tranh giữa các mô hình đôi khi xoay quanh cảm xúc. Với gần 700 triệu người dùng ChatGPT mỗi tuần, ý kiến từ mỗi người lại khác nhau tùy thuộc nhu cầu cá nhân và công việc.

Theo Wired, phản ứng trên Internet dấy lên chủ đề mới về mối liên hệ tâm lý giữa người dùng với chatbot AI. Vào tháng 3, OpenAI công bố nghiên cứu về mối liên kết cảm xúc giữa người dùng với các mô hình. Ngay sau đó, công ty phải cập nhật GPT-4o vì quá “nịnh nọt”.

GPT-5 được xem là bước ngoặt của OpenAI. Ảnh: Bloomberg.

“Dường như GPT-5 ít nịnh hót, thiên về công việc và bớt buôn chuyện hơn. Cá nhân tôi nghĩ đó là điều tốt bởi đây là nguyên nhân dẫn đến ảo tưởng, củng cố định kiến...

Trớ trêu thay, nhiều người thích một mô hình luôn nói rằng họ thông minh và tuyệt vời, thậm chí khẳng định quan điểm, niềm tin kể cả khi đó là điều sai lầm”, Pattie Maes, GS tại Viện Công nghệ Massachusetts (MIT), người tham gia nghiên cứu, cho biết.

Ethan Mollick, GS Trường Wharton thuộc Đại học Pennsylvania, người thường xuyên thử nghiệm các mô hình AI, bày tỏ bất ngờ trước khả năng nghiên cứu, trả lời một cách thông minh và đơn giản hóa việc lập trình của GPT-5, kể cả với người mới bắt đầu.

“GPT-5 tự mình làm được nhiều thứ, kể cả các công việc phi thường, những việc kỳ lạ và những việc có ‘tính AI’ cao. Đó là điều khiến mô hình trở nên thú vị”, Mollick nhấn mạnh.

Dù vậy, phản ứng trên Reddit rất khác. Trong chuyên mục “Ask Me Anything” ngày 8/8, CEO Sam Altman chứng kiến sự thất vọng của người dùng khi không được lựa chọn và biết rõ mô hình đang phản hồi.

“Chúng tôi nghĩ chất lượng viết bởi phiên bản suy luận của GPT-5 tốt hơn nhiều so với GPT-4.5. Bạn có nghĩ nó tệ hơn không?”, Altman trả lời một người dùng. Bên dưới, lần lượt từng người nhanh chóng trả lời: “Có”.

Phúc Thịnh

Nguồn Znews: https://znews.vn/chuyen-gi-dang-xay-ra-voi-gpt-5-post1576262.html

Thảm họa ChatGPT-5

Ngay sau khi ra mắt, mô hình tiên tiến nhất của OpenAI bị người dùng Internet chỉ trích vì quá vô cảm, trong khi giới chuyên môn không ấn tượng như mong đợi.

TIN KHÁC

Grok của Elon Musk đấu cờ vua thua OpenAI: Kết quả này có thực sự quan trọng?

Miễn phí Grok 4 cho toàn bộ người dùng

Elon Musk dọa kiện Apple

TIN NÓNG

Các nước trên thế giới có cấm mang xe đạp điện lên tàu?

iPhone 17 Pro Max chạy hệ điều hành 'lạ' lộ diện

Nghiệm thu kỹ thuật cấp cơ sở tàu tuần tra cao tốc TT-400 chiếc số 10 của Cảnh sát biển Việt Nam

Giải mã xe tăng 'Frankenstein' của Ukraine

TPHCM đề xuất lập vành đai hạn chế xe xăng, dầu vào trung tâm từ năm 2026

Đề xuất 5 mô hình xây dựng trạm sạc xe điện ở TP.HCM

TIN MỚI

Tổng công ty Phát điện 1 tổ chức khóa đào tạo thí nghiệm máy biến áp, máy cắt, máy phát điện trong nhà máy điện

Máng cáp lưới Cát Vạn Lợi đạt UL Listed, vươn tầm quốc tế

Tập đoàn Hòa Phát khai lò thổi số 2, Dung Quất 2 đã sẵn sàng

Việt Nam có đơn hàng xuất khẩu 5.000 UAV và 100 triệu chip bán dẫn cho đối tác Hàn Quốc

Những thông tin cần biết về tài khoản giao thông và tài khoản ETC

TPHCM chờ dòng vốn tỉ đô từ trạm sạc năng lượng mặt trời

Còn hơn 1 tháng để chuyển đổi tài khoản giao thông, sau 1-10 ô tô sẽ không qua được trạm thu phí

Thị trường thiết bị điện thông minh: Chất lượng, an toàn còn thả nổi