Công nghệ AI trước cuộc đua chuyển hướng
Một kỷ nguyên mới đang đến khi các công ty AI đang chuyển hướng tập trung vào việc tinh chỉnh các mô hình hiện có và bổ sung cho chúng khả năng lập luận giống con người hơn.
Ngành trí tuệ nhân tạo (AI) đang trải qua một sự chuyển dịch mang tính nền tảng. Sau giai đoạn đẩy mạnh phát triển các mô hình ngôn ngữ lớn (LLM) ở tốc độ chưa từng có thông qua cung cấp thêm dữ liệu và tăng cường năng lực tính toán, các công ty AI hàng đầu như OpenAI đang thừa nhận những hạn chế của phương pháp “nhồi nhét nhiệt tình” này.
Thay vì chỉ đơn thuần theo đuổi các mô hình có kích thước lớn hơn, một kỷ nguyên mới đang đến - các công ty AI đang chuyển hướng tập trung vào việc tinh chỉnh các mô hình hiện có và bổ sung cho chúng khả năng lập luận giống con người hơn.
Sự chuyển dịch này có ý nghĩa sâu sắc đối với cuộc chay đua AI đang diễn ra cùng các nguồn lực thúc đẩy nó.
Mô hình "o1" mới được OpenAI công bố là minh chứng cho sự thay đổi chiến lược này. Thay vì chỉ tăng quy mô, o1 kết hợp các kỹ thuật tiên tiến như "tính toán suy luận". Phương pháp này cho phép mô hình khám phá và đánh giá nhiều giải pháp tiềm năng trước khi chọn ra con đường tối ưu, mô phỏng quá trình cân nhắc của tư duy con người.
Cách tiếp cận này tỏ ra đặc biệt hiệu quả đối với các nhiệm vụ phức tạp đòi hỏi lập luận và ra quyết định sắc bén, chẳng hạn như các bài toán hoặc đoạn mã phức tạp.
Tại hội nghị TED về AI mới đây ở San Francisco (Mỹ), nhà nghiên cứu Noam Brown của OpenAI đã nhấn mạnh tác động đáng kể của kỹ thuật này: chỉ cần 20 giây “suy luận" của mô hình đã đạt được hiệu suất tương đương với việc tăng kích thước và thời lượng huấn luyện của mô hình lên tới 100.000 lần.
Ngoài tính toán thời gian kiểm tra, o1 còn được hưởng lợi từ cách tiếp cận chọn lọc dữ liệu, kết hợp phản hồi và kiến thức chuyên môn từ các tiến sĩ và chuyên gia trong ngành. Sự kết hợp giữa đào tạo chuyên biệt và mô hình cơ sở như GPT-4 góp phần tạo nên khả năng xử lý và lập luận phức tạp của o1.
OpenAI đã báo hiệu ý định mở rộng cách tiếp cận đào tạo phân lớp này sang các mô hình cơ sở có quy mô còn lớn hơn GPT-4, cho thấy cam kết dài hạn đối với chiến lược tinh chỉnh này. Ông Kevin Weil, Giám đốc Sản phẩm của OpenAI, nhấn mạnh quyết tâm duy trì lợi thế cạnh tranh của họ và tuyên bố ý định "đi trước ba bước" trong bối cảnh ngành AI đang phát triển vũ bão.
Sự thay đổi chiến lược của OpenAI cũng phản ánh một xu hướng rộng hơn trong ngành. Theo các nguồn thạo tin, các công ty phát triển AI lớn khác như Anthropic, xAI và Google DeepMind được cho là đang theo đuổi các kỹ thuật tương tự OpenAI - đặc biệt khi những hạn chế từ cách tiếp cận mở rộng mô hình thông qua “nhồi nhét” dữ liệu và khả năng tính toán đang ngày càng rõ ràng.
Việc đào tạo những mô hình khổng lồ này là một nỗ lực tốn kém, với mỗi "lần huấn luyện" cần đến hàng trăm chip chạy đồng thời và phát sinh chi phí hàng chục triệu USD. Những hệ thống phức tạp này dễ bị lỗi phần cứng và các nhà nghiên cứu thường phải mất nhiều tháng chờ đợi vì không thể xác định hiệu suất của mô hình cho đến khi kết thúc quá trình huấn luyện kéo dài.
Một vấn đề phức tạp nữa là nhu cầu dữ liệu khổng lồ của các mô hình này đã làm cạn kiệt các bộ dữ liệu dễ tiếp cận, trong khi tình trạng thiếu điện đặt ra một ràng buộc bổ sung cho quá trình huấn luyện. Những thách thức kết hợp này đang thúc đẩy việc khám phá các kỹ thuật hiệu quả và tiết kiệm hơn như tính toán thời gian kiểm tra.
Tác động của sự thay đổi này không chỉ đối với việc phát triển mô hình mà còn ảnh hưởng đáng kể đến phần cứng. Trong khi Nvidia đang thống trị thị trường chip huấn luyện, xu hướng ngày càng chú trọng vào khả năng suy luận của AI có thể tạo cơ hội cho các đối thủ cạnh tranh. Khả năng suy luận của AI yêu cầu một loại kiến trúc chip khác và Nvidia có thể phải đối mặt với cạnh tranh gay gắt hơn trong thị trường mới nổi này.
Những dịch chuyển trên cũng đã thu hút sự chú ý của các công ty đầu tư mạo hiểm nổi tiếng như Sequoia Capital và Andreessen Horowitz, vốn đã rót hàng tỷ USD tài trợ cho các mô hình AI khác nhau. Họ đang đánh giá lại tác động của sự thay đổi này đối với các khoản đầu tư đáng kể của mình.
Bà Sonya Huang, một đối tác tại Sequoia Capital, dự đoán sẽ có sự chuyển dịch khỏi các cụm mô hình cần huấn luyện quy mô lớn sang các mô hình có khả năng suy luận và lưu trữ dữ liệu trên đám mây.
Thừa nhận tầm quan trọng ngày càng tăng của suy luận đối với các mô hình AI, Nvidia cho rằng các chip Blackwell mới nhất của họ rất phù hợp với nhu cầu đang phát triển này.
Giám đốc điều hành (CEO) của công ty, Jensen Huang đã nhấn mạnh nhu cầu đối với những con chip của họ sẽ ngày càng tăng nhờ cái mà ông gọi là "định luật thứ hai về mở rộng quy mô". Tuy nhiên, bản chất năng động của ngành AI đồng nghĩa cuộc cạnh tranh giành vị trí thống trị trong phân khúc quan trọng này còn lâu mới kết thúc.
Một mô hình AI thông minh hơn không chỉ đơn giản là có quy mô lớn hơn mà còn phải biết thích nghi, đổi mới trong môi trường luôn thay đổi nhanh chóng này./.