Những lý do thực sự đằng sau cơn sốt DeepSeek
DeepSeek đã khiến thế giới công nghệ đảo lộn hoàn toàn vào tháng trước. Theo các chuyên gia trí tuệ nhân tạo (AI), thế giới có thể chỉ mới thấy được khởi đầu của ảnh hưởng mà công ty khởi nghiệp công nghệ Trung Quốc này sẽ mang lại cho lĩnh vực AI.

DeepSeek đã gây chấn động làng AI thế giới. Ảnh: AFP/TTXVN
Theo kênh CNN ngày 14/2, DeepSeek đã thu hút chú ý vào cuối tháng 1 với mô hình AI R1 mà công ty này cho rằng có thể tương đương với hiệu suất của mô hình o1 của OpenAI nhưng với chi phí chỉ bằng một phần nhỏ. Cổ phiếu công nghệ đã giảm mạnh khi DeepSeek tạm thời vượt qua ChatGPT để trở thành ứng dụng hàng đầu trên App Store của Apple.
Thành tựu này đã khiến các “ông lớn” công nghệ Mỹ phải đặt câu hỏi về vị thế của nước Mỹ trong cuộc đua AI với Trung Quốc cũng như đặt câu hỏi về hàng tỷ đô la đã đầu tư vào các nỗ lực đó. Mặc dù Phó Tổng thống JD Vance không nhắc đến tên DeepSeek hay Trung Quốc trong bài phát biểu tại Hội nghị Thúc đẩy Hành động Trí tuệ Nhân tạo ở Paris vào ngày 11/2, nhưng ông đã nhấn mạnh tầm quan trọng của việc Mỹ dẫn đầu trong lĩnh vực này.
Ông nói: “Mỹ là nước dẫn đầu trong lĩnh vực AI và chính quyền của chúng tôi dự định giữ vị trí đó”. Ông cũng cho biết rằng Mỹ muốn hợp tác với các quốc gia khác.
Nhưng câu chuyện không chỉ liên quan hiệu suất và sức mạnh của DeepSeek. Theo các chuyên gia, cách mà DeepSeek R1 có thể suy luận và “tư duy” qua các câu trả lời để cung cấp kết quả chất lượng, cùng với quyết định của công ty này khi công khai các phần công nghệ chủ chốt, cũng sẽ thúc đẩy lĩnh vực này tiến xa.
Mặc dù AI đã được sử dụng từ lâu trong các sản phẩm công nghệ, nhưng AI đã đạt đến đỉnh điểm trong hai năm qua nhờ sự trỗi dậy của ChatGPT và các dịch vụ AI tạo sinh khác. Đây là những thứ đã thay đổi cách thức làm việc, giao tiếp và tìm kiếm thông tin của con người. ChatGPT và các dịch vụ AI tạo sinh đã biến những công ty như nhà sản xuất chip Nvidia thành công ty được yêu thích trên Phố Wall và làm đảo lộn hướng đi của các tập đoàn lớn tại Thung lũng Silicon. Vì vậy, bất kỳ phát triển nào có thể giúp xây dựng các mô hình mạnh mẽ và hiệu quả hơn chắc chắn sẽ được theo dõi sát sao.
Ông Oren Etzioni, cựu Giám đốc điều hành của Viện Trí tuệ Nhân tạo Allen, bình luận: “Chắc chắn đây không phải là cơn sốt thoáng qua. Nhưng đồng thời, đây cũng là một thế giới chuyển động rất nhanh”.
"Khoảnh khắc TikTok" của AI
Các nhà lãnh đạo công nghệ đã nhanh chóng phản ứng trước sự xuất hiện của DeepSeek. Tổng giám đốc Google DeepMind, ông Demis Hassabis, cho rằng cơn sốt xung quanh DeepSeek là “quá mức”, nhưng cũng nói rằng mô hình của họ có lẽ là công trình tốt nhất mà ông từng thấy xuất hiện từ Trung Quốc.
Giám đốc điều hành Microsoft, ông Satya Nadella, bình luận rằng DeepSeek có một số đổi mới thực sự, trong khi Giám đốc điều hành Apple, ông Tim Cook, đã nói rằng đổi mới thúc đẩy hiệu quả là một điều tốt.
Tuy nhiên, sự chú ý không hoàn toàn tích cực. Nhà nghiên cứu bán dẫn SemiAnalysis đã nghi ngờ tuyên bố của DeepSeek rằng chỉ mất 5,6 triệu USD để huấn luyện mô hình. OpenAI nói với tờ The Financial Times rằng họ tìm thấy bằng chứng cho thấy DeepSeek đã sử dụng các mô hình của mình để huấn luyện DeepSeek.
Một người phát ngôn của OpenAI tuyên bố: “Chúng tôi đã biết và đang xem xét các dấu hiệu cho thấy DeepSeek có thể đã trích xuất các mô hình của chúng tôi một cách không phù hợp và sẽ chia sẻ thông tin khi có thêm dữ liệu”.
Hai nghị sĩ Mỹ đã kêu gọi cấm ứng dụng này trên các thiết bị của chính phủ sau khi các nhà nghiên cứu bảo mật nêu ra mối liên hệ tiềm ẩn với chính phủ Trung Quốc. Những lo ngại tương tự cũng đã được đưa ra về ứng dụng mạng xã hội TikTok nổi tiếng. TikTok phải được bán cho một chủ sở hữu Mỹ nếu không sẽ có nguy cơ bị cấm tại Mỹ. Ông Etzioni nói: “DeepSeek không khác gì TikTok của các mô hình ngôn ngữ lớn”.
Ấn tượng sâu sắc của DeepSeek đối với thế giới công nghệ
Các “ông lớn” trong ngành công nghệ đã và đang suy nghĩ về cách mà công nghệ của DeepSeek có thể ảnh hưởng đến sản phẩm và dịch vụ của mình.
Ông Lewis Tunstall, nhà nghiên cứu cao cấp tại Hugging Face - một nền tảng AI cung cấp công cụ cho các nhà phát triển, cho biết: “Những gì DeepSeek mang lại cho chúng ta về cơ bản là công thức dưới dạng một báo cáo kỹ thuật, nhưng họ không cung cấp cho chúng ta những phần bổ sung còn thiếu”.
Ông Tunstall đang chỉ đạo thực hiện nỗ lực nhằm hoàn toàn mở mã nguồn cho mô hình R1 của DeepSeek. Mặc dù DeepSeek cung cấp một bài báo nghiên cứu và các tham số của mô hình này, nhưng họ không tiết lộ mã nguồn hoặc dữ liệu huấn luyện.
Theo ông Nadella, các máy tính để bàn Windows Copilot+ hoặc các máy tính được xây dựng theo tiêu chuẩn nhất định để hỗ trợ các mô hình AI sẽ có khả năng chạy các mô hình AI được trích xuất từ DeepSeek R1 cục bộ.
Ngày 11/2, nhà sản xuất chip di động Qualcomm cho biết rằng các mô hình được trích xuất từ DeepSeek R1 đã chạy trên các điện thoại thông minh và máy tính để bàn sử dụng chip của họ chỉ trong vòng một tuần.
Các nhà nghiên cứu AI, học giả và nhà phát triển vẫn đang khám phá ý nghĩa của DeepSeek đối với sự phát triển của AI.
Mô hình của DeepSeek không phải là mô hình mã nguồn mở duy nhất, cũng như không phải là mô hình đầu tiên có khả năng suy luận qua các câu trả lời trước khi phản hồi. Mô hình o1 của OpenAI từ năm 2024 cũng có thể làm được điều đó.
Điều làm cho DeepSeek trở nên đáng chú ý là cách mô hình này có thể suy luận và học hỏi từ các mô hình khác, cùng với thực tế rằng cộng đồng AI có thể nhìn thấy những gì đang diễn ra phía sau. Những người sử dụng mô hình R1 trong ứng dụng của DeepSeek cũng có thể thấy được quá trình “suy nghĩ” của ứng dụng này khi trả lời câu hỏi.
Ông Durga Malladi, Phó chủ tịch cấp cao kiêm tổng giám đốc phụ trách hoạch định công nghệ và giải pháp cạnh tại Qualcomm, bình luận: “Bạn có thể nhìn thấy những bánh xe quay bên trong cỗ máy”.
Ông Tunstall cho rằng chúng ta có thể sẽ chứng kiến một làn sóng các mô hình mới có khả năng suy luận giống DeepSeek trong tương lai không xa. Điều đó có thể quan trọng khi các tập đoàn công nghệ đua nhau xây dựng các nhân viên AI, thứ mà Thung lũng Silicon nhìn nhận là sự tiến hóa tiếp theo của chatbot. Chúng ta cũng có thể sẽ chứng kiến cách người tiêu dùng sẽ tương tác với các thiết bị như thế nào.
Grok 3, phiên bản tiếp theo của chatbot trên nền tảng mạng xã hội X, sẽ có khả năng suy luận rất mạnh mẽ, theo lời chủ sở hữu là tỷ phú Elon Musk. Ông Musk tiết lộ thông tin trên ngày 13/2 trong một video xuất hiện tại Hội nghị Thượng đỉnh Chính phủ Thế giới.
Hiện tại, cộng đồng AI sẽ tiếp tục điều chỉnh và nghiên cứu những gì DeepSeek mang lại. Điều đó sẽ diễn ra cho đến khi có bước đột phá tiếp theo xuất hiện.
Ông Etzioni nói: “Tôi dự đoán chắc chắn rằng trong vòng 12 tháng tới, DeepSeek sẽ bị thay thế bởi một thứ gì đó khác. Nhưng đây là một tiến bộ rất thật”.