CEO DeepSeek từ 'chú heo con tầm thường' đến người tiên phong cuộc cách mạng AI của Trung Quốc
Năm 2022, dưới bút danh 'một chú heo con tầm thường', Liang Wenfeng (nhà sáng lập kiêm giám đốc điều hành công ty khởi nghiệp trí tuệ nhân tạo DeepSeek) đã âm thầm quyên góp 138 triệu nhân dân tệ (19 triệu USD) cho các tổ chức từ thiện ở Trung Quốc.
Được cho là lấy cảm hứng từ truyện ngắn "Chú heo nổi loạn" mang phong cách hài hước đen tối của tác giả Wang Xiaobo, bút danh này nhằm che giấu danh tính thực sự của Liang Wenfeng, khi đó chịu áp lực ngày càng lớn từ cơ quan quản lý do hoạt động giao dịch lượng tử của mình.
Ngày 28.1.2022, quỹ đầu cơ High-Flyer của Liang Wenfeng đã đưa ra một tuyên bố phủ nhận rằng giao dịch lượng tử của họ là nguyên nhân gây ra sự lao dốc với thị trường chứng khoán Trung Quốc.
"Gần đây, có tin đồn rằng việc bán tháo phối hợp của các tổ chức giao dịch lượng tử đã dẫn đến sự lao dốc của thị trường. Chúng tôi đã thảo luận với nhà quản lý của các công ty lớn trong ngành và tất cả đều phủ nhận điều đó. Xin đừng tin vào tin đồn, cảm ơn", High-Flyer cho biết.
Ba năm sau, DeepSeek (công ty con tách ra từ High-Flyer) đã trở thành tiêu điểm khi thực sự gây ra biến động thị trường chứng khoán Mỹ. Ngày 27.1.2025, một đợt bán tháo lớn đã xóa sổ gần 1.000 tỉ USD giá trị cổ phiếu công nghệ, trong đó riêng Nvidia mất gần 600 tỉ USD.
Nguyên nhân là do DeepSeek phát hành mô hình suy luận R1, chỉ vài tuần sau khi ra mắt mô hình ngôn ngữ lớn V3 truyền thống hơn. R1 và V3 (đều là nguồn mở) có thể cạnh tranh với mô hình AI của OpenAI nhưng được đào tạo với chi phí thấp hơn nhiều, khiến các giả định về mức định giá trị cao cho nhiều công ty chip và AI Mỹ bị lung lay.
Marc Andreessen, nhà đầu tư mạo hiểm nổi tiếng ở Thung lũng Silicon (Mỹ), ca ngợi R1 như một "khoảnh khắc Sputnik của AI", ám chỉ việc Liên Xô phóng vệ tinh đầu tiên vào không gian, khởi động cuộc đua với Mỹ.
Nhà phân tích Peter Milliken của Deutsche Bank (Đức) thậm chí còn tuyên bố "đây giống khoảnh khắc Sputnik của Trung Quốc hơn", phản ánh sức mạnh tổng thể của đất nước trong đổi mới và phát triển AI.
Báo chí Trung Quốc vô cùng phấn khích. Hãng thông tấn Tân Hoa Xã cho biết DeepSeek "được kỳ vọng sẽ tạo ra một làn sóng đổi mới AI tiếp theo", đẩy nhanh quá trình xây dựng một hệ sinh thái công nghiệp tự chủ và có thể kiểm soát.
Tờ Science and Technology Daily, thuộc Bộ Khoa học Trung Quốc, tuyên bố bước đột phá của DeepSeek đã thách thức "sự thống trị điện toán của phương Tây". "DeepSeek giống như một luồng ánh sáng mạnh mẽ xuyên qua màn sương mù dày đặc", theo tờ báo này.
Rao Yi, nhà khoa học nổi tiếng về sự sống của Trung Quốc, gọi DeepSeek là phát minh vĩ đại nhất Trung Quốc kể từ sau Chiến tranh Nha phiến những năm 1840. Một giám đốc công nghệ thậm chí tuyên bố trong bài đăng được lan truyền rộng rãi trên mạng xã hội rằng DeepSeek có thể thay đổi vận mệnh quốc gia của Trung Quốc.
DeepSeek và thế cờ AI Trung - Mỹ
Bước đột phá của DeepSeek diễn ra trong bối cảnh Trung Quốc bị Mỹ dồn vào chân tường trong cuộc đua AI kể từ khi OpenAI ra mắt ChatGPT vào cuối năm 2022. Mỹ đã thắt chặt kiểm soát xuất khẩu với các chip tiên tiến sang Trung Quốc, đặc biệt là GPU của Nvidia, vốn đóng vai trò quan trọng trong việc huấn luyện các mô hình AI. Điều này khiến Trung Quốc bị tước đi những vũ khí mạnh nhất trong cuộc chiến công nghệ. Các hãng AI Trung Quốc lại gặp bất lợi do thị trường vốn nhỏ hơn, không thể cạnh tranh với mức chi tiêu khổng lồ của những công ty Mỹ.
Với lợi thế đi trước về AI và gần như độc quyền về chip tiên tiến, Mỹ đã trở thành đối thủ mạnh nhất trong ngành. Trước Trung Quốc, Mỹ tỏ rõ sự cứng rắn. Trong bối cảnh bất ổn về quy định, OpenAI đã chặn truy cập ChatGPT tại Trung Quốc với lý do chưa rõ ràng. Mùa hè năm ngoái, OpenAI đã bịt lỗ hổng cho phép người Trung Quốc sử dụng giao diện lập trình ứng dụng (API) nếu không có mạng riêng ảo (VPN), chặn toàn bộ địa chỉ IP từ Trung Quốc.
Tuy nhiên, mô hình mã nguồn mở R1 đã thay đổi hoàn toàn câu chuyện, phá vỡ quan niệm rằng phải cần một lượng tiền khổng lồ mới có thể dẫn đầu trong AI.
Nhiều quan chức cấp cao Trung Quốc, gồm cả ông Hoàng Khôn Minh (Bí thư tỉnh ủy Quảng Đông), đã lên tiếng bày tỏ niềm tự hào trước thành tựu này. Điều đó giúp xóa tan cảm giác tự ti và nghi ngờ bản thân của nhiều người Trung Quốc vốn đã tồn tại kể từ khi ChatGPT ra mắt. Những lợi thế truyền thống của Trung Quốc trong lĩnh vực AI, chẳng hạn lượng dữ liệu khổng lồ, bỗng chốc trở nên không còn quá quan trọng.
Giờ đây, chính Sam Altman (Giám đốc điều hành OpenAI) mới là người phải tự suy ngẫm. Ông thừa nhận rằng OpenAI có thể đang ở "phía sai của lịch sử" khi bám vào các mô hình độc quyền, đồng thời thừa nhận sự tiến bộ của các mô hình mã nguồn mở. Sam Altman nói rằng OpenAI cần một "chiến lược mã nguồn mở khác", nhưng điều này chưa phải ưu tiên hàng đầu.
Dù OpenAI tuyên bố có bằng chứng rằng DeepSeek đã sử dụng quy trình distillation (chưng cất) để huấn luyện mô hình của mình dựa trên dữ liệu công ty Mỹ mà không có sự cho phép, Sam Altman vẫn không có kế hoạch khởi kiện. Điều đó khiến những nghi ngờ về DeepSeek nhanh chóng tan biến.
![Liang Wenfeng, nhà sáng lập kiêm giám đốc điều hành DeepSeek và High-Flyer, được xem là người hùng ở Trung Quốc - Ảnh: SCMP](https://photo-baomoi.bmcdn.me/w500_r1/2025_02_08_287_51429479/9e56c424fe6a17344e7b.jpg)
Liang Wenfeng, nhà sáng lập kiêm giám đốc điều hành DeepSeek và High-Flyer, được xem là người hùng ở Trung Quốc - Ảnh: SCMP
Nhà phân tích Tilly Zhang của công ty tài chính Gavekal nhận định DeepSeek cho thấy các công ty Trung Quốc đang đạt được tiến bộ đáng kinh ngạc trong đổi mới phần mềm, giúp giảm thiểu tác động của các hạn chế xuất khẩu phần cứng từ Mỹ.
"Cuộc đua giành quyền thống trị AI giờ đây không còn chỉ là về việc ai có chip mạnh nhất, mà là về việc ai sử dụng chúng hiệu quả nhất", Tilly Zhang kết luận.
Trong nước, sức ảnh hưởng của DeepSeek đã tăng vọt, biến thứ mà một số người từng gọi là "dự án phụ" kém tiếng của quỹ đầu cơ High-Flyer thành niềm tự hào dân tộc và biểu tượng sức mạnh công nghệ. DeepSeek đã nhanh chóng trở thành trung tâm của ngành AI hỗn loạn tại Trung Quốc, thu hút sự chú ý từ các ông lớn trong lĩnh vực phát triển GPU đến các nhà cung cấp dịch vụ đám mây.
Các nhà phát triển chip và nhà cung cấp hạ tầng AI Trung Quốc, gồm cả Moore Threads và Iluvatar Corex, đã gấp rút điều chỉnh phần cứng của họ để vận hành mô hình DeepSeek, với hy vọng công ty khởi nghiệp này có thể dẫn đầu việc tạo ra một chuỗi AI hoàn toàn tự chủ.
Chẳng hạn, Gitee AI (nền tảng và dịch vụ AI trọn gói tại thành phố Thâm Quyến) cho biết đang cung cấp bốn mô hình dựa trên R1 thông qua các máy chủ sử dụng GPU từ MetaX, công ty thiết kế chip có trụ sở tại Thượng Hải.
Gitee AI còn tuyên bố rằng "hiện thực hóa việc sử dụng hoàn toàn các công nghệ do Trung Quốc tự phát triển và sản xuất, từ chip, nền tảng, sức mạnh tính toán đến mô hình AI".
Kín tiếng giữa ánh hào quang
Giữa vô số sự quan tâm từ công chúng, DeepSeek vẫn duy trì phong cách khiêm tốn và kín tiếng.
Văn phòng của DeepSeek, nằm trong một tòa nhà thương mại ở trung tâm thành phố Hàng Châu (Trung Quốc), đã trở thành "thánh địa" cho các nhà báo công nghệ và những người tìm kiếm việc làm.
Trong khi đó, quê hương của Liang Wenfeng ở thành phố cảng Trạm Giang, tỉnh Quảng Đông đã chào đón nhà sáng lập kiêm giám đốc điều hành DeepSeek như người hùng khi ông trở về vào dịp Tết Nguyên đán. Tuy nhiên, DeepSeek vẫn tránh quảng bá bản thân, giữ im lặng trước nhiều tin đồn và thậm chí cả những thành tựu của chính mình.
Trong cuộc phỏng vấn với trang tin công nghệ 36Kr (Trung Quốc) sau khi ra mắt mô hình V2 vào tháng 5,2024, Liang Wenfeng bày tỏ sự thất vọng khi thấy các công ty Trung Quốc ngại tiến hành nghiên cứu đột phá. "Trung Quốc phải là nước đóng góp cho đổi mới toàn cầu, chứ không thể mãi đi nhờ miễn phí", ông nói.
Liang Wenfeng nhấn mạnh rằng đổi mới phải xuất phát từ sự tò mò và khát khao sáng tạo, chứ không chỉ đơn thuần là đáp ứng nhu cầu kinh doanh.
Trong một bài viết lan truyền rộng rãi về Liang Wenfeng và DeepSeek, công ty khởi nghiệp này được mô tả như "trường hợp của chủ nghĩa lý tưởng công nghệ", với nhà sáng lập có tầm nhìn rõ ràng về việc thay đổi thế giới thông qua đổi mới.
Từ chỗ bị coi là "chú heo con tầm thường", giờ đây nhiều ánh mắt đổ dồn về Liang Wenfeng, khi ông chính thức trở thành nhân vật tiên phong trong cuộc cách mạng AI của Trung Quốc.