Sự xuất hiện gây bất ngờ của DeepSeek và ba thiên tài AI ở Trung Quốc

Trong lĩnh vực trí tuệ nhân tạo, một cuộc cạnh tranh khốc liệt đang diễn ra. Tháng 12/2024, DeepSeek, một công ty mô hình quy mô lớn Trung Quốc cho ra mắt DeepSeek-V3 đã gây chấn động trong lĩnh vực AI toàn cầu.

Lương Văn Phong (phải) được mời tham dự hội nghị xin ý kiến do Thủ tướng Lý Cường tổ chức hôm 20/1/2025. Ảnh: CCTV.

Lương Văn Phong (phải) được mời tham dự hội nghị xin ý kiến do Thủ tướng Lý Cường tổ chức hôm 20/1/2025. Ảnh: CCTV.

DeepSeek-V3 đạt được cùng mức độ chính xác như các mô hình hàng đầu như GPT-4 với mức rất chi phí đào tạo cực thấp nhưng hiệu suất tương đương đã gây sốc cho toàn ngành. Chưa đầy một tháng sau, DeepSeek lại một lần nữa gây chấn động cộng đồng trí tuệ nhân tạo (AI) toàn cầu.

Với sự ra mắt của mẫu DeepSeek-R1 mới vào ngày 27/1, ứng dụng Deepseek đã đứng đầu bảng xếp hạng tải xuống ứng dụng miễn phí trên App Store của Apple tại Trung Quốc và Mỹ, vượt qua ChatGPT trong bảng xếp hạng tải xuống tại Mỹ. Tin tức này đã thu hút sự quan tâm lớn của người dùng đối với ứng dụng mới nổi này.

Khi DeepSeek trở thành chủ đề nóng, người sáng lập ra nó, Lương Văn Phong (Liang Wenfeng), trở thành tâm điểm chú ý của thế giới bên ngoài.

 DeepSeek hôm 27/1 đứng đầu danh sách app tải xuống của Apple ở Trung Quốc và Mỹ. Ảnh: Singtao.

DeepSeek hôm 27/1 đứng đầu danh sách app tải xuống của Apple ở Trung Quốc và Mỹ. Ảnh: Singtao.

Lương Văn Phong là người sáng lập DeepSeek và Huanfang, một công ty cổ phần tư nhân định lượng hàng đầu. Phạm vi kinh doanh của ông trải dài trên các lĩnh vực tài chính và AI.

“Không thể đi sau Mỹ trong lĩnh vực AI”

Theo tư liệu công khai, Lương Văn Phong sinh năm 1985 tại làng quê Mễ Lực Lĩnh, thành phố Trạm Giang, tỉnh Quảng Đông, có bố mẹ là giáo viên tiểu học dạy ngôn ngữ. Từ nhỏ Lương Văn Phong đã là học sinh xuất sắc, luôn là học sinh đứng đầu trường, đặc biệt môn Toán với điểm số tuyệt đối. Năm 2002, Lương Văn Phong được tuyển vào Đại học Chiết Giang khi mới 17 tuổi với điểm số cao nhất, tham gia chuyên ngành kỹ thuật thông tin điện tử.

Anh tiếp tục học trong những năm tiếp theo và đã lấy được bằng thạc sĩ kỹ thuật thông tin và truyền thông vào năm 2010.

 Lương Văn Phong khi là ông chủ của Công ty Huanfang. Ảnh: Yahoo.

Lương Văn Phong khi là ông chủ của Công ty Huanfang. Ảnh: Yahoo.

Khi còn đi học, Lương Văn Phong đã phát triển mối quan tâm sâu sắc đến thị trường tài chính. Đặc biệt trong cuộc khủng hoảng tài chính toàn cầu năm 2008, anh đã dẫn dắt nhóm của mình khám phá tiềm năng ứng dụng của công nghệ máy học trong giao dịch định lượng hoàn toàn tự động. Trải nghiệm này đã đặt nền tảng vững chắc cho sự nghiệp tương lai của anh.

Sau khi tốt nghiệp, Lương Văn Phong chuyển sự chú ý của mình sang thị trường tài chính rộng lớn hơn. Năm 2013, anh và người bạn học tại Đại học Chiết Giang là Từ Tiến đồng sáng lập Công ty TNHH Quản lý Đầu tư Jacobi Hàng Châu. Hai năm sau, họ thành lập Công ty TNHH Công nghệ Huyễn Phương (Huanfang) Hàng Châu, chuyên đầu tư lượng hóa thông qua toán học và AI. Trong thời kỳ thị trường biến động năm 2015, Huanfang đã đạt được những kết quả đáng chú ý nhờ áp dụng các chiến lược định lượng tần suất cao tiên tiến.

Năm 2016 là bước ngoặt quan trọng đối với Huanfang. Năm đó, công ty đã ra mắt mô hình giao dịch dựa trên học sâu đầu tiên và đạt được sự chuyển đổi AI trong tất cả các chiến lược định lượng. Năm 2018, Huanfang chính thức xây dựng chiến lược phát triển lấy AI làm trọng tâm. Tuy nhiên, với sự mở rộng nhanh chóng của hoạt động kinh doanh, tình trạng tắc nghẽn năng lực tính toán dần xuất hiện.

Để giải quyết vấn đề thiếu hụt tài nguyên tính toán, năm 2019, Lương Văn Phong đã lãnh đạo nhóm tự phát triển nền tảng đào tạo " Firefly-1” (Đom đóm-1), với tổng vốn đầu tư gần 200 triệu NDT với 1.100 tấm GPU. Hai năm sau, khoản đầu tư vào "Firefly-2" tăng lên 1 tỷ NDT với khoảng 10.000 card đồ họa NVIDIA A100.

 Thủ tướng Trung Quốc Lý Cường trao đổi với Lương Văn Phong hôm 20/1. Ảnh: CCTV.

Thủ tướng Trung Quốc Lý Cường trao đổi với Lương Văn Phong hôm 20/1. Ảnh: CCTV.

Năm 2023, cơn sốt AI toàn cầu bùng nổ, Lương Văn Phong tuyên bố thay đổi hướng đi và bước vào lĩnh vực AI. Tháng 7 cùng năm, DeepSeek, một công ty tập trung vào nghiên cứu và phát triển các mô hình AI lớn, được thành lập. Trong một cuộc phỏng vấn trước đây với giới truyền thông, Lương Văn Phong cho rằng AI của Trung Quốc không thể luôn ở vị trí đi sau.

“Chúng ta thường nói rằng AI của Trung Quốc chậm hơn Mỹ một hoặc hai năm, nhưng khoảng cách thực sự là sự khác biệt giữa tính độc đáo và sự bắt chước. Nếu điều này không thay đổi, Trung Quốc sẽ luôn là kẻ đi sau, vì vậy một số cuộc khám phá là điều không thể tránh khỏi”, ông nói.

Vào tháng 5/2024, DeepSeek đã phát hành mô hình ngôn ngữ chuyên gia lai DeepSeek-V2. Vào tháng 12 cùng năm, DeepSeek-V3 đã được phát hành. Mô hình ngôn ngữ lớn này có hiệu suất tuyệt vời, được các đồng nghiệp ở Thung lũng Silicon ca ngợi là "sức mạnh bí ẩn từ phương Đông".

 Dương Thực Lân, ông chủ của Công ty AI Moonshot Bắc Kinh. Ảnh: Singtao

Dương Thực Lân, ông chủ của Công ty AI Moonshot Bắc Kinh. Ảnh: Singtao

Ba nhân tài kiệt xuất trong giới AI của Quảng Đông

Chiều ngày 20/1/2025, ông Lý Cường, Ủy viên Thường vụ Bộ Chính trị, Thủ tướng Quốc vụ viện Trung Quốc đã chủ trì hội nghị chuyên đề với sự tham gia của các chuyên gia, doanh nhân và đại diện các ngành giáo dục, khoa học, văn hóa, y tế và thể thao lắng nghe ý kiến, góp ý về “Báo cáo công tác Chính phủ (Dự thảo xin ý kiến)”.

Lương Văn Phong đã được mời tham dự hội thảo và thông tin này ngay lập tức được thị trường nắm bắt. Việc đưa các công ty mẫu quy mô lớn trong nước vào hội nghị chuyên đề của Thủ tướng được ngành công nghiệp hiểu là sự chú trọng khoa học và công nghệ.

Tại hội nghị này, các cư dân mạng nhận thấy rằng ngoài Lương Văn Phong, còn có hai ông lớn AI khác ở Trung Quốc cũng đến từ Quảng Đông là nhà sáng lập Kimi Dương Thực Lân đến từ Sán Đầu và nhà khoa học kiệt xuất trong lĩnh vực AI Hà Khải Minh đến từ Quảng Châu. Ba người trẻ này đã tạo thành “Quảng Đông AI tam kiệt”.

Người đầu tiên Dương Thực Lân, sinh năm 1992, tốt nghiệp ngành Khoa học Máy tính tại Đại học Thanh Hoa và có bằng Tiến sĩ Khoa học Máy tính tại Đại học Carnegie Mellon (CMU). Anh đã học dưới sự chỉ đạo của cựu giám đốc AI tại Apple và đã làm việc tại Facebook AI Research và Google Brain. Trong thời gian theo đuổi chương trình tiến sĩ, ông đã đồng xuất bản mô hình học sâu và xử lý ngôn ngữ tự nhiên XLNet với Google và Đại học Carnegie Mellon, đạt được kết quả hàng đầu thế giới trong nhiều nhiệm vụ.

Ngày 17/4/2023, Dương Thực Lân thành lập Công ty TNHH Công nghệ AI Moonshot Bắc Kinh. Vào tháng 10/2023, AI Moonshot đã công bố một bước đột phá trong lĩnh vực "văn bản dài" và ra mắt Kimi Chat, sản phẩm trợ lý thông minh đầu tiên hỗ trợ nhập 200.000 ký tự tiếng Trung. Sau khi ra mắt, nó đã thu hút sự chú ý của tất cả các bên.

Vòng gọi vốn cuối cùng của công ty là vào năm 2023, với số tiền hơn 200 triệu USD. Các nhà đầu tư bao gồm Sequoia China và Zhen Fund. Sau vòng gọi vốn này, định giá của AI Moonshot đã đạt khoảng 2,5 tỷ USD, chưa đầy một năm sau khi thành lập.

 "Thần đồng AI" Hà Khải Minh. Ảnh: Singtao.

"Thần đồng AI" Hà Khải Minh. Ảnh: Singtao.

Người thứ hai là “Thần đồng AI” Hà Khải Minh sinh 1984 ở Quảng Châu là một chuyên gia về thị giác máy tính và học sâu. Năm 2015, Hà Khải Minh và nhóm của ông đã giành giải nhất trong cuộc thi nhận dạng hình ảnh ImageNet bằng cách đánh bại các nhóm trong ngành như Google, Intel và Qualcomm với mạng lưới dư thừa sâu 152 lớp ResNet-152 của họ.

Các công nghệ như mạng lưới dư thừa sâu (ResNets) do Hà Khải Minh đề xuất đã có những đóng góp cơ bản cho sự phát triển của AI. Công nghệ này cho phép mạng lưới nơ-ron đạt đến độ sâu chưa từng có, cải thiện đáng kể độ chính xác của nhận dạng và phân loại hình ảnh.

Theo Singtao, Jimu

Thu Thủy

Nguồn VietTimes: https://viettimes.vn/su-xuat-hien-gay-bat-ngo-cua-deepseek-va-ba-thien-tai-ai-o-trung-quoc-post182309.html
Zalo