ByteDance đặt mua hơn 100.000 chip Huawei Ascend 910B với kế hoạch phát triển mô hình AI mới
ByteDance có kế hoạch phát triển một mô hình trí tuệ nhân tạo (AI) được đào tạo chủ yếu bằng chip Huawei khi lệnh hạn chế của Mỹ khiến công ty mẹ TikTok phải dùng chip nội địa, ba người quen thuộc với vấn đề này cho biết.
ByteDance đã đa dạng hóa sang các nhà cung cấp chip AI trong nước và đẩy nhanh quá trình phát triển chip của riêng mình kể từ khi Mỹ bắt đầu hạn chế xuất khẩu chip AI tiên tiến từ Nvidia, AMD và Intel sang Trung Quốc vào năm 2022
AI đã trở thành trọng tâm của ngành công nghệ với các công ty thuộc nhiều lĩnh vực khác nhau, từ game đến thương mại điện tử, phân biệt các dịch vụ thông qua việc tích hợp các mô hình AI tùy chỉnh.
Bước tiếp theo của ByteDance trong cuộc đua AI là sử dụng chip Huawei Ascend 910B để đào tạo một mô hình ngôn ngữ lớn, theo 3 nguồn tin của Reuters.
Nguồn tin thứ 4 của Reuters cho biết ByteDance đang lên kế hoạch cho một mô hình AI mới nhưng không thể nói liệu công ty Trung Quốc này có sử dụng chip Huawei hay không.
ByteDance đã sử dụng Ascend 910B chủ yếu cho các nhiệm vụ suy luận ít đòi hỏi về tính toán, tức là các mô hình AI đã được đào tạo trước để đưa ra dự đoán, theo Reuters. Đào tạo mô hình AI từ đầu đòi hỏi nhiều tài nguyên hơn và yêu cầu lượng dữ liệu khổng lồ, cần dùng đến các chip hiệu suất cao như bộ xử lý đồ họa (GPU) tiên tiến của Nvidia.
Khả năng và độ phức tạp của mô hình AI mới, được đo bằng các tham số tính toán, sẽ kém hơn so với mô hình AI hiện tại của ByteDance là Doubao, theo một trong những nguồn tin của Reuters.
ByteDance không trả lời khi được Reuters đề nghị bình luận. Michael Hughes, phát ngôn viên TikTok tại Mỹ, phát biểu thay mặt cho ByteDance: "Toàn bộ tiền đệ ở đây là sai. Không có mô hình AI mới nào đang được phát triển".
Huawei không trả lời câu hỏi của Reuters.
Nguồn cung chip Ascend 910B ít hơn mong đợi
ByteDance đã đặt mua hơn 100.000 chip Ascend 910B trong năm nay nhưng tính đến tháng 7 mới nhận được chưa đến 30.000 chip, tốc độ quá chậm để đáp ứng nhu cầu của công ty, theo nguồn tin của Reuters.
Nguồn cung ít và công suất tính toán hạn chế so với GPU Nvidia có sẵn tại Trung Quốc khiến ByteDance không thể đặt ra mốc thời gian trình làng mô hình AI mới, hai trong số những nguồn tin của Reuters cho biết.
Công nghệ AI hiện tại của ByteDance được sử dụng trong mô hình ngôn ngữ lớn hàng đầu ra mắt vào tháng 8.2023 và đổi tên thành chatbot Doubao, cũng như nhiều ứng dụng khác, gồm cả công cụ chuyển văn bản thành video Jimeng. Trong tháng 9, ByteDance đã giới thiệu hai mô hình Doubao tập trung vào video để cạnh tranh với OpenAI.
Việc sử dụng các ứng dụng như vậy tăng vọt kể từ đầu năm nay, với chatbot Doubao trở thành một trong những ứng dụng phổ biến nhất Trung Quốc khi có hơn 10 triệu người dùng hoạt động hàng tháng.
Sự chú trọng ngày càng tăng vào AI đã khiến ByteDance trở thành một trong những hãng mua chip AI Huawei nhiều nhất. ByteDance cũng là hãng mua GPU Nvidia H20 nhiều nhất. Đây là chip AI mà Nvidia thiết kế riêng cho thị trường Trung Quốc để ứng phó với các hạn chế xuất khẩu từ Mỹ, hai nguồn tin cho biết.
ByteDance cũng là khách hàng lớn nhất của Microsoft tại châu Á cho các GPU Nvidia có thể truy cập thông qua điện toán đám mây, theo hai nguồn tin riêng biệt. Microsoft không trả lời câu hỏi của Reuters.
Reuters trước đây đưa tin ByteDance đã phân bổ 2 tỉ USD cho chip AI Nvidia vào năm ngoái. Nvidia từ chối bình luận.
ByteDance hợp tác với Broadcom để phát triển chip AI tiên tiến
ByteDance đang hợp tác với Broadcom (nhà thiết kế chip nổi tiếng của Mỹ) để phát triển bộ xử lý AI tiên tiến, hai nguồn tin thân cận về vấn đề này tiết lộ cho Reuters.
Động thái đó sẽ ByteDance giúp đảm bảo nguồn cung cấp chip AI cao cấp đầy đủ trong bối cảnh căng thẳng giữa Mỹ và Trung Quốc.
Được ByteDance và Broadcom hợp tác phát triển, chip 5 nanomet này - sản phẩm tùy chỉnh được gọi là chip tích hợp dành cho ứng dụng (ASIC) - sẽ tuân thủ các hạn chế xuất khẩu của Mỹ và việc sản xuất sẽ do TSMC (Đài Loan) thực hiện, các nguồn tin Reuters cho biết thêm. TSMC là hãng sản xuất chip theo hợp đồng lớn nhất thế giới.
Chưa có sự hợp tác phát triển chip nào được công bố công khai giữa các công ty Trung Quốc và Mỹ liên quan đến công nghệ 5 nanomet trở lên kể từ khi chính quyền Biden đưa ra các biện pháp kiểm soát xuất khẩu với chất bán dẫn tiên tiến vào năm 2022. Các thỏa thuận Mỹ - Trung trong lĩnh vực này thường liên quan đến công nghệ ít phức tạp hơn nhiều.
Các nguồn tin giấu tên cho biết sự hợp tác với Broadcom sẽ ByteDance giúp cắt giảm chi phí mua sắm và đảm bảo nguồn cung cấp chip AI cao cấp ổn định hơn.
Tuy nhiên, TSMC dự kiến sẽ không bắt đầu sản xuất chip mới này trong năm 2024. Dù công việc thiết kế chip đang được tiến hành tốt nhưng tapeout (quá trình đánh dấu sự kết thúc của giai đoạn thiết kế và bắt đầu sản xuất) vẫn chưa bắt đầu.
ByteDance và Broadcom không trả lời các câu hỏi tìm kiếm bình luận của Reuters. TSMC từ chối bình luận.
Giống như nhiều hãng công nghệ toàn cầu, ByteDance đã phát động nỗ lực lớn trong lĩnh vực AI nhưng chủ sở hữu TikTok và các công ty cùng ngành ở Trung Quốc phải đối mặt với nguồn cung chip AI hạn chế hơn nhiều so với các đối tác nước ngoài.
Chip AI Nvidia tiên tiến nhất nằm ngoài tầm với của ByteDance do các biện kiểm soát xuất khẩu từ Mỹ nhằm cản trở những đột phá trong lĩnh vực AI và siêu máy tính của quân đội Trung Quốc
Sự cạnh tranh để có các chip AI Mỹ được phát triển riêng cho thị trường Trung Quốc cũng như chip AI từ Huawei đang rất khốc liệt. Huawei là một trong số ít nhà sản xuất bộ tăng tốc AI của Trung Quốc.
Broadcom cho biết trong các tuyên bố công khai rằng họ và ByteDance đã là đối tác kinh doanh ít nhất từ năm 2022. Công ty Trung Quốc đã mua chip chuyển đổi hiệu suất cao Tomahawk 5nm từ Broadcom cũng như bộ chuyển mạch Bailly cho cụm máy tính AI của họ.
Ngoài TikTok và Douyin (phiên bản tiếng Trung của TikTok), ByteDance còn vận hành nhiều ứng dụng phổ biến, gồm cả dịch vụ chatbot giống ChatGPT mang tên Doubao có 26 triệu người dùng.
Để hỗ trợ việc thúc đẩy AI của mình, ByteDance đã dự trữ chip AI Nvidia, theo một nguồn tin Reuters được thông báo về vấn đề này, gồm chip A100 và H100 có sẵn trước khi vòng trừng phạt đầu tiên của Mỹ có hiệu lực, cũng như chip A800 và H800 mà Nvidia sản xuất riêng cho thị trường Trung Quốc nhưng sau đó cũng bị hạn chế.
Hiện công ty mẹ TikTok tuyển dụng hàng trăm việc làm liên quan đến chất bán dẫn, trong đó có 15 vị trí dành cho nhà thiết kế chip ASIC, theo trang web của công ty.
Ngoài ra, ByteDance đang săn lùng những nhân viên hàng đầu từ các công ty chip AI Trung Quốc khác, một trong những nguồn tin của Reuters tiết lộ.
Huawei gửi mẫu chip Ascend 910C để cạnh tranh với Nvidia
Huawei đã bắt đầu thử nghiệm chip AI mới với khách hàng tiềm năng tại Trung Quốc khi các công ty tìm kiếm giải pháp thay thế cho GPU Nvidia cao cấp. Qua đó, Huawei tiến gần đến một bước đột phá khác trong nỗ lực tự cung tự cấp chất bán dẫn của Trung Quốc bất chấp các hạn chế từ Mỹ.
Huawei đã cung cấp các mẫu chip Ascend 910C của mình cho những công ty máy chủ lớn ở Trung Quốc để thử nghiệm phần cứng và cấu hình, theo hai nguồn tin được thông báo về vấn đề này. Theo một nguồn tin, nhà phân phối Ascend 910C, phiên bản nâng cấp của Ascend 910B, đang cung cấp chip AI mới này cho các công ty internet lớn Trung Quốc, vốn cũng là khách hàng lớn của Nvidia. Huawei không trả lời ngay lập tức khi được trang SCMP đề nghị bình luận.
Huawei đã chạy đua để lấp đầy khoảng trống mà Nvidia để lại sau khi Mỹ cấm hãng thiết kế chip có trụ sở tại bang California này vận chuyển các GPU tinh vi nhất của mình đến Trung Quốc. Ascend 910B, được Huawei gọi là ngang bằng chip Nvidia A100 phổ biến, đã trở thành giải pháp thay thế hàng đầu trong nhiều ngành công nghiệp trên khắp cả nước Trung Quốc. Theo Huawei, các chip Ascend đã được sử dụng để đào tạo khoảng một nửa trong số hơn 70 mô hình ngôn ngữ lớn hàng đầu Trung Quốc tính đến năm ngoái.
Huawei bảo mật chặt chẽ tiến trình phát triển chip của mình, nhưng rõ ràng gã khổng lồ công nghệ Trung Quốc đang xây dựng một hệ thống hỗ trợ cho ngành công nghiệp AI trong nước. Eric Xu Zhijun, Chủ tịch luân phiên của Huawei, cho biết công ty đã xây dựng hai doanh nghiệp điện toán trong năm năm qua để tạo ra một lựa chọn khác có thể đáp ứng nhu cầu về cơ sở hạ tầng AI của các hãng khác.
"Thực tế là các hạn chế của Mỹ với chip AI với Trung Quốc khó có thể được dỡ bỏ trong thời gian tới", Eric Xu Zhijun nói. Tuy nhiên, ông lưu ý rằng điều này đã tạo ra cơ hội cho công ty cung cấp tài nguyên điện toán thông qua hoạt động dịch vụ đám mây của mình.
Nguồn tin làm việc với một công ty máy chủ cho biết Huawei thường đóng gói các giải pháp của mình. "Nếu mua chip AI Huawei thì chúng tôi phải mua những thứ khác từ Huawei, chẳng hạn các giải pháp mạng và lưu trữ của họ, điều này khiến một số người do dự", người này cho biết. Hầu hết chip AI của Huawei trên thị trường vẫn là Ascend 910B, theo SCMP.
Nvidia là một trong những hãng công nghệ nổi bật nhất chịu gánh nặng từ các lệnh trừng phạt ngày càng nghiêm ngặt từ Mỹ để ngăn Trung Quốc tiếp cận chất bán dẫn tiên tiến. Trung Quốc là thị trường lớn thứ ba của Nvidia trong năm tài chính kết thúc vào ngày 28.1.
Nvidia lần đầu tiên bị cấm bán GPU A100 và H100, hai trong số những chip có nhu cầu cao nhất để đào tạo và chạy các mô hình AI, cho các khách hàng ở Trung Quốc vào tháng 8.2022. Sau đó, Nvidia đã sửa đổi hai GPU đó, tạo ra A800 và H800 để vượt qua những hạn chế đó, nhưng chúng lại bị Mỹ cấm xuất khẩu sang Trung Quốc vào tháng 10.2023.
Trò chơi mèo vờn chuột này vẫn tiếp diễn dù bị Bộ trưởng Thương mại Mỹ - Gina Raimondo lên án. Nvidia kể từ đó đã phát triển GPU H20, L20 và L2 trong nỗ lực duy trì thị phần của mình tại Trung Quốc.
Nhu cầu về Nvidia H20 ban đầu khá ảm đạm, nhưng doanh số đã tăng đều đặn những tháng gần đây. Việc sử dụng chip tuân thủ quy định từ Mỹ là quan trọng với các nhà cung cấp dịch vụ đám mây lớn Trung Quốc vì cho phép họ tiếp cận các dịch vụ bảo trì và hỗ trợ kỹ thuật từ Nvidia.
Nvidia dự kiến sẽ cung cấp hơn 1 triệu GPU H20 tại Trung Quốc trong năm 2024, đạt doanh số 12 tỉ USD.