Meta thử nghiệm chip đào tạo AI tự thiết kế đầu tiên để giảm phụ thuộc Nvidia
Meta Platforms đang thử nghiệm chip tự thiết kế đầu tiên để đào tạo các hệ thống trí tuệ nhân tạo (AI).
Đây là cột mốc quan trọng khi công ty mẹ Facebook hướng tới việc tự thiết kế nhiều chip tùy chỉnh hơn và giảm sự phụ thuộc vào nhà cung cấp bên ngoài như Nvidia, theo hai nguồn tin của Reuters.
Meta Platforms, công ty truyền thông xã hội lớn nhất thế giới, đã bắt đầu triển khai thử nghiệm chip này trên quy mô nhỏ và dự định mở rộng sản xuất để sử dụng rộng rãi nếu thử nghiệm thành công, các nguồn tin cho biết.
Nỗ lực phát triển chip nội bộ là một phần trong kế hoạch dài hạn của Meta Platforms nhằm giảm chi phí cơ sở hạ tầng khổng lồ, trong bối cảnh công ty đang đặt cược lớn vào các công cụ AI để thúc đẩy tăng trưởng.
Meta Platforms, chủ sở hữu của Facebook, Instagram và WhatsApp, dự đoán tổng chi phí năm 2025 sẽ vào khoảng 114 đến 119 tỉ USD, gồm cả 65 tỉ USD chi phí vốn chủ yếu do chi tiêu cho cơ sở hạ tầng AI.
Một nguồn tin cho biết chip đào tạo AI mới của Meta Platforms là bộ tăng tốc chuyên dụng, tức được thiết kế để xử lý các tác vụ cụ thể về AI. Điều này có thể giúp nó tiết kiệm năng lượng hơn so với các bộ xử lý đồ họa (GPU) tích hợp thường được sử dụng cho các tác vụ AI.
Meta Platforms đang hợp tác với TSMC để sản xuất chip này, nguồn tin này cho biết. TSMC là hãng sản xuất chip theo hợp đồng số 1 thế giới, có trụ sở ở Đài Loan.
Việc triển khai thử nghiệm bắt đầu sau khi Meta Platforms hoàn thành tape-out đầu tiên của chip. Tape-out là dấu mốc quan trọng trong quá trình phát triển chip, liên quan đến việc gửi thiết kế ban đầu đến một nhà máy sản xuất chip.
Một quy trình tape-out thông thường tốn hàng chục triệu USD và mất khoảng ba đến sáu tháng để hoàn thành, nhưng không có gì đảm bảo rằng thử nghiệm sẽ thành công. Nếu thất bại, Meta Platforms sẽ phải chẩn đoán vấn đề và lặp lại bước tape-out.
Meta Platforms và TSMC từ chối bình luận.
Chip này là sản phẩm mới nhất trong loạt chip Meta Training and Inference Accelerator (MTIA) của công ty. Chương trình này đã có khởi đầu chông chênh trong nhiều năm và từng hủy bỏ một chip ở giai đoạn phát triển tương tự.
Song năm ngoái, Meta Platforms bắt đầu sử dụng chip MTIA để thực hiện suy luận cho các hệ thống đề xuất quyết định nội dung hiển thị trên bảng tin Facebook và Instagram.
Suy luận là quá trình sử dụng mô hình AI đã được đào tạo để đưa ra dự đoán hoặc quyết định dựa trên dữ liệu mới. Ví dụ, khi bạn tương tác với một chatbot AI, hệ thống sẽ sử dụng quá trình suy luận để đưa ra phản hồi phù hợp.
Các lãnh đạo Meta Platforms muốn bắt đầu sử dụng chip tự thiết kế vào năm 2026 để đào tạo AI. Đây là quá trình tính toán chuyên sâu liên quan đến việc cung cấp lượng lớn dữ liệu cho hệ thống AI để "dạy" nó cách thực hiện các tác vụ.
Giống như chip suy luận, mục tiêu của chip đào tạo là bắt đầu với các hệ thống đề xuất và sau đó sử dụng nó cho sản phẩm AI tạo sinh như chatbot Meta AI, theo các lãnh đạo công ty.
"Chúng tôi đang nghiên cứu cách thực hiện đào tạo cho hệ thống đề xuất, sau đó là cách đào tạo và suy luận cho AI tạo sinh", Chris Cox, Giám đốc Sản phẩm của Meta Platforms, nói tại hội nghị công nghệ, truyền thông và viễn thông Morgan Stanley tuần trước.
Morgan Stanley là một trong những ngân hàng đầu tư và công ty dịch vụ tài chính đa quốc gia lớn nhất thế giới.
Chris Cox mô tả nỗ lực phát triển chip của Meta Platforms đến nay là "kiểu như đi bộ, bò, rồi chạy", nhưng cho biết các lãnh đạo coi chip suy luận thế hệ đầu tiên cho hệ thống đề xuất là một "thành công lớn".
Trước đây, Meta Platforms đã hủy bỏ một chip suy luận tùy chỉnh nội bộ sau khi nó thất bại trong đợt triển khai thử nghiệm quy mô nhỏ tương tự đang thực hiện cho chip đào tạo. Kết quả là công ty phải đảo ngược hướng đi và đặt mua nhiều tỉ USD GPU Nvidia vào năm 2022.
Kể từ đó, công ty truyền thông xã hội này vẫn là một trong những khách hàng lớn nhất của Nvidia, tích lũy kho GPU để đào tạo các mô hình AI, gồm cả các hệ thống đề xuất và quảng cáo cũng như hàng loạt mô hình nền tảng Llama. Các đơn vị này cũng thực hiện suy luận cho hơn 3 tỉ người sử dụng ứng dụng của Meta Platforms mỗi ngày.
Giá trị của những GPU này đã bị đặt dấu hỏi trong năm nay khi các nhà nghiên cứu AI ngày càng bày tỏ nghi ngờ về việc liệu có thể đạt được bao nhiêu tiến bộ nữa bằng cách tiếp tục mở rộng quy mô các mô hình ngôn ngữ lớn thông qua thêm ngày càng nhiều dữ liệu và sức mạnh tính toán.
Sự nghi ngờ này được củng cố do công ty khởi nghiệp DeepSeek (Trung Quốc) ra mắt V3 và R1, hai mô hình AI nguồn mở có hiệu suất cao với chi phí đào tạo thấp. V3 và R1 được tối ưu hóa hiệu quả tính toán bằng cách dựa nhiều hơn vào suy luận so với hầu hết mô hình hiện có.
Trong đợt bán tháo cổ phiếu AI toàn cầu do DeepSeek gây ra cuối tháng 1, vốn hóa thị trường của Nvidia mất gần 600 tỉ USD hôm 27.1. Sau đó, cổ phiếu Nvidia đã phục hồi phần lớn giá trị khi các nhà đầu tư đặt cược rằng chip của công ty sẽ vẫn là tiêu chuẩn công nghiệp cho đào tạo và suy luận. Gần đây, cổ phiếu Nvidia đã giảm trở lại do các nhà đầu tư lo ngại về vấn đề thương mại rộng hơn.

Meta Platforms đang thử nghiệm chip tự thiết kế đầu tiên để đào tạo các hệ thống AI - Ảnh: Reuters
Không riêng Meta Platforms, OpenAI tiến hành kế hoạch giảm sự phụ thuộc vào Nvidia trong chuỗi cung ứng chip bằng cách phát triển chip AI đầu tiên của riêng mình.
Theo nguồn tin từ Reuters, OpenAI (“cha đẻ” ChatGPT) sẽ hoàn tất thiết kế chip đầu tiên trong tháng 3 và có kế hoạch gửi nó đến TSMC để gia công.
Nguồn tin cho biết OpenAI đang đi đúng hướng để đạt được mục tiêu tham vọng là sản xuất hàng loạt chip tại TSMC vào năm 2026. Một lần tape-out thường tốn hàng chục triệu USD và mất khoảng 6 tháng để tạo ra chip hoàn chỉnh, trừ khi OpenAI trả nhiều tiền hơn đáng kể để đẩy nhanh quá trình sản xuất.
Không có gì đảm bảo rằng chip sẽ hoạt động ngay từ lần tape-out đầu tiên. Nếu thất bại, công ty sẽ phải chẩn đoán vấn đề và lặp lại bước tape-out.
Bên trong nội bộ OpenAI, chip chuyên đào tạo AI này được xem như một công cụ chiến lược để củng cố vị thế đàm phán của công ty với các nhà cung cấp chip khác, theo các nguồn tin của Reuters. Sau chip ban đầu, các kỹ sư OpenAI có kế hoạch phát triển các bộ xử lý ngày càng tiên tiến hơn với nhiều khả năng mở rộng hơn qua từng thế hệ.
Nếu lần tape-out đầu tiên diễn ra suôn sẻ thì sẽ giúp OpenAI sản xuất hàng loạt chip AI nội bộ đầu tiên của mình và có khả năng thử nghiệm một giải pháp thay thế cho chip Nvidia vào cuối năm 2025. Kế hoạch gửi thiết kế đến TSMC trong năm nay cho thấy OpenAI đã đạt được tiến bộ nhanh chóng trong thiết kế chip đầu tiên của mình. Đây là quá trình mà các nhà thiết kế chip khác có thể mất nhiều năm để hoàn thành.
Các hãng công nghệ lớn như Microsoft và Meta Platforms đã gặp nhiều khó khăn trong việc tạo ra các chip hiệu quả dù đã nỗ lực nhiều năm.