AI 'thèm khát' mọi thứ: Điện, nước, khoáng sản, bất động sản, dữ liệu…
Trong bối cảnh trí tuệ nhân tạo (AI) trở thành cơn sốt mà mọi quốc gia, mọi doanh nghiệp đều mong muốn phát triển và ứng dụng, thì bản thân AI cũng có những 'cơn khát' của riêng mình. Đó là mọi thứ, bao gồm dữ liệu, chip, bất động sản, điện, nước… và sẽ ngày càng thèm khát hơn nữa.
Nhiều và nhiều hơn nữa
Mọi chuyện có vẻ rất đơn giản: Hỏi ChatGPT điều gì đó và “cỗ máy” sẽ trả lời. Tuy nhiên, phía sau cánh gà, ChatGPT nói riêng và mọi cỗ máy AI nói chung đều tiêu tốn rất nhiều tài nguyên: Hàng triệu kỹ sư thiết kế, hiệu chỉnh và đào tạo các mô hình. Lượng điện chạy máy đủ dùng cho cả một quốc gia. Những trung tâm dữ liệu hàng ngàn héc-ta trên khắp thế giới. Mạng lưới đường dây điện và cáp internet. Nước, đất, kim loại, khoáng sản. Trí tuệ nhân tạo cần tất cả những điều này và sẽ cần nhiều hơn nữa.
Các nghiên cứu chỉ ra rằng, một câu hỏi đặt ra cho ChatGPT yêu cầu lượng điện gấp gần 10 lần để xử lý so với tìm kiếm Google thông thường. Công cụ tìm kiếm thông thường sẽ thu thập dữ liệu trên web để tìm nội dung được lưu trữ trong các thư mục khổng lồ, nhưng các sản phẩm AI mới nhất hoạt động dựa trên mô hình ngôn ngữ lớn (LLM), được cung cấp hàng tỷ văn bản, từ các tác phẩm lâu đời của nhà văn William Shakespeare đến các dự báo mới nhất của Cục Dự trữ liên bang Mỹ (Fed). Các mô hình phát hiện các mẫu và mối liên kết, phát triển hàng tỷ và hàng tỷ cái gọi là tham số giúp chúng mô phỏng hành vi của con người. Dựa vào việc sử dụng các mô hình này, ChatGPT và các mô hình tương tự tạo ra nội dung mới, do đó có thuật ngữ AI tạo sinh.
Với bản chất là dựa vào việc sử dụng tài nguyên, hoạt động của AI sẽ tạo ra kẻ thắng và người thua. Những người có nhiều tài nguyên nhất sẽ có hệ thống AI tiên tiến nhất. Điều này dẫn tới những xung đột về các tài nguyên khan hiếm, cũng như khả năng truy cập vào các nguồn cung cấp chip. Đồng thời, các doanh nghiệp công nghệ bị thôi thúc phải tìm kiếm các cách thức hiệu quả hơn để phát triển AI, họ “ném” hàng tỷ USD vào các giải pháp năng lượng thay thế như năng lượng hạt nhân - loại năng lượng đã bị đình trệ hàng thập kỷ vì các lý do an toàn và kỹ thuật. Chưa kể, nhu cầu AI đang gia tăng áp lực buộc phải tiếp tục đốt nhiên liệu hóa thạch để cung cấp cho lưới điện, ngay cả khi thế giới đang đặt các mục tiêu chống biến đổi khí hậu là ưu tiên.
Các sản phẩm/dịch vụ AI tồn tại được nhờ các trung tâm dữ liệu với bo mạch chủ, chip và thiết bị lưu trữ. Nhu cầu điện của các trung tâm này hiện đang vượt xa nguồn cung sẵn có ở nhiều nơi trên thế giới. Tại Mỹ, các trung tâm dữ liệu dự kiến sẽ sử dụng 8% tổng điện năng vào năm 2030, gấp gần 3 lần tỷ trọng năm 2022 khi cơn sốt AI bắt đầu. Goldman Sachs Group Inc mô tả đây là loại tăng trưởng điện chưa từng thấy trong một thế hệ.
Tương tự, nhu cầu điện tăng đột biến cũng được dự báo tại Thụy Điển, Vương quốc Anh… Đến năm 2034, mức tiêu thụ năng lượng toàn cầu hàng năm của các trung tâm dữ liệu dự kiến sẽ vượt 1.580 TWh (terawatt giờ) so với mức 500 TWh hiện nay và con số này bằng lượng tiêu thụ điện của cả Ấn Độ.
Các trung tâm dữ liệu do Google điều hành đã sử dụng hơn 24 TWh trong năm 2023, tăng hơn 31% so với năm 2021. Tổng mức sử dụng điện của Microsoft cũng tăng 70% so với 2 năm trước đó. Các công ty công nghệ lớn nhất thế giới đã nhận thức rõ ràng điện có thể là nút thắt gây gián đoạn lớn nhất trong chuỗi cung ứng AI và đang chạy đua để đảm bảo nguồn cung điện dài hạn. Vào tháng 5/2024, Microsoft và Brookfield Asset Management Ltd. đã ký kết thỏa thuận hợp tác năng lượng sạch lớn nhất lịch sử doanh nghiệp này.
Than, một trong những nguồn năng lượng có hàm lượng các-bon cao nhất thế giới, vẫn được đốt để tạo ra khoảng một phần ba nguồn cung cấp điện. Khí đốt tự nhiên, cũng tạo ra khí thải gây nóng lên toàn cầu, cung cấp 20% năng lượng. Các trang trại gió và mặt trời đã phát triển trong những năm gần đây, nhưng bản chất khó đảm bảo tính liên tục gây ra vấn đề cho các trung tâm dữ liệu.
Trong bối cảnh này, Google đã tiên phong đưa vào giải pháp sử dụng phần mềm để săn tìm điện sạch ở những khu vực trên thế giới thuận lợi cho điện mặt trời và điện gió, sau đó tăng cường hoạt động của trung tâm dữ liệu tại đó.
Một cách khác là tìm tới năng lượng hạt nhân. Điều này giải thích tại sao Microsoft đã ký một thỏa thuận vào tháng 9/2024 với mục tiêu mở lại một lò phản ứng tại nhà máy điện hạt nhân Three Mile Island ở Pennsylvania, nơi xảy ra sự cố tan chảy một phần khét tiếng vào năm 1979.
Khoảng một tháng sau, Amazon.com Inc. đã ký ba thỏa thuận để phát triển các lò phản ứng hạt nhân quy mô nhỏ và Google đã đầu tư và cam kết mua điện từ một công ty cũng đang phát triển các lò phản ứng mô-đun tương tự.
“Ý tôi là, Chúa ơi, lò phản ứng hạt nhân. Các người đùa tôi à?”, Chủ tịch Oracle Corp Larry Ellison đã thốt lên với các nhà phân tích trong một cuộc họp vào tháng 9/2024, “Điều này nghe cứ như chuyện bịa, nhưng không phải vậy… Đã từng có chuyện gì như thế này xảy ra trước đây chưa?”!
Mỗi watt điện được đưa vào máy chủ đều tạo ra nhiệt. Nhiệt độ quá cao có thể phá hủy thiết bị và làm chậm hệ thống. Hiện tại, cách tiết kiệm năng lượng và chi phí tốt nhất để làm mát không khí trong các trung tâm dữ liệu đều dựa vào nước. Bluefield Research ước tính, các trung tâm dữ liệu sử dụng hơn 1 tỷ lít nước mỗi ngày, bao gồm cả nước dùng để tạo ra năng lượng. Con số đó đủ để cung cấp cho 3,3 triệu người trong một ngày.
Một nghiên cứu năm 2023 ước tính rằng, một cuộc trò chuyện với ChatGPT bao gồm khoảng 10 đến 50 câu hỏi và câu trả lời, cần một chai nước tiêu chuẩn 500 ml. Việc đào tạo mô hình AI phía sau ChatGPT ước tính đã tiêu thụ hơn 757.000 lít nước. Đặc biệt, phần lớn nước cần có chất lượng uống được, để tránh các vấn đề về môi trường và hỏng hóc thiết bị. Điều này khiến câu chuyện tiêu tốn tài nguyên nước sạch và vấn đề an sinh xã hội gia tăng.
Tại West Des Moines (Iowa, Mỹ), các trung tâm dữ liệu của Microsoft là đơn vị sử dụng nước lớn nhất khu vực, tiêu thụ nhiều hơn cả thành phố này, theo dữ liệu của đơn vị cấp nước địa phương. Tại Talavera de la Reina, một thành phố nhỏ nằm giữa những cánh đồng lúa mạch và lúa mì của Tây Ban Nha, Meta Platforms Inc - công ty mẹ của Facebook đã có xung đột với người dân địa phương về kế hoạch xây dựng một trung tâm dữ liệu dự kiến sẽ sử dụng khoảng 665 triệu lít nước mỗi năm.
Cơn khát bất động sản và tài nguyên
Trên toàn cầu, có hơn 7.000 trung tâm dữ liệu được xây dựng hoặc đang trong các giai đoạn phát triển khác nhau, tăng so với con số 3.600 vào năm 2015. Và tất nhiên con số này chưa phải là cuối cùng. Nhu cầu về dịch vụ trung tâm dữ liệu đã tăng mạnh ngay cả trước khi có ChatGPT, chủ yếu là do các công ty dịch chuyển hoạt động xử lý dữ liệu của mình ra khỏi cơ sở và chuyển sang các dịch vụ đám mây từ xa.
Mọi quốc gia lớn đều muốn có các trung tâm AI trong nước, từ đó khởi động cuộc đua cơ sở hạ tầng toàn cầu. Các trung tâm dữ liệu cần đất. Chẳng hạn, Equinix Inc - một quỹ đầu tư bất động sản tập trung phục vụ trung tâm dữ liệu đã mua 80 ha để dành cho dự án phát triển một trung tâm dữ liệu với công suất hàng trăm megawatt. Một công ty khác gần đây đã ký thỏa thuận cho một trung tâm dữ liệu công suất gigawatt thuê hơn 800 ha.
Việc tìm kiếm đất phù hợp với nhu cầu điện năng của trung tâm dữ liệu là rất khó khăn, dẫn đến các cuộc chiến đấu thầu. Các khu phức hợp này cũng cần vật liệu xây dựng và đội ngũ để lắp đặt. Vật liệu phải được đặt hàng trước và tình trạng thiếu hụt công nhân diễn ra. Trong khi đó, nhà cung cấp dịch vụ đám mây CoreWeave cho biết một số khách hàng muốn thuê toàn bộ khuôn viên của dự án chỉ cho doanh nghiệp của họ.
“Thị trường đang chuyển động nhanh hơn nhiều so với chuỗi cung ứng, vốn trước đây chỉ phục vụ một số đơn vị nhất định”, đại diện CoreWeave cho biết.
Bộ xử lý đồ họa, hay GPU, là những “con ngựa thồ” để đào tạo các mô hình AI. Chúng được thiết kế để xử lý hàng nghìn tác vụ cùng lúc. Một trung tâm dữ liệu có thể sử dụng hàng trăm hoặc thậm chí hàng nghìn bộ xử lý này, mỗi bộ có giá cao hơn một chiếc ô tô gia đình. Hầu như mọi công ty công nghệ lớn đều thiếu loại chip này khi cơn sốt AI tạo sinh lần đầu tiên xuất hiện. Microsoft và Google đều lên tiếng cho rằng, tình trạng tồn kho GPU thấp là một thách thức lớn.
Cũng chính bởi lý do này, Nvidia Corp, nhà thiết kế và sản xuất chip đã tạo nên cơn sốt trong thời gian gần đây. Mới đây nhất, vào tháng 11/2024, Công ty cho biết sản phẩm mới nhất Blackwell đang đi đúng hướng và dự báo sẽ sớm được tung ra thị trường. Nhưng điều này vẫn cần nhiều thời gian trong bối cảnh nhu cầu tăng mạnh mẽ.
Những mặt hàng kể trên lại cần có nhiều loại kim loại và khoáng chất làm nguyên liệu đầu vào. Chẳng hạn, silicon là nền tảng cho chip, vi mạch và bộ xử lý. Trung Quốc đang là nhà sản xuất silicon thô và vật liệu silicon tinh chế lớn nhất thế giới. Quốc gia này cũng đã đưa ra lệnh cấm xuất khẩu khoáng chất và công nghệ liên quan tới sản xuất chip trong bối cảnh cuộc chiến công nghệ với Mỹ leo thang. Điều này gây ra lo ngại lớn về chuỗi cung ứng. Những kim loại quan trọng khác trong việc sản xuất chip bao gồm gali, germani, đồng, vàng, bạc, nhôm và thiếc… cũng đang trong tình cảnh tương tự.
Dữ liệu và những nỗi sợ
Các mô hình AI tạo sinh cần dữ liệu chất lượng cao giống như con người cần thức ăn. Các mô hình ngôn ngữ lớn được “đào tạo” bằng cách tiếp nhận văn bản được chia thành các đơn vị nhỏ gọi là “token” (có thể hiểu là mã thông báo). Từ văn bản này, LLM xác định các mẫu giúp dự đoán văn bản sẽ theo sau một tập hợp văn bản khác. Các mô hình LLM hàng đầu thế giới đã được đào tạo từ hơn 1.000 tỷ token.
Để hiểu rõ hơn, 2.048 token tương đương với 1.500 từ và có vài nghìn tỷ đến hàng triệu tỷ token tồn tại trên thế giới ở khắp mọi nơi.
Vậy nhưng, lượng dữ liệu dồi dào này vẫn chưa đủ để duy trì sự phát triển của AI nhanh như kỳ vọng. Một số nhà phát triển mô hình AI mạnh nhất thế giới, chẳng hạn OpenAI, đang thấy ngày càng khó khăn trong việc tìm kiếm các nguồn dữ liệu đào tạo chất lượng cao do con người tạo ra và chưa được khai thác để phát triển các mô hình.
Tình trạng thiếu dữ liệu bằng các ngôn ngữ không phải tiếng Anh, thậm chí là thiếu dữ liệu về các cộng đồng thiểu số hoặc không phải da trắng tạo nên mối đe dọa. Sự thiếu đa dạng dẫn tới các sản phẩm AI có thể “thiên vị” một số nhóm nhất định dựa trên dữ liệu dùng để đào tạo AI. Ví dụ, một phân tích của Bloomberg đã phát hiện rằng mô hình AI cơ bản đằng sau ChatGPT thể hiện sự thiên vị đối với một số nhóm chủng tộc khi lên danh sách hoặc xếp hạng.
Các công ty công nghệ đang thử nghiệm các mô hình đào tạo trên các tập dữ liệu “tổng hợp”, nội dung do chính AI tạo ra. Về lý thuyết, điều này giúp các công ty AI đáp ứng nhu cầu dữ liệu vô hạn của họ, trong khi tránh các mối quan ngại về mặt pháp lý, đạo đức và quyền riêng tư liên quan đến việc thu thập thông tin từ web. Nhưng một số nhà nghiên cứu đã cảnh báo rằng các mô hình AI có thể “sụp đổ” nếu chúng được đào tạo trên nội dung do AI tạo ra, thay vì con người. Một nghiên cứu năm 2023 cho rằng, hình ảnh của AI về con người ngày càng bị bóp méo sau khi mô hình được đào tạo trên “một lượng nhỏ thông tin do chính AI tạo ra”.
Không ai muốn nhỡ tàu
Trong cơn sốt AI, các nhà đầu tư, đơn vị điều hành trung tâm dữ liệu, công ty năng lượng và các doanh nghiệp khác đang đổ hàng trăm tỷ USD vào các phân khúc của chuỗi cung ứng AI. Mọi ngân hàng lớn và công ty tài chính tư nhân đều đang tìm miếng bánh tại thị trường chi tiêu đầu tư cho cơ sở hạ tầng AI có quy mô ước tính hơn 1.000 tỷ USD. Chưa kể các khoản đầu tư vào AI của Alphabet, Amazon, Meta và Microsoft dự kiến sẽ vượt quá 200 tỷ USD năm 2024.
Giữa dòng chảy này, chỉ số ngành tiện ích S&P 500 đã tăng 22% trong năm qua và REIT Equinix - doanh nghiệp tập trung vào trung tâm dữ liệu chứng kiến vốn hóa thị trường tăng gần gấp đôi kể từ cuối năm 2022. Cổ phiếu Nvidia đã tăng gần 700% trong hai năm qua, biến Công ty trở thành một trong những doanh nghiệp có giá trị cao nhất trên trái đất.
Gary Dickerson, CEO của nhà sản xuất thiết bị chip Applied Materials Inc., vừa gửi thông điệp tới các nhà đầu tư rằng, một số công ty AI đang hướng tới mục tiêu cải thiện hiệu quả tính toán của mô hình hơn 100 lần trong 5 năm. Thậm chí, một số công ty khác có mục tiêu cải thiện 10.000 lần trong 15 năm.
Và trong cơn hưng phấn, cũng như tính cần thiết của tăng trưởng, AI sẽ tiếp tục “cơn đói” của mình với nhiều và nhiều hơn nữa các nguồn lực.
(Theo báo chí nước ngoài)