Meta ra mắt Llama 4, mô hình AI tiên tiến

1 ngày trước Gốc

Meta vừa phát hành Llama 4, bộ sưu tập mô hình AI mới nhất thuộc dòng Llama.

Hình ảnh: Meta

Meta đã chính thức giới thiệu ba mô hình AI mới: Llama 4 Scout, Llama 4 Maverick và Llama 4 Behemoth. Những mô hình này được đào tạo trên một tập dữ liệu lớn bao gồm văn bản, hình ảnh và video không nhãn, nhằm nâng cao khả năng "hiểu biết trực quan rộng".

Sự phát triển này của Llama được thúc đẩy bởi những thành công gần đây của các mô hình mở từ DeepSeek (Trung Quốc), với hiệu suất cạnh tranh, thậm chí vượt trội so với các phiên bản Llama trước đó. Điều này đã khiến Meta tìm cách giảm chi phí vận hành và triển khai mô hình tương tự như DeepSeek.

Meta AI đã được cập nhật để sử dụng Llama 4 tại 40 quốc gia nhưng các tính năng đa phương thức hiện chỉ được triển khai tại Hoa Kỳ và bằng tiếng Anh.

Giấy phép của Llama 4 gây tranh cãi

Giấy phép Llama 4 gây tranh cãi đối với một số nhà phát triển bởi vì người dùng và các công ty có địa chỉ hoặc trụ sở tại châu Âu sẽ không được phép sử dụng hoặc phân phối các mô hình này, có thể do các yêu cầu quản lý từ luật AI và quy định bảo mật dữ liệu của khu vực.

Giống như các phiên bản trước đó, các công ty có hơn 700 triệu người dùng hoạt động hàng tháng sẽ cần xin giấy phép đặc biệt từ Meta.

Llama 4 ứng dụng MoE

Llama 4 đánh dấu một mốc quan trọng trong việc phát triển mô hình AI với việc ứng dụng kiến trúc Hỗn hợp Chuyên gia (MoE). Kiến trúc này cho phép phân chia các tác vụ dữ liệu và phân bổ cho những "chuyên gia" nhỏ hơn, giúp nâng cao khả năng đào tạo và phản hồi truy vấn. Chẳng hạn, Llama 4 Maverick có tổng cộng 400 tỷ tham số, nhưng chỉ 17 tỷ tham số đang hoạt động trên 128 "chuyên gia". Đối với Llama Scout, mô hình này có 17 tỷ tham số đang hoạt động, 16 chuyên gia và tổng cộng 109 tỷ tham số.

So sánh hiệu suất của Llama 4

Theo các thử nghiệm nội bộ, Meta tuyên bố rằng Maverick vượt trội hơn so với GPT-4o và Gemini 2.0 trong các lĩnh vực mã hóa, lý luận, đa ngôn ngữ, ngữ cảnh dài, và hình ảnh, đặc biệt là trong các ứng dụng "trợ lý chung và trò chuyện" như viết sáng tạo. Thế nhưng, Maverick vẫn chưa đạt được hiệu suất tốt hơn so với Gemini 2.5 Pro, Claude 3.7 Sonnet và GPT-4.5.

Một cải tiến đáng chú ý là Meta đã điều chỉnh Llama 4 để giảm thiểu tần suất từ chối các câu hỏi "gây tranh cãi", cho phép mô hình này đưa ra phản hồi về các chủ đề chính trị và xã hội mà các phiên bản trước không thể thực hiện.

Meta khẳng định rằng Llama 4 "cân bằng hơn đáng kể" trong việc xử lý các yêu cầu mà trước đó nó không giải quyết được.

Phát ngôn viên của Meta khẳng định: "Bạn có thể tin tưởng Llama 4 cung cấp phản hồi hữu ích, dựa trên thực tế mà không phán xét". Công ty đang tiếp tục cải tiến khả năng phản hồi của Llama để mở rộng phạm vi câu hỏi và cung cấp nhiều quan điểm khác nhau hơn, đồng thời cố gắng tránh thiên vị.

Meta coi Llama 4 là "sự khởi đầu của một kỷ nguyên mới" cho hệ sinh thái Llama và dự kiến công ty sẽ tiếp tục phát triển dòng sản phẩm này.

Minh Phú

Nguồn Công dân & Khuyến học: https://congdankhuyenhoc.vn/meta-ra-mat-llama-4-mo-hinh-ai-tien-tien-179250406103213641.htm

Meta ra mắt Llama 4, mô hình AI tiên tiến

Meta vừa phát hành Llama 4, bộ sưu tập mô hình AI mới nhất thuộc dòng Llama.

TIN KHÁC

DeepSeek tiết lộ phương pháp lý luận AI mới

Gã khổng lồ sở hữu Facebook tiếp tục mở rộng cơ sở hạ tầng AI

Không sao lưu dữ liệu, doanh nghiệp đang tự đưa mình vào rủi ro

TIN NÓNG

Được ví như 'mẫu xe tiên tiến nhất', mô hình AI Llama 4 mới của Meta có gì đặc biệt?

Nhà khoa học nữ 30 năm góp sức nâng tầm nông sản Việt

Quang Linh Vlogs, Hằng Du Mục mất 300.000 người theo dõi

Ấn Độ khánh thành cầu vượt eo biển với nhịp nâng thẳng đứng đầu tiên

DeepSeek gây tò mò

'Chiến thần' livestream bán hàng giả, trách nhiệm của sàn thương mại điện tử ở đâu?

TIN MỚI

Tin nóng KHCN 7/4: Apple phát hành beta iOS 18.5, lợi nhuận Samsung giảm 21%

Takshow 'Sống và làm việc cùng AI: Hội nhập để phát triển thành phố tương lai'

PV Shipyard hạ thủy thành công chân đế trạm biến áp ngoài khơi

Lợi nhuận quý 1 của Samsung có thể giảm 21% do doanh số chip AI thấp và thua lỗ ở mảng gia công chip

Đề xuất người nổi tiếng quảng cáo phải có bằng chứng sử dụng sản phẩm

Vì sao ai cũng là nạn nhân trên MXH?

[INFOGRAPHIC] Nintendo Switch 2: Máy chơi game đột phá sắp khuynh đảo thị trường

Trung Quốc hiện thực hóa sản xuất albumin huyết thanh người quy mô lớn từ gạo