Meta ra mắt Llama 4, mô hình AI tiên tiến

Meta vừa phát hành Llama 4, bộ sưu tập mô hình AI mới nhất thuộc dòng Llama.

Hình ảnh: Meta

Hình ảnh: Meta

Meta đã chính thức giới thiệu ba mô hình AI mới: Llama 4 Scout, Llama 4 Maverick và Llama 4 Behemoth. Những mô hình này được đào tạo trên một tập dữ liệu lớn bao gồm văn bản, hình ảnh và video không nhãn, nhằm nâng cao khả năng "hiểu biết trực quan rộng".

Sự phát triển này của Llama được thúc đẩy bởi những thành công gần đây của các mô hình mở từ DeepSeek (Trung Quốc), với hiệu suất cạnh tranh, thậm chí vượt trội so với các phiên bản Llama trước đó. Điều này đã khiến Meta tìm cách giảm chi phí vận hành và triển khai mô hình tương tự như DeepSeek.

Meta AI đã được cập nhật để sử dụng Llama 4 tại 40 quốc gia nhưng các tính năng đa phương thức hiện chỉ được triển khai tại Hoa Kỳ và bằng tiếng Anh.

Giấy phép của Llama 4 gây tranh cãi

Giấy phép Llama 4 gây tranh cãi đối với một số nhà phát triển bởi vì người dùng và các công ty có địa chỉ hoặc trụ sở tại châu Âu sẽ không được phép sử dụng hoặc phân phối các mô hình này, có thể do các yêu cầu quản lý từ luật AI và quy định bảo mật dữ liệu của khu vực.

Giống như các phiên bản trước đó, các công ty có hơn 700 triệu người dùng hoạt động hàng tháng sẽ cần xin giấy phép đặc biệt từ Meta.

Llama 4 ứng dụng MoE

Llama 4 đánh dấu một mốc quan trọng trong việc phát triển mô hình AI với việc ứng dụng kiến trúc Hỗn hợp Chuyên gia (MoE). Kiến trúc này cho phép phân chia các tác vụ dữ liệu và phân bổ cho những "chuyên gia" nhỏ hơn, giúp nâng cao khả năng đào tạo và phản hồi truy vấn. Chẳng hạn, Llama 4 Maverick có tổng cộng 400 tỷ tham số, nhưng chỉ 17 tỷ tham số đang hoạt động trên 128 "chuyên gia". Đối với Llama Scout, mô hình này có 17 tỷ tham số đang hoạt động, 16 chuyên gia và tổng cộng 109 tỷ tham số.

So sánh hiệu suất của Llama 4

Theo các thử nghiệm nội bộ, Meta tuyên bố rằng Maverick vượt trội hơn so với GPT-4o và Gemini 2.0 trong các lĩnh vực mã hóa, lý luận, đa ngôn ngữ, ngữ cảnh dài, và hình ảnh, đặc biệt là trong các ứng dụng "trợ lý chung và trò chuyện" như viết sáng tạo. Thế nhưng, Maverick vẫn chưa đạt được hiệu suất tốt hơn so với Gemini 2.5 Pro, Claude 3.7 Sonnet và GPT-4.5.

Một cải tiến đáng chú ý là Meta đã điều chỉnh Llama 4 để giảm thiểu tần suất từ chối các câu hỏi "gây tranh cãi", cho phép mô hình này đưa ra phản hồi về các chủ đề chính trị và xã hội mà các phiên bản trước không thể thực hiện.

Meta khẳng định rằng Llama 4 "cân bằng hơn đáng kể" trong việc xử lý các yêu cầu mà trước đó nó không giải quyết được.

Phát ngôn viên của Meta khẳng định: "Bạn có thể tin tưởng Llama 4 cung cấp phản hồi hữu ích, dựa trên thực tế mà không phán xét". Công ty đang tiếp tục cải tiến khả năng phản hồi của Llama để mở rộng phạm vi câu hỏi và cung cấp nhiều quan điểm khác nhau hơn, đồng thời cố gắng tránh thiên vị.

Meta coi Llama 4 là "sự khởi đầu của một kỷ nguyên mới" cho hệ sinh thái Llama và dự kiến công ty sẽ tiếp tục phát triển dòng sản phẩm này.

Minh Phú

Nguồn Công dân & Khuyến học: https://congdankhuyenhoc.vn/meta-ra-mat-llama-4-mo-hinh-ai-tien-tien-179250406103213641.htm
Zalo