Sử dụng kỹ thuật 'sao chép' để tạo ra mô hình trí tuệ nhân tạo giá rẻ

Các công ty trí tuệ nhân tạo (AI) hàng đầu thế giới đang chạy đua sử dụng kỹ thuật có tên 'sao chép' hay 'chưng cất' để tạo ra các mô hình giá rẻ, tức chuyển giao kiến thức từ một mô hình ngôn ngữ lớn (LLM) và phức tạp sang một mô hình tinh gọn với chi phí rẻ, có thể phổ cập nhanh hơn đến người tiêu dùng và doanh nghiệp.

Kỹ thuật chưng cất (distillation) thu hút sự chú ý rộng rãi sau khi DeepSeek của Trung Quốc được cho là đã sử dụng nó để xây dựng các mô hình AI mạnh và hiệu quả dựa trên các hệ thống AI nguồn mở của Meta (công ty mẹ của Facebook) và Alibaba, cũng như dữ liệu truy xuất từ nền tảng giao diện lập trình ứng dụng (API) của OpenAI. Bằng phương pháp "chưng cất" để tạo ra các mô hình nhỏ gọn, các công ty AI hàng đầu sẽ tạo ra những sản phẩm giá rẻ, nhanh, nhỏ gọn và hiệu quả so với các mô hình ban đầu. Quá trình "chưng cất" cho phép một mô hình "giáo viên" lớn để dạy một mô hình "học sinh" nhỏ hơn, trở nên hiệu quả hơn trong khi yêu cầu ít sức mạnh tính toán hơn.

Tiến bộ của kỹ thuật "chưng cất" được xem là một thắng lợi cho những người ủng hộ mô hình AI nguồn mở, cung cấp công nghệ AI miễn phí cho các nhà phát triển ứng dụng, giúp giảm sự phụ thuộc vào các mô hình độc quyền khổng lồ.

Mai Nguyễn (Tổng hợp)

Nguồn Phụ Nữ VN: https://phunuvietnam.vn/su-dung-ky-thuat-sao-chep-de-tao-ra-mo-hinh-tri-tue-nhan-tao-gia-re-20250506191939887.htm
Zalo