Google phát hành ứng dụng cho phép chạy mô hình AI không cần online

Google đã âm thầm ra mắt ứng dụng Google AI Edge Gallery, cho phép người dùng chạy các mô hình trí tuệ nhân tạo (AI) mã nguồn mở từ nền tảng Hugging Face trực tiếp trên điện thoại mà không cần kết nối internet.

Google AI Edge Gallery sẽ sớm ra mắt trên iOS

Google AI Edge Gallery sẽ sớm ra mắt trên iOS

Ứng dụng hiện đã có mặt trên Android và dự kiến sẽ sớm ra mắt trên iOS. Nó cung cấp khả năng tìm kiếm, tải xuống và chạy các mô hình AI tương thích để thực hiện các tác vụ như tạo hình ảnh, trả lời câu hỏi, viết và chỉnh sửa mã nguồn, cùng nhiều tính năng khác.

Google AI Edge Gallery tận dụng bộ vi xử lý của các thiết bị hỗ trợ để chạy các mô hình offline. Tính năng này mang lại sự tiện lợi cho người dùng không muốn phụ thuộc vào kết nối Wi-Fi hoặc dữ liệu di động. Điều này đặc biệt hữu ích với những người lo ngại về việc gửi dữ liệu cá nhân hoặc nhạy cảm lên các trung tâm dữ liệu từ xa.

Được coi là “bản phát hành Alpha thử nghiệm,” Google AI Edge Gallery có thể được tải xuống từ GitHub theo hướng dẫn chính thức. Màn hình chính của ứng dụng hiển thị các phím tắt cho các tác vụ AI như “Ask Image” (Hỏi về hình ảnh) và “AI Chat” (Trò chuyện AI). Người dùng có thể chọn từ danh sách các mô hình phù hợp với từng tác vụ, chẳng hạn như mô hình Gemma 3n của Google.

Ứng dụng cũng cung cấp “Prompt Lab,” nơi người dùng có thể thực hiện các tác vụ đơn lẻ như tóm tắt hoặc viết lại văn bản, với các mẫu tác vụ và cài đặt có thể tùy chỉnh để điều chỉnh hành vi của mô hình. Google thông báo rằng hiệu suất của ứng dụng có thể khác nhau tùy thuộc vào phần cứng thiết bị và kích thước mô hình.

Các thiết bị hiện đại với phần cứng mạnh mẽ sẽ chạy mô hình nhanh hơn. Còn tất nhiên, các mô hình lớn hơn sẽ mất nhiều thời gian hơn để hoàn thành tác vụ, chẳng hạn như trả lời câu hỏi về hình ảnh. Công ty cũng đang kêu gọi cộng đồng nhà phát triển cung cấp phản hồi để cải thiện trải nghiệm của Google AI Edge Gallery.

Ứng dụng được phát hành dưới giấy phép Apache 2.0, cho phép sử dụng tự do trong hầu hết các bối cảnh, gồm cả mục đích thương mại. Sự ra mắt của Google AI Edge Gallery đánh dấu một bước tiến trong việc dân chủ hóa công nghệ AI, mang đến cho người dùng khả năng tiếp cận các mô hình AI mạnh mẽ ngay trên thiết bị cá nhân, đồng thời nhấn mạnh cam kết của Google trong việc thúc đẩy đổi mới AI trên toàn cầu.

Ưu điểm của việc chạy AI cục bộ:

Quyền riêng tư và bảo mật dữ liệu

Đây là lợi ích lớn nhất. Dữ liệu của bạn không cần phải rời khỏi thiết bị cá nhân để được xử lý. Điều này giảm thiểu đáng kể nguy cơ rò rỉ dữ liệu hoặc bị bên thứ ba truy cập trái phép.

Đặc biệt quan trọng đối với dữ liệu nhạy cảm hoặc cá nhân.

Tốc độ và độ trễ thấp

Do quá trình xử lý diễn ra ngay trên thiết bị, không có độ trễ do truyền dữ liệu đi và đến máy chủ đám mây.

Điều này cực kỳ quan trọng cho các ứng dụng yêu cầu phản hồi tức thì, như trợ lý giọng nói, nhận diện khuôn mặt theo thời gian thực, hoặc các hệ thống điều khiển tự động.

Hoạt động ngoại tuyến

Sau khi mô hình được tải xuống, ứng dụng AI có thể hoạt động ngay cả khi không có kết nối internet, rất hữu ích ở những khu vực có mạng kém hoặc không ổn định.

Chi phí thấp hơn

Mặc dù có thể yêu cầu đầu tư ban đầu vào phần cứng mạnh hơn, nhưng về lâu dài, bạn không phải trả phí cho việc sử dụng tài nguyên đám mây (API calls, data transfer, compute time), có thể tiết kiệm chi phí đáng kể cho các ứng dụng sử dụng thường xuyên.

Tùy chỉnh và kiểm soát

Người dùng có toàn quyền kiểm soát mô hình, có thể tinh chỉnh (fine-tune) hoặc tối ưu hóa nó để phù hợp với nhu cầu cụ thể của mình mà không bị ràng buộc bởi các quy tắc của nhà cung cấp dịch vụ đám mây.

Nhược điểm của việc chạy AI cục bộ

Yêu cầu phần cứng cao

Để chạy các mô hình AI phức tạp (đặc biệt là các mô hình ngôn ngữ lớn - LLM), thiết bị cần có đủ RAM, CPU mạnh và quan trọng nhất là GPU (card đồ họa) với VRAM (bộ nhớ GPU) đủ lớn để xử lý các phép tính song song. Điều này có thể đòi hỏi đầu tư vào phần cứng đắt tiền hơn.

Kích thước mô hình

Các mô hình AI, đặc biệt là LLM, có thể rất lớn (vài GB đến hàng trăm GB), chiếm nhiều không gian lưu trữ và cần thời gian để tải xuống.

Phức tạp trong cài đặt và quản lý

Việc thiết lập và chạy các mô hình AI cục bộ đôi khi đòi hỏi kiến thức kỹ thuật nhất định về lập trình, quản lý môi trường phần mềm và tối ưu hóa phần cứng.

Giới hạn về hiệu suất

Mặc dù nhanh hơn về độ trễ, nhưng một thiết bị cá nhân khó có thể sánh được với sức mạnh tính toán khổng lồ của các trung tâm dữ liệu đám mây, đặc biệt là khi huấn luyện mô hình hoặc xử lý khối lượng dữ liệu lớn.

Anh Tú

Nguồn Một Thế Giới: https://1thegioi.vn/google-phat-hanh-ung-dung-cho-phep-chay-mo-hinh-ai-khong-can-online-233241.html
Zalo