Gemini cho vẽ trực tiếp lên ảnh để ra lệnh AI

20 giờ trước Gốc

Sau sự kiện ra mắt lớn, Google cập nhật Gemini với khả năng vẽ, chú thích trực tiếp lên hình ảnh để gợi ý Nano Banana, đồng thời mở rộng xác minh SynthID sang video trên toàn cầu.

Bên cạnh khả năng tương tác trực quan hơn với hình ảnh, Gemini còn được Google tăng cường công cụ xác minh nội dung AI, giúp người dùng dễ dàng nhận biết video, âm thanh hay hình ảnh do trí tuệ nhân tạo tạo ra hoặc chỉnh sửa.

Nguồn ảnh: 9to5google.

Gợi ý cho Nano Banana bằng cách vẽ trực tiếp trên hình ảnh

Điểm mới đáng chú ý là Gemini đã bổ sung “cách thức mới để gợi ý với Nano Banana” thông qua việc vẽ hoặc chú thích trực tiếp trên hình ảnh. Thay vì phải mô tả chi tiết bằng văn bản trong ô nhắc, người dùng có thể tương tác trực tiếp với hình ảnh để chỉ ra yêu cầu của mình.

Cụ thể, sau khi thêm hình ảnh vào hộp nhắc, người dùng chỉ cần chọn hình ảnh đó để mở trình chỉnh sửa mang tên “Đánh dấu”. Tại đây, công cụ “Phác thảo” cho phép vẽ, tô sáng hoặc khoanh vùng những chi tiết cụ thể trên ảnh, kèm theo các nút hoàn tác và làm lại ở góc trên bên phải để thao tác dễ dàng hơn. Ngoài ra, công cụ “Văn bản” cho phép chèn trực tiếp lời nhắc ngay trên hình ảnh.

Nguồn ảnh: 9to5google.

Google cho biết cách làm này giúp người dùng không cần nhập các hướng dẫn dài dòng trong ô nhắc, dù vẫn có thể bổ sung mô tả bằng chữ nếu muốn. Khi tải ảnh đầu tiên lên, Gemini sẽ hiển thị gợi ý để người dùng làm quen với khả năng mới này. Hiện tại, tính năng gợi ý Nano Banana bằng cách vẽ đã có mặt trên Android, iOS và nền tảng web.

Nguồn ảnh: 9to5google.

SynthID mở rộng sang xác minh video

Song song với cải tiến về tương tác hình ảnh, Gemini cũng đang mở rộng tính năng xác minh SynthID sang video, sau khi đã hỗ trợ xác minh hình ảnh từ tháng 11. Với cập nhật này, người dùng có thể kiểm tra xem một video – bao gồm cả phần âm thanh – có được tạo ra hoặc chỉnh sửa bằng AI của Google hay không.

Người dùng có thể tải lên video có dung lượng tối đa 100 MB và thời lượng không quá 90 giây. Sau đó, hệ thống sẽ hiển thị thông báo dạng như: “Video này có được tạo bằng Google AI không?”. Gemini sẽ quét video để tìm dấu bản quyền SynthID – công nghệ gắn dấu nhận diện nội dung do AI tạo ra.

Kết quả xác minh không chỉ đưa ra câu trả lời có hay không, mà còn cung cấp ngữ cảnh chi tiết, chỉ rõ đoạn nào trong video chứa yếu tố do Google AI tạo ra. Ví dụ, hệ thống có thể thông báo: “Đã phát hiện SynthID trong âm thanh từ giây thứ 10 đến 20. Không phát hiện SynthID trong hình ảnh.”

Triển khai toàn cầu cho mọi ngôn ngữ

Đáng chú ý, tính năng xác minh video và hình ảnh bằng SynthID đã được triển khai cho tất cả các ngôn ngữ và quốc gia đang sử dụng ứng dụng Gemini. Điều này giúp người dùng trên toàn thế giới dễ dàng kiểm chứng nội dung số, góp phần nói không với tin giả, video deepfake và các sản phẩm AI bị lạm dụng.

Với loạt nâng cấp mới, Gemini không chỉ trở nên trực quan hơn trong cách người dùng tương tác với hình ảnh, mà còn khẳng định vai trò là công cụ hỗ trợ xác minh nội dung AI đáng tin cậy trong bối cảnh trí tuệ nhân tạo ngày càng phát triển mạnh mẽ.

Theo 9to5google