Google nâng cấp AI Gemini Live với loạt tính năng tương tác trực quan

Google vừa bổ sung loạt tính năng mới cho Gemini Live, trợ lý AI trò chuyện thời gian thực. Người dùng có thể nhận chỉ dẫn trực quan qua camera, soạn tin nhắn, thực hiện cuộc gọi và trải nghiệm giọng nói tự nhiên hơn.

Google vừa công bố gói tính năng mới dành cho Gemini Live, trợ lý AI có khả năng trò chuyện theo thời gian thực. Từ tuần tới, Gemini Live sẽ hỗ trợ làm nổi bật các đối tượng trực tiếp trên màn hình khi người dùng chia sẻ camera, giúp việc chỉ dẫn trực quan trở nên dễ dàng hơn.

Chẳng hạn, nếu bạn cần tìm đúng dụng cụ cho một dự án, chỉ cần hướng camera điện thoại vào hộp dụng cụ và Gemini Live sẽ khoanh vùng, đánh dấu chính xác món đồ cần thiết ngay trên màn hình. Tính năng này sẽ xuất hiện đầu tiên trên dòng Pixel 10 ra mắt ngày 28/8, sau đó được mở rộng sang các thiết bị Android khác và dự kiến có mặt trên iOS trong vài tuần tới.

Gemini Live khoanh vùng trực quan trên màn hình khi nhận diện đồ vật. (Ảnh: Google).

Gemini Live khoanh vùng trực quan trên màn hình khi nhận diện đồ vật. (Ảnh: Google).

Song song với đó, Google cũng giới thiệu các tích hợp mới, cho phép Gemini Live tương tác trực tiếp với nhiều ứng dụng hệ thống như Tin nhắn, Điện thoại và Đồng hồ. Người dùng có thể chuyển đổi mượt mà giữa các tác vụ. Ví dụ, khi đang trao đổi về chỉ đường nhưng chợt nhớ mình sẽ đến muộn, bạn có thể nói: “Đường này ổn rồi. Giờ hãy nhắn cho Alex rằng tôi sẽ trễ khoảng 10 phút.” Ngay lập tức, Gemini Live sẽ soạn thảo tin nhắn gửi cho bạn bè.

Ngoài việc hỗ trợ soạn tin nhắn, Gemini Live cũng sắp có thể thực hiện cuộc gọi trực tiếp, giúp người dùng xử lý nhanh công việc mà không cần rời khỏi cuộc trò chuyện với AI.

Một điểm nhấn khác là Google tung ra mô hình âm thanh mới cho Gemini Live, được cho là sẽ cải thiện rõ rệt khả năng mô phỏng ngữ điệu, nhịp điệu và cao độ của giọng nói con người. Gemini có thể thay đổi tông giọng tùy theo ngữ cảnh, ví dụ sử dụng giọng nhẹ nhàng hơn khi trả lời câu hỏi về chủ đề căng thẳng.

Người dùng cũng sẽ có tùy chọn điều chỉnh tốc độ nói nhanh hay chậm, tương tự như cách ChatGPT hiện cho phép chỉnh phong cách giọng đọc. Đặc biệt, khi được yêu cầu kể lại một câu chuyện dưới góc nhìn của một nhân vật hay nhân vật lịch sử, Gemini còn có thể sử dụng giọng điệu hoặc ngữ âm đặc trưng để tạo trải nghiệm kể chuyện sinh động và lôi cuốn hơn.

Khánh Linh

Nguồn Xây Dựng: https://baoxaydung.vn/google-nang-cap-ai-gemini-live-voi-loat-tinh-nang-tuong-tac-truc-quan-192250823012148227.htm
Zalo