Nvidia tạo dấu ấn mới trên đường đua trí tuệ nhân tạo

Nvidia đã ghi dấu ấn mạnh mẽ trong lĩnh vực AI với mô hình mới được ra mắt vào ngày 25/11 vừa qua. Với khả năng biến đổi giọng nói, tạo ra những âm thanh độc đáo và thậm chí sáng tác nhạc, mô hình AI của Nvidia hứa hẹn sẽ mở ra vô vàn khả năng sáng tạo mới.

Nvidia, nhà cung cấp chip và phần mềm hàng đầu thế giới trong lĩnh vực AI, mới đây đã công bố một công nghệ mới mang tên Fugatto, viết tắt của Foundational Generative Audio Transformer Opus 1. Tuy nhiên, công ty cho biết họ chưa có kế hoạch phát hành công nghệ này ngay lập tức. Fugatto được thiết kế để tạo ra âm thanh và âm nhạc từ các mô tả bằng văn bản, mở ra tiềm năng sáng tạo độc đáo trong lĩnh vực âm thanh.

Khác với các công nghệ AI tạo sinh thông thường, Fugatto không chỉ tạo âm thanh mới mà còn có khả năng tiếp nhận và sửa đổi các âm thanh hiện có. Ví dụ, công nghệ này có thể biến một đoạn nhạc piano thành một bản trình diễn bằng giọng hát, hoặc thay đổi giọng nói và tâm trạng trong một đoạn ghi âm. Đặc biệt, Fugatto còn có thể tạo ra các âm thanh độc đáo như tiếng kèn trumpet “sủa” như chó, hứa hẹn mang đến những trải nghiệm sáng tạo chưa từng có.

Nvidia vừa trình làng một công cụ AI đột phá có khả năng biến đổi giọng nói một cách linh hoạt, mở ra những chân trời mới cho sáng tạo âm thanh (Ảnh: Reuters)

Nvidia vừa trình làng một công cụ AI đột phá có khả năng biến đổi giọng nói một cách linh hoạt, mở ra những chân trời mới cho sáng tạo âm thanh (Ảnh: Reuters)

Bryan Catanzaro, Phó Chủ tịch nghiên cứu học sâu ứng dụng tại Nvidia, nhận định: “Trong 50 năm qua, âm nhạc đã thay đổi nhờ sự hỗ trợ của máy tính và các thiết bị tổng hợp. Tôi tin rằng AI tạo sinh sẽ mang lại những khả năng mới cho âm nhạc, trò chơi điện tử và cả những người bình thường muốn sáng tạo”.

Dù tiềm năng là rất lớn, Nvidia vẫn thận trọng trong việc phát hành Fugatto ra công chúng. Công ty nhấn mạnh các rủi ro liên quan, chẳng hạn như việc sử dụng công nghệ để tạo nội dung sai lệch hoặc vi phạm bản quyền. Catanzaro chia sẻ: “Chúng tôi cần cẩn thận. Đó là lý do tại sao chúng tôi chưa có kế hoạch phát hành ngay lập tức”.

Vấn đề này không chỉ riêng Nvidia mà còn được các công ty lớn khác như OpenAI và Meta Platforms đặc biệt quan tâm. Các công ty này cũng đang phát triển các mô hình AI tạo sinh có khả năng tạo âm thanh hoặc video từ lời nhắc văn bản nhưng chưa công bố kế hoạch phát hành cụ thể.

Mối quan hệ giữa AI và ngành giải trí cũng đang gặp không ít khó khăn. Điển hình, Scarlett Johansson từng cáo buộc OpenAI vì bắt chước giọng nói của cô, làm dấy lên các tranh cãi về bản quyền và quyền cá nhân.

Hiện tại, Fugatto được đào tạo trên dữ liệu nguồn mở, và Nvidia vẫn đang cân nhắc liệu có nên công khai công nghệ này hay không. Dù còn nhiều thách thức, công nghệ AI tạo sinh như Fugatto hứa hẹn mở ra một chương mới đầy sáng tạo và đột phá trong lĩnh vực âm nhạc, giải trí và âm thanh kỹ thuật số.

sohuutritue.net.vn

Nguồn Doanh Nghiệp: https://doanhnghiepvn.vn/cong-nghe/nvidia-tao-dau-an-moi-tren-duong-dua-tri-tue-nhan-tao/20241126075308727
Zalo