Dựng lại chân dung từ... giọng nói

09/11/2024Gốc

Phòng thí nghiệm khoa học máy tính và trí tuệ nhân tạo thuộc Viện Công nghệ Massachusetts (Mỹ) vừa tạo ra một thuật toán AI có tên Speech2Face để tái tạo chân dung từ giọng nói.

Dựng lại chân dung từ giọng nói

Thuật toán này tạo ra một bức chân dung chính xác đến kỳ lạ chỉ bằng một bản ghi âm ngắn của người đang nói.

Đầu tiên, nhóm thiết kế và đào tạo một mạng nơ-ron sâu bằng cách sử dụng hàng triệu video từ YouTube và Internet khi con người đang nói chuyện. Trong quá trình đào tạo, AI đã "học" được mối tương quan giữa âm thanh của giọng nói và ngoại hình của người nói.

Các mối tương quan này cho phép AI đưa ra dự đoán tốt nhất về độ tuổi, giới tính và dân tộc của người đang nói. AI được cung cấp một kho video khổng lồ và được giao nhiệm vụ tìm ra mối tương quan giữa đặc điểm giọng nói và đặc điểm khuôn mặt.

Sau khi được đào tạo, AI cực kỳ giỏi trong việc tạo ra các bức chân dung chỉ dựa trên các bản ghi âm giọng nói giống với ngoại hình thực tế của người nói.

Để phân tích sâu hơn về độ chính xác của việc tái tạo khuôn mặt, các nhà nghiên cứu đã xây dựng một "bộ giải mã khuôn mặt" tạo ra bản tái tạo chuẩn hóa khuôn mặt của một người từ một khung hình tĩnh trong khi bỏ qua "các biến thể không liên quan" như tư thế và ánh sáng.

Điều này cho phép các nhà khoa học dễ dàng so sánh các bản tái tạo giọng nói với các đặc điểm thực tế của người nói. Một lần nữa, kết quả của AI rất giống với khuôn mặt thực trong phần lớn các trường hợp đào tạo thử nghiệm.

Những người có giọng nói cao (bao gồm cả các bé trai) thường được xác định là nữ trong khi những người có giọng nói trầm được gắn nhãn là nam. Một người đàn ông châu Á nói tiếng Anh dẫn đến ngoại hình ít giống người châu Á hơn so với khi anh ta nói tiếng Trung.

Mai Nguyễn (Tổng hợp)

Trí tuệ nhân tạo

Nguồn Phụ Nữ VN: https://phunuvietnam.vn/dung-lai-chan-dung-tu-giong-noi-20241108140809484.htm

Dựng lại chân dung từ... giọng nói

Phòng thí nghiệm khoa học máy tính và trí tuệ nhân tạo thuộc Viện Công nghệ Massachusetts (Mỹ) vừa tạo ra một thuật toán AI có tên Speech2Face để tái tạo chân dung từ giọng nói.

TIN KHÁC

Xác định thứ khủng khiếp khiến vũ trụ ngày càng nở ra

CLIP: Cuộc chiến sinh tử bảo vệ lãnh thổ của 2 chúa sơn lâm, cái kết thảm của một trong hai kẻ tham chiến

Đảo rắn trở thành đảo chuột? Điều gì đã xảy ra khi các nhà khoa học phát hiện số lượng chuột tăng mạnh trên đảo rắn, trong khi quần thể rắn giảm mạnh

TIN NÓNG

CLIP: Đại bàng thiệt mạng khi cả gan tấn công báo con

Hàng ngàn người xếp hàng xem 'hoa xác chết'

Tại sao nước có thể dập tắt lửa? Các chuyên gia giải thích nguyên lý khiến nước 'khắc chế' được lửa

CLIP: Cuộc chạm trán kịch tính giữa rắn hổ mang và kỳ đà

Vệ tinh thời tiết Himawari-9 của Nhật Bản gặp sự cố

Sinh vật lạ nguyên vẹn sau 161 triệu năm, chân tướng gây sốc

TIN MỚI

CLIP: Bò rừng bison dũng cảm đối đầu bầy sói để bảo vệ con

Tàu NASA tìm ra thế giới mới có thể chứa nước và sự sống

Bí ẩn động vật tự tìm đến cái chết khiến giới khoa học 'đau đầu'

11 người bị thương do máy bay của Lufthansa gặp nhiễu động không khí

Lần đầu tiên người dân được tận mắt ngắm các hiện vật trong Bảo tàng Sinh học lâu đời nhất Đông Dương

Những 'phát minh quái gở', khó tin nhất lịch sử nhân loại

Top 5 loài động vật thù dai nhất hành tinh: Số 1 gây 'sốc' nặng

Tiết lộ gây sốc về chủng tộc Lemurian 'thần thánh' đã tuyệt chủng