Sách nói sử dụng giọng AI: Dán nhãn giúp độc giả phân biệt

Giới xuất bản quốc tế đang đề xuất dán nhãn cho dòng sách nói dùng giọng đọc AI để độc giả dễ phân biệt với sách nói dùng giọng đọc con người.

 Ảnh: Travsonic

Ảnh: Travsonic

Theo Publishing Perspectives, trong bối cảnh có nhiều tranh cãi và lo ngại xung quanh sự xâm lấn của AI trong giới xuất bản, có một nội dung cũng đang được quan tâm là ngành xuất bản nên dán nhãn những sách nói được AI lồng tiếng để phân biệt với sách nói sử dụng giọng đọc của con người.

Ngày 19/12, Hiệp hội các nhà xuất bản sách nói tại Mỹ và Nhóm các nhà xuất bản sách nói của Vương quốc Anh, trực thuộc Hiệp hội các nhà xuất bản Vương quốc Anh (PA), đã cùng nhau ban hành một hướng dẫn ngắn gọn để các nhà xuất bản và bán sách cân nhắc việc dán nhãn đối với sách nói sử dụng một phần hoặc toàn bộ giọng đọc từ AI.

Trong khi không đưa ra dự báo nào về xu hướng sử dụng giọng đọc AI trong ngành công nghiệp sách nói, tài liệu này phần nào phản ánh sự nhạy cảm của nhiều người trong ngành đối với các chủ đề liên quan đến AI.

Tài liệu có đoạn: "Cần nhấn mạnh rằng các hướng dẫn này chỉ mang tính khuyến nghị. Chúng không phải là yêu cầu bắt buộc. Tuy nhiên, chúng là những kết luận được cân nhắc từ nhiều cuộc thảo luận liên ngành".

Jon Watt, Giám đốc mảng sách nói của Bonnier Books UK và CEO Hiệp hội nhà xuất bản sách nói Michele Cobb đã cùng phát triển và đưa ra những hướng dẫn này.

Cobb và Watt viết: “Hiện tại, nhiều thuật ngữ đang được sử dụng để đề cập đến các giọng đọc AI khác nhau tại nhiều thị trường, đôi lúc gây nên sự nhầm lẫn cho cả các nhà xuất bản, nhà bán lẻ và người tiêu dùng. Các hướng dẫn mới đã được xây dựng sau khi tham khảo ý kiến của giới xuất bản, nhà bán sách, nhà phân phối và nhà cung cấp siêu dữ liệu từ Mỹ, Canada, Vương quốc Anh và châu Âu".

"Tất cả hướng đến mục tiêu thúc đẩy tính nhất quán trong toàn ngành để cung cấp cho người tiêu dùng thông tin rõ ràng và cho phép họ đưa ra lựa chọn sáng suốt khi mua sách nói. Trọng tâm khi lựa chọn các thuật ngữ là chúng sẽ dễ dàng để các nhà xuất bản và nhà bán lẻ sử dụng, diễn giải và cũng dễ hiểu cho người tiêu dùng".

Các định nghĩa cơ bản

Theo đó, giọng đọc AI được định nghĩa là: Giọng nói được AI tạo ra bằng cách sử dụng các mẫu giọng của một nhóm người nói không xác định. Một ví dụ là giọng "tự động kể chuyện" của Google, chẳng hạn Archie hoặc Mary.

Còn bản sao chép giọng nói được ủy quyền (AVR) được định nghĩa là: Giọng nói do AI tạo ra bằng cách sử dụng các mẫu được ủy quyền/cấp phép từ giọng nói của một người cụ thể.

Một ví dụ về AVR là việc một nhà xuất bản thỏa thuận với những người đại diện cho một tác giả đã khuất để tạo ra một bản sao giọng nói được ủy quyền dựa trên các mẫu lưu trữ giọng nói của tác giả đó.

Hướng dẫn về AVR cũng lưu ý đến hoạt động nhân bản, theo đó là sao chép trái phép khi con người không đồng ý sao chép giọng nói của họ.

Hơn nữa, tài liệu chỉ ra, “Hầu hết giọng nói AI đều có tên nhận dạng, trong một số trường hợp là tên riêng. Bản hướng dẫn khuyến khích sử dụng tên này làm “người kể chuyện” hoặc “người đọc”, cho phép người tiêu dùng dễ dàng xác định và chọn giọng nói, giống như họ làm với người kể chuyện là con người”.

Một ví dụ đã được đưa ra với tác phẩm The Hound of the Baskervilles của tác giả Arthur Conan Doyle. Sách nói có thể sử dụng người kể chuyện có tên Jane Smith với lưu ý AVR bên cạnh.

Ngoài ra, AVR được đặt tên này cũng có thể được cấp mã định danh để tránh sự mơ hồ với những người thật có tên tương tự.

Thuật ngữ người kể chuyện

Có một phần trong tài liệu hướng dẫn có đề cập đến việc sử dụng thuật ngữ người kể chuyện và người đọc (narrator or reader). Theo đó, thuật ngữ người kể chuyện có thể không chính xác bằng người đọc.

Kể chuyện là "hành động hoặc quá trình kể lại các chi tiết của một sự kiện hoặc diễn biến của một chuỗi sự kiện", theo định nghĩa của từ điển Merriam-Webster. Nói cách khác, kể chuyện là nói về một điều gì đó, chứ không phải đọc to văn bản của nó.

Để hiểu thế nào là kể chuyện thực sự, độc giả có thể trải nghiệm những câu mở đầu của John Hurt trong bộ phim chuyển thể Perfume: The Story of a Murderer do đạo diễn kiêm nhà soạn nhạc Tom Tykwer thực hiện năm 2006.

Với việc làm rõ tính chất người kể chuyện và người đọc, các nhà xuất bản cũng có thể cân nhắc thêm khi sử dụng thuật ngữ này cho sách nói trong tương lai.

Khi ngành công nghiệp sách nói ngày càng phát triển và các hoạt động hữu ích như phát triển giao thức dán nhãn cho các giọng đọc được triển khai, thì một thuật ngữ chính xác hơn để chỉ cách truyền đạt văn bản của một cuốn sách thông qua âm thanh có thể dần được áp dụng.

Minh Hoa

Nguồn Znews: https://znews.vn/sach-noi-su-dung-giong-ai-dan-nhan-giup-doc-gia-phan-biet-post1519709.html
Zalo