Google phát triển AI giúp giao tiếp với cá heo
Một mô hình trí tuệ nhân tạo mới, được phát triển bởi các nhà khoa học máy tính phối hợp với các nhà nghiên cứu về cá heo, có tiềm năng mở ra cánh cửa cho giao tiếp hai chiều với động vật.

Stenella frontalis (cá heo đốm Đại Tây Dương) loài cá heo được các nhà khoa học chọn nghiên cứu. Ảnh: iNaturalist.
Mới đây, Google đã hợp tác với các nhà khoa học máy tính tại Google và các nhà nghiên cứu chuyên về sinh vật biển để xây dựng một mô hình ngôn ngữ lớn (LLM) được thiết kế để trò chuyện với cá heo, mang tên DolphinGemma.
Mục tiêu chính của dự án này là khám phá và giải mã các phương thức giao tiếp phức tạp của cá heo, đồng thời thiết lập nền tảng cho khả năng tương tác hai chiều giữa con người và loài động vật biển này.
Trí tuệ nhân tạo và cách động vật giao tiếp
Mô hình DolphinGemma được xây dựng dựa trên một tập dữ liệu phong phú, thu thập trong hơn 4 thập kỷ bởi Dự án Cá heo Hoang dã (Wild Dolphin Project - WDP). Đây là Dự án nghiên cứu dài nhất thế giới về quần thể cá heo đốm Đại Tây Dương (Stenella frontalis) tại khu vực Bahamas.
Trong quá trình nghiên cứu, WDP đã thu thập một lượng lớn dữ liệu âm thanh và hình ảnh dưới nước, liên kết với các cá thể riêng lẻ trong đàn, ghi lại các khía cạnh về mối quan hệ xã hội và lịch sử cuộc đời của chúng.
Tập dữ liệu này bao gồm các cặp âm thanh và hành vi tương ứng, chẳng hạn như âm thanh tán tỉnh, tiếng kêu gây hấn và các "tiếng huýt sáo đặc trưng" đóng vai trò như dấu hiệu nhận dạng cá nhân.

Một cá heo mẹ đang quan sát con non khi kiếm ăn (Trái), nó sẽ dùng tiếng huýt sáo đặc trưng của mình để gọi con trở về. Hình ảnh sóng âm của tiếng huýt sáo đó (phải). Ảnh: Google.
Nguồn tài nguyên này đã cung cấp cho các nhà nghiên cứu của Google cơ sở dữ liệu cần thiết để huấn luyện một mô hình trí tuệ nhân tạo có khả năng phân tích các đặc trưng trong giao tiếp của cá heo, tương tự như cách các mô hình ngôn ngữ lớn xử lý ngôn ngữ loài người.
DolphinGemma hoạt động theo cơ chế đầu vào âm thanh - đầu ra âm thanh, cho phép mô hình "lắng nghe" các âm thanh của cá heo và dự đoán trình tự âm thanh tiếp theo, từ đó nắm bắt cấu trúc trong hệ thống giao tiếp của chúng.
Việc ứng dụng trí tuệ nhân tạo đang gia tăng đáng kể tốc độ giải mã giao tiếp của động vật. Các chương trình máy tính lớn có thể xử lý rất nhiều âm thanh, từ tiếng chó sủa đến tiếng chim hót. Chúng nhận ra các kiểu âm thanh quen thuộc và dựa vào tình huống xung quanh để đoán xem động vật đang muốn nói gì.
Cá heo, thuộc nhóm động vật có vú ở biển gọi là "Cetacea" (bộ Cá voi), là đối tượng nghiên cứu đặc biệt phù hợp do chúng có cấu trúc xã hội phức tạp và phương thức giao tiếp đa dạng. Các âm thanh như tiếng "click" (tách tách) và tiếng huýt sáo với tần số cao của chúng tương đối dễ thu âm và đưa vào máy tính để AI học cách phân tích "ngữ pháp".
Nói chuyện với cá heo bằng smartphone
Một trong những ứng dụng tiềm năng của DolphinGemma là phát triển hệ thống CHAT (Cetacean Hearing Augmentation Telemetry). Hệ thống này, được triển khai trên các thiết bị điện thoại thông minh đã được điều chỉnh, có khả năng tạo ra các âm thanh nhân tạo mang đặc trưng của cá heo.
Những âm thanh này được "gắn" với những thứ mà cá heo hay dùng hoặc thích, ví dụ như cỏ biển hay đồ dùng của các nhà khoa học. Mục đích là để cá heo tò mò, bắt chước những tiếng huýt sáo mà máy tạo ra để "xin" những thứ đó, giống như chúng ta đang tập nói chuyện với nhau một cách đơn giản.

Chiếc điện thoại Google Pixel 9 đặt trong phần cứng của hệ thống CHAT. Ảnh: Google.
Trong tương lai, các phiên bản nâng cấp của CHAT sẽ được trang bị năng lực xử lý mạnh mẽ hơn và các thuật toán thông minh hơn, nhằm tăng cường tốc độ phản hồi và độ rõ ràng trong các tương tác giữa con người và cá heo. Tuy nhiên, việc triển khai các phương pháp giao tiếp phức tạp hơn trong môi trường tự nhiên đặt ra những vấn đề đạo đức quan trọng cần được xem xét.
Google dự kiến phát hành DolphinGemma dưới dạng một mô hình mã nguồn mở trong mùa hè này, tạo điều kiện cho các nhà nghiên cứu trên toàn thế giới ứng dụng nó vào việc nghiên cứu các loài cá heo khác.
DolphinGemma được kỳ vọng sẽ là một bước tiến đáng kể trong việc nâng cao sự hiểu biết về một trong những loài động vật biển quen thuộc nhất với con người.
Mặc dù khả năng đối thoại phức tạp với cá heo vẫn còn là một mục tiêu dài hạn, tiềm năng giao tiếp hai chiều mà mô hình này mang lại là một dấu hiệu đầy hứa hẹn về những khả năng đột phá mà trí tuệ nhân tạo có thể mang lại trong lĩnh vực nghiên cứu hành vi động vật.