AI Trung Quốc đọc được cảm xúc con người

Trong nỗ lực vượt qua OpenAI, Alibaba đã phát hành mô hình AI mới có khả năng đọc và phân tích cảm xúc con người qua video.

 Mô hình R1-Omni của Alibaba có thể suy luận trạng thái cảm xúc của một người trong video. Ảnh: Xpert.Digital.

Mô hình R1-Omni của Alibaba có thể suy luận trạng thái cảm xúc của một người trong video. Ảnh: Xpert.Digital.

Theo Bloomberg, Phòng thí nghiệm Tongyi của Alibaba ngày 11/3 đã công bố mô hình R1-Omni dưới dạng mã nguồn mở.

Điểm nổi bật nhất của mô hình này là có thể suy luận trạng thái cảm xúc của một người trong video, đồng thời mô tả quần áo và môi trường xung quanh.

Đây là một bước tiến trong lĩnh vực thị giác máy tính và là phiên bản nâng cấp của mô hình HumanOmni mã nguồn mở trước đó, được phát triển bởi cùng nhà nghiên cứu chính từ Alibaba là Jiaxing Zhao. Đặc biệt hơn, Alibaba công khai R1-Omni để người dùng tải xuống miễn phí trên nền tảng Hugging Face.

Báo cáo về nghiên cứu cho thấy R1-Omni có thể hiểu rõ hơn cách thông tin thị giác và thính giác hỗ trợ việc nhận diện cảm xúc. Ngoài ra, để nâng cao khả năng nhận dạng cảm xúc bằng cả phương thức trực quan và âm thanh, mô hình cải tiến các hệ thống AI của mình thông qua các thuật toán học tăng cường (Reinforcement learning).

Học tăng cường là một loại quy trình học máy, tập trung vào việc ra quyết định bởi các tác nhân tự động, bao gồm phần mềm AI tiên tiến, robot và xe tự hành.

Những tác nhân tự động này học cách thực hiện một nhiệm vụ thông qua phép thử và sai trong điều kiện thiếu sự hướng dẫn từ người dùng. Kỹ thuật này là một yếu tố quan trọng trong phát triển mô hình AI do nó giải quyết các vấn đề ra quyết định tuần tự trong một môi trường không chắc chắn.

Kết quả của nghiên cứu cho thấy mô hình R1-Omni có khả năng lập luận, hiểu biết sâu sắc và khái quát hóa mạnh hơn so với các mô hình khác.

Anh Tuấn

Nguồn Znews: https://znews.vn/ai-trung-quoc-doc-duoc-cam-xuc-con-nguoi-post1537948.html
Zalo