Khi trí tuệ nhân tạo giúp máy móc 'nhìn thấy' thế giới
Hai cựu sinh viên MIT sáng lập nền tảng Coactive giúp doanh nghiệp hiểu và khai thác dữ liệu hình ảnh, âm thanh, video bằng trí tuệ nhân tạo.
Trong kỷ nguyên dữ liệu, hầu hết các doanh nghiệp đều dựa vào dữ liệu để ra quyết định. Thế nhưng, có một “vùng mù” mà nhiều tổ chức vẫn chưa khai phá: họ không thực sự biết điều gì đang diễn ra trong kho dữ liệu hình ảnh, video hay âm thanh khổng lồ của mình.

Coactive - nền tảng ứng dụng trí tuệ nhân tạo (AI) giúp khai phá những hiểu biết sâu sắc các nội dung đa dạng, bao gồm cả video. Ảnh: Coactive AI, MIT News
Coactive - công ty do hai cựu sinh viên MIT là Cody Coleman và William Gaviria Rojas sáng lập - đang giải quyết vấn đề đó bằng trí tuệ nhân tạo. Nền tảng AI của Coactive có thể nhanh chóng tìm kiếm, sắp xếp và phân tích dữ liệu hình ảnh, âm thanh và video, giúp doanh nghiệp đưa ra các quyết định nhanh hơn, chính xác hơn.
“Ở cuộc cách mạng dữ liệu đầu tiên, doanh nghiệp đã biết cách tận dụng dữ liệu có cấu trúc như bảng biểu, bảng tính. Nhưng giờ đây, khoảng 80-90% dữ liệu là không cấu trúc. Muốn xử lý hiệu quả những dữ liệu này, doanh nghiệp cần đến AI,” Coleman giải thích.
Hiện Coactive đang làm việc với nhiều công ty lớn trong lĩnh vực truyền thông và bán lẻ để tự động phân tích nội dung hình ảnh - thay vì phải gắn thẻ hoặc phân loại thủ công. Nhờ đó, họ có thể đưa nội dung phù hợp đến người dùng nhanh hơn, lọc bỏ nội dung phản cảm, và hiểu rõ hơn mối liên hệ giữa nội dung và hành vi người dùng.
Sứ mệnh kết nối con người và máy móc
Tên gọi “Coactive” mang hàm ý về sự hợp tác đồng thời - đó cũng là tầm nhìn của hai nhà sáng lập: giúp con người và AI làm việc cùng nhau.
“Chúng tôi tin rằng AI có thể chia rẽ hoặc gắn kết con người. Coactive ra đời để tạo ra sự gắn kết - nơi AI trở thành ‘trợ thủ’ giúp con người mạnh mẽ hơn,” Coleman chia sẻ.
Coleman và Gaviria Rojas quen nhau khi mới bước chân vào MIT. Họ cùng học ngành Kỹ thuật điện và Khoa học máy tính, từng hợp tác đưa chương trình học OpenCourseWare của MIT đến các trường đại học tại Mexico.
Niềm đam mê với AI đến với Coleman trong thời gian anh làm nghiên cứu sinh tại MIT. Khi tham gia dự án MITx - nền tảng học trực tuyến của trường - anh đã sử dụng AI để phân tích cách con người học và xây dựng hệ thống học tập cá nhân hóa.
“Tôi thấy thật tuyệt vời khi công nghệ có thể mở ra cơ hội học tập cho hàng triệu người, đồng thời giúp chúng ta hiểu rõ hơn về hành vi học tập”, anh nói.
Sau đó, Coleman tiếp tục học tiến sĩ tại Stanford và nghiên cứu các phương pháp giúp AI dễ tiếp cận hơn với doanh nghiệp. Anh từng hợp tác với Pinterest và Meta để triển khai các ứng dụng học máy thực tiễn - và chính từ trải nghiệm đó, ý tưởng về Coactive ra đời.
Một hệ điều hành cho dữ liệu hình ảnh
Trong khi đó, Gaviria Rojas làm việc tại eBay ở Thung lũng Silicon. Trong một lần nhờ bạn giúp chuyển ghế sofa, cả hai tình cờ trò chuyện và nhận ra rằng doanh nghiệp đang đứng trước làn sóng dữ liệu mới - không còn là bảng biểu, mà là ảnh, video, âm thanh, văn bản. Và công nghệ giúp khai phá dữ liệu đó, không gì khác hơn là AI.
Từ đó, họ xây dựng nên Coactive - một “hệ điều hành AI” có thể thay thế linh hoạt các mô hình AI bên trong khi công nghệ ngày càng phát triển. Nền tảng này tích hợp sẵn các công cụ tìm kiếm nội dung, gắn thẻ tự động, phân tích dữ liệu và trích xuất thông tin hữu ích.
“Trước đây, máy tính nhìn thế giới bằng dữ liệu nhị phân. Con người thì nhìn bằng hình ảnh. Giờ đây, AI cho phép máy móc cũng có ‘thị giác’ như con người - điều này làm mờ ranh giới giữa thế giới số và thực tế,” Coleman nói.
Thay đổi cách chúng ta tương tác với máy móc
Reuters - hãng tin nổi tiếng toàn cầu - từng phải gắn thẻ thủ công hàng triệu bức ảnh để phục vụ nhu cầu tìm kiếm. Việc này chậm, tốn kém và thiếu chính xác. Giờ đây, khi phóng viên chọn chế độ “Tìm kiếm bằng AI”, Coactive sẽ lập tức hiển thị những hình ảnh phù hợp nhất dựa trên nội dung thật sự của ảnh.
“Kết quả tìm kiếm chất lượng hơn giúp phóng viên kể câu chuyện nhanh và chính xác hơn,” Coleman chia sẻ.
Một khách hàng khác của Coactive là Fandom - nền tảng thông tin về phim, game và chương trình truyền hình với hơn 300 triệu người dùng mỗi tháng. Coactive giúp Fandom nhận diện và loại bỏ nội dung mang tính bạo lực hoặc phản cảm trong các cộng đồng trực tuyến.
“Trước đây mất đến 48 tiếng để kiểm duyệt một nội dung. Giờ đây với Coactive, thời gian xử lý chỉ còn khoảng 500 mili-giây,” Coleman cho biết.
Một kỷ nguyên mới trong tương tác người - máy
Theo hai nhà sáng lập, Coactive đang góp phần định hình lại cách con người làm việc với công nghệ.
“Trước giờ, chúng ta phải gõ bàn phím, rê chuột để máy hiểu mình. Nhưng giờ đây, ta có thể nói chuyện tự nhiên, gửi hình ảnh, video - và AI hiểu được nội dung. Đó là một bước ngoặt,” Coleman nhận định.
“Và khi tương tác thay đổi, chúng ta cần một hệ điều hành mới - một cách làm việc mới với nội dung và trí tuệ nhân tạo. Đó chính là Coactive.”
(Nguồn: MIT News)