AI mới giúp phát hiện vùng bất định trong chẩn đoán hình ảnh

Bằng cách cung cấp bản đồ nhãn hợp lý cho một hình ảnh y tế, mô hình máy học Tyche từ MIT hứa hẹn giúp các bác sĩ lâm sàng và nhà nghiên cứu nắm bắt thông tin quan trọng.

Trong y học, "phân vùng" (segmentation) là việc chú thích các điểm ảnh (pixel) đại diện cho một cấu trúc quan trọng trong hình ảnh y tế, như cơ quan nội tạng hay tế bào. Các mô hình trí tuệ nhân tạo (AI) có thể hỗ trợ bác sĩ bằng cách làm nổi bật những vùng có khả năng biểu hiện dấu hiệu của bệnh hoặc bất thường.

Tuy nhiên, các mô hình AI hiện nay thường chỉ cung cấp một kết quả duy nhất, trong khi việc phân vùng hình ảnh y tế thường không rõ ràng và mang tính chủ quan. Năm chuyên gia có thể đưa ra năm kết quả phân vùng khác nhau, ví dụ như bất đồng về sự tồn tại hoặc ranh giới của một nốt bất thường trong ảnh CT phổi.

“Có nhiều lựa chọn sẽ giúp ích cho việc ra quyết định. Thậm chí chỉ cần thấy rằng có sự bất định trong hình ảnh y tế cũng có thể ảnh hưởng đến quyết định của một người, vì vậy điều quan trọng là phải tính đến sự bất định đó”, Marianne Rakic, nghiên cứu sinh tiến sĩ Khoa học máy tính tại MIT, chia sẻ.

Rakic là tác giả chính của một bài báo cùng với các đồng tác giả tại MIT, Viện Broad (MIT và Harvard) và Bệnh viện Đa khoa Massachusetts (MGH), giới thiệu một công cụ AI mới có thể ghi nhận sự bất định trong hình ảnh y tế.

Một hệ thống học máy có thể đưa ra nhiều chẩn đoán khác nhau từ hình ảnh y tế. Cách này giúp bác sĩ không bỏ sót thông tin quan trọng khi chẩn đoán bệnh. Ảnh: MIT News

Một hệ thống học máy có thể đưa ra nhiều chẩn đoán khác nhau từ hình ảnh y tế. Cách này giúp bác sĩ không bỏ sót thông tin quan trọng khi chẩn đoán bệnh. Ảnh: MIT News

Có tên là Tyche (theo tên vị nữ thần may rủi của Hy Lạp), hệ thống này cung cấp nhiều phương án phân vùng hợp lý khác nhau, mỗi phương án làm nổi bật một khu vực hơi khác nhau trên hình ảnh y tế. Người dùng có thể chọn số lượng kết quả mà Tyche tạo ra và lựa chọn kết quả phù hợp nhất với mục đích sử dụng.

Quan trọng hơn, Tyche có thể xử lý các nhiệm vụ phân vùng mới mà không cần huấn luyện lại - một quá trình đòi hỏi nhiều dữ liệu, thời gian và kinh nghiệm chuyên môn trong học máy. Chính vì không cần huấn luyện lại, Tyche có thể dễ sử dụng hơn đối với các bác sĩ và nhà nghiên cứu y sinh so với nhiều phương pháp khác. Hệ thống này có thể áp dụng ngay cho nhiều nhiệm vụ, từ nhận diện tổn thương trong ảnh X-quang phổi đến phát hiện bất thường trong MRI não.

Cuối cùng, hệ thống này có thể cải thiện chẩn đoán hoặc hỗ trợ nghiên cứu y sinh bằng cách làm nổi bật những thông tin có thể rất quan trọng mà các công cụ AI khác dễ bỏ sót.

“Sự mơ hồ là yếu tố chưa được nghiên cứu đầy đủ. Nếu mô hình của bạn hoàn toàn bỏ qua một nốt mà ba chuyên gia xác nhận có tồn tại còn hai người không, thì đó là điều bạn nên chú ý”, PGS. Adrian Dalca, tác giả cao cấp của nghiên cứu, cho biết. Ông hiện là phó giáo sư tại Trường Y Harvard, Bệnh viện MGH và là nhà nghiên cứu tại Phòng thí nghiệm Khoa học máy tính và Trí tuệ nhân tạo (CSAIL) của MIT.

Giải quyết sự mơ hồ

Các hệ thống AI cho phân vùng hình ảnh y tế thường sử dụng mạng nơ-ron - mô hình học máy lấy cảm hứng từ não người, gồm nhiều lớp nơ-ron liên kết xử lý dữ liệu.

Sau khi trao đổi với các cộng tác viên tại Viện Broad và MGH, nhóm nghiên cứu nhận ra hai vấn đề chính: mô hình hiện tại không thể hiện được sự bất định và cần phải huấn luyện lại cho từng nhiệm vụ phân vùng khác nhau, dù chỉ thay đổi rất nhỏ.

Một số phương pháp đã cố gắng khắc phục một trong hai hạn chế, nhưng giải quyết cả hai trong một hệ thống là điều đặc biệt khó khăn, Rakic cho biết. “Nếu bạn muốn tính đến sự mơ hồ, bạn thường phải dùng một mô hình cực kỳ phức tạp. Phương pháp của chúng tôi nhằm đơn giản hóa mô hình nhưng vẫn cho ra dự đoán nhanh chóng và hiệu quả”.

Nhóm nghiên cứu xây dựng Tyche bằng cách điều chỉnh một kiến trúc mạng nơ-ron đơn giản. Người dùng đầu tiên cung cấp cho Tyche một vài ví dụ minh họa nhiệm vụ phân vùng - ví dụ, các ảnh MRI tim có vùng tổn thương được phân vùng bởi nhiều chuyên gia để mô hình học được tính mơ hồ.

Chỉ cần 16 hình ảnh ví dụ (gọi là “context set”) đã đủ để mô hình dự đoán tốt, dù không giới hạn số lượng ví dụ. Chính nhờ “context set” này, Tyche có thể xử lý các nhiệm vụ mới mà không cần huấn luyện lại.

Để Tyche có thể thể hiện sự bất định, nhóm nghiên cứu đã điều chỉnh mạng nơ-ron sao cho nó có thể đưa ra nhiều kết quả phân vùng khác nhau cho cùng một ảnh đầu vào và bộ ví dụ đi kèm. Các lớp trong mạng được thiết kế lại để các phương án phân vùng “trao đổi” thông tin với nhau và với các ví dụ trong bộ context.

Dự đoán tốt hơn, nhanh hơn

Khi thử nghiệm Tyche với các bộ dữ liệu ảnh y tế có gán nhãn, nhóm phát hiện các dự đoán của mô hình thể hiện được mức độ đa dạng như con người, và dự đoán tốt nhất của Tyche còn vượt trội hơn so với mô hình nền. Tyche cũng cho kết quả nhanh hơn phần lớn các mô hình khác.

“Việc tạo ra nhiều phương án và đảm bảo chúng khác nhau thực sự là một lợi thế,” Rakic nhận định.

Nhóm cũng thấy Tyche có thể vượt qua cả những mô hình phức tạp đã được huấn luyện bằng tập dữ liệu chuyên biệt lớn.

Trong tương lai, họ sẽ thử nghiệm các dạng context linh hoạt hơn, có thể bao gồm cả văn bản hoặc nhiều loại hình ảnh khác nhau. Họ cũng muốn cải thiện các dự đoán kém nhất của Tyche và nâng cấp hệ thống để tự đề xuất phương án phân vùng tốt nhất.

(Nguồn: MIT News)

Nguồn VietnamNet: https://vietnamnet.vn/ai-moi-giup-phat-hien-vung-bat-dinh-trong-chan-doan-hinh-anh-2402685.html
Zalo