
STATIONARY
Loại bỏ Yếu tố Nhiễu bằng Invariant Risk Minimization trong Chẩn đoán Y khoa
Tổng quan
Bài báo giới thiệu ReConfirm, một framework mới sử dụng Invariant Risk Minimization (IRM) để loại bỏ các yếu tố nhiễu (confounders) trong chẩn đoán y khoa, đặc biệt trên dữ liệu hình ảnh X-quang ngực. Các yếu tố nhiễu như giới tính và tuổi có thể gây sai lệch trong mô hình AI do sự liên kết giả (spurious correlation) giữa chúng và nhãn bệnh lý. Ví dụ, mô hình có thể sử dụng đặc điểm ngực để phân loại bệnh cho bệnh nhân nữ, dẫn đến tỷ lệ dương tính giả cao. ReConfirm giúp loại bỏ những liên kết sai lệch này, tập trung vào các đặc trưng nhân quả (causal features) có ý nghĩa y khoa hơn. Trên tập dữ liệu NIH Chest X-ray (NIH-CXR), ReConfirm cải thiện 2.95% độ chính xác tổng quát so với Empirical Risk Minimization (ERM) khi loại bỏ yếu tố nhiễu về giới tính.
Phương pháp và Điểm mới
Phương pháp sử dụng
- Invariant Risk Minimization (IRM): Tìm kiếm các đặc trưng bất biến (invariant features) qua nhiều môi trường huấn luyện (training environments) bằng cách sử dụng hàm tối ưu hóa đặc biệt.
- Phân tách môi trường huấn luyện (Environment Splitting): Phân chia tập dữ liệu thành hai môi trường huấn luyện dựa trên nguyên tắc học bất biến. Ví dụ: trong môi trường $e_0$, tất cả nữ giới thuộc nhóm kiểm soát, trong khi ở môi trường $e_1$, mối quan hệ này bị đảo ngược.
- Class-conditional ReConfirm: Áp dụng hình phạt học bất biến cho từng lớp riêng biệt, giúp loại bỏ ảnh hưởng của yếu tố nhiễu theo từng lớp.
Điểm mới của nghiên cứu
- Lần đầu tiên áp dụng IRM trong X-quang y khoa: Đảm bảo tính bất biến của đặc trưng y khoa trong chẩn đoán bệnh từ hình ảnh X-quang.
- Class-conditional Invariant Learning: Đề xuất hình phạt học bất biến có điều kiện theo từng lớp, giúp học đặc trưng tốt hơn cho mỗi nhãn bệnh lý.
- Tạo môi trường huấn luyện tối ưu: Sử dụng chiến lược phân chia môi trường để tối đa hóa sự vi phạm nguyên tắc học bất biến, đảm bảo mô hình học được các đặc trưng nhân quả thực sự.
Thí nghiệm và Kết quả
Thiết lập Thí nghiệm
- Dataset: Sử dụng tập dữ liệu NIH Chest X-ray (NIH-CXR) với giới tính và tuổi làm yếu tố nhiễu.
- Model Architecture: Sử dụng DenseNet121 đã được chứng minh đạt hiệu quả cao trong phân loại ảnh X-quang.
- So sánh với ERM: So sánh hiệu suất giữa các phiên bản ERM, ReConfirm, và Class-conditional ReConfirm.
Kết quả và Quan sát
- Giới tính làm yếu tố nhiễu:
- Với tập dữ liệu bị nhiễu bởi giới tính, ReConfirm cải thiện 2.46% độ chính xác (từ 84.23% lên 86.69%).
- Class-conditional ReConfirm đạt 87.18% độ chính xác, cao nhất trong tất cả các mô hình thử nghiệm.
- Tuổi làm yếu tố nhiễu:
- Với tập dữ liệu bị nhiễu bởi tuổi, ReConfirm cải thiện 3.28% độ chính xác (từ 82.77% lên 86.05%).
- Class-conditional ReConfirm đạt 86.22% độ chính xác khi chỉ áp dụng trên nhóm kiểm soát.
- Giảm tỷ lệ dương tính giả: Đặc biệt hiệu quả khi loại bỏ ảnh hưởng của giới tính trên bệnh nhân nữ, tỷ lệ dương tính giả giảm từ 14.41% xuống 7.18%.
Hướng phát triển trong tương lai
- Mở rộng cho dữ liệu hình ảnh 3D: Áp dụng trên ảnh CT và MRI để loại bỏ yếu tố nhiễu về tuổi và giới tính.
- Tích hợp với các mô hình khác: Kết hợp ReConfirm với Transformers để cải thiện khả năng tổng quát hóa.
- Ứng dụng trong lĩnh vực khác: Áp dụng ReConfirm trên các lĩnh vực khác như chẩn đoán bệnh tiểu đường hoặc phát hiện ung thư.