Chẩn đoán y tế AI có tỷ lệ chính xác trung bình là 52,1%, tương đương bác sĩ không chuyên khoa

Mạnh Quân
Mạnh Quân
Phản hồi: 0
Ngày 21/4/2025, một nhóm nghiên cứu do Tiến sĩ Hirotaka Takita và Phó Giáo sư Daiju Ueda từ Trường Y sau đại học của Đại học Osaka Metropolitan dẫn đầu đã công bố một nghiên cứu tổng hợp và phân tích hệ thống, nhằm đánh giá hiệu suất chẩn đoán của trí tuệ nhân tạo tổng quát (AI) và so sánh với các bác sĩ.

1745200759363.png

Nhóm đã sàng lọc 18.371 nghiên cứu và lựa chọn 83 nghiên cứu đáp ứng tiêu chí để phân tích chuyên sâu. Các nghiên cứu này đề cập đến nhiều mô hình AI tổng quát như GPT-4, Llama3 70B, Gemini 1.5 Pro và Claude 3 Sonnet, ứng dụng trong nhiều chuyên khoa y tế. Trong đó, GPT-4 là mô hình được nghiên cứu nhiều nhất.


Kết quả cho thấy, độ chính xác chẩn đoán trung bình của các mô hình AI là 52,1% (khoảng tin cậy 95%: 47,0% - 57,1%). Khi so sánh với các bác sĩ không chuyên ngành, AI cho thấy độ chính xác tương đương, với sự chênh lệch không đáng kể (0,6%, p = 0,93). Tuy nhiên, so với các bác sĩ chuyên khoa, AI vẫn kém hơn rõ rệt, với độ chênh lệch lên đến 15,8% (p = 0,007). Các nhà nghiên cứu nhận định rằng khoảng cách này có thể sẽ thu hẹp trong tương lai khi công nghệ phát triển hơn.

AI thể hiện hiệu suất ổn định trên hầu hết các lĩnh vực y tế, trừ hai ngoại lệ: da liễu và tiết niệu. Trong da liễu, AI có vẻ vượt trội nhờ khả năng nhận diện hình ảnh – một thế mạnh của công nghệ này. Tuy nhiên, do lĩnh vực da liễu cũng đòi hỏi suy luận lâm sàng và cá nhân hóa điều trị, nên hiệu quả thực tế của AI vẫn cần xem xét thêm. Riêng với chuyên ngành tiết niệu, kết luận còn hạn chế vì chỉ dựa trên một nghiên cứu quy mô lớn.

Các tác giả khẳng định rằng AI tổng quát có thể trở thành công cụ hỗ trợ đắc lực cho các bác sĩ không chuyên, đặc biệt tại những khu vực thiếu nguồn lực y tế. AI cũng có tiềm năng lớn trong giáo dục y khoa, có thể mô phỏng các tình huống thực tế giúp sinh viên và học viên y khoa luyện tập và đánh giá kỹ năng.

Dù vậy, nghiên cứu cũng chỉ ra những lo ngại liên quan đến tính minh bạch và thiên lệch trong dữ liệu huấn luyện của các mô hình AI. Nhiều mô hình hiện nay không công bố chi tiết dữ liệu đào tạo, đặt ra nghi vấn về khả năng áp dụng trên quy mô rộng và cho các nhóm bệnh nhân khác nhau. Vì thế, các nhà nghiên cứu nhấn mạnh cần phát triển các ứng dụng AI minh bạch, có đạo đức và được xác nhận đầy đủ.

Hiện tại, dù AI đã thể hiện tiềm năng rõ rệt trong chẩn đoán, nhưng trong các trường hợp lâm sàng phức tạp, bác sĩ vẫn là yếu tố then chốt. Câu hỏi về việc liệu AI có thể thay thế bác sĩ vẫn còn bỏ ngỏ – nhưng trong lĩnh vực chẩn đoán, khả năng này là có thật trong tương lai gần.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top