DoD phát triển bộ dữ liệu thử nghiệm genAI có khả năng mở rộng

NhatDuy
NhatDuy
Phản hồi: 0

NhatDuy

Writer
Văn phòng Trí tuệ nhân tạo và Kỹ thuật số của Bộ Quốc phòng Hoa Kỳ (DoD) cùng tổ chức Humane Intelligence vừa hoàn thành chương trình thử nghiệm Đảm bảo đội đỏ trí tuệ nhân tạo (AI), tập trung thử nghiệm các chatbot mô hình ngôn ngữ lớn (LLM) trong dịch vụ y tế quân đội. Chương trình cải thiện chất lượng Chăm sóc y tế thông qua việc góp thủ các giải pháp quản lý rủi ro khi ứng dụng AI.
1735956113503.png


Gần đây, hơn 200 nhà cung cấp dịch vụ lâm sàng và nhà phân tích sức khỏe đã tham gia thử nghiệm, so sánh ba LLM cho hai trường hợp sử dụng: summ tắt ghi chú lâm sàng và chatbot tư vấn y tế. Qua đó, hơn 800 lỗ hổng và sai lệch ẩn đã được phát hiện , giúp nâng cao chất lượng dịch vụ y tế quân đội.

CAIRT hướng dẫn xây dựng cộng đồng thực hiện đánh giá thuật toán, hợp tác với Cơ quan Y tế Quốc phòng. Năm 2024, chương trình dự kiến tung ra "tiền thưởng thiên vị AI" nhằm phát hiện những rủi ro chưa biết trong LLM, hãy bắt đầu bằng cách mở nguồn chatbot. Những phát hiện này sẽ giúp xác định các danh sách chính và thực tiễn tốt nhất cho công việc sử dụng AI một cách có trách nhiệm trong Phòng Quốc gia.

Thử nghiệm liên tục qua chương trình CAIRT được đánh giá là quan trọng để cung cấp AI nhanh chóng và chứng minh tính đáng tin cậy trong các trường hợp sử dụng GenAI của DoD.

Đồng thời, sự tin tưởng vào AI là yếu tố rồi chốt để các bác sĩ lâm sàng ứng dụng công nghệ này. Tiến sĩ Sonya Makhni từ Mayo Clinic Platform nhấn mạnh, để đảm bảo an toàn khi sử dụng AI, cần đáp ứng kỳ vọng về hiệu suất, đảm bảo công cụ minh bạch, giải thích được và không gây thiên vị. Bà lưu ý rằng lỗi trong giả định phát triển AI có thể dẫn đến sai lệch kết quả, ảnh hưởng đến công việc chăm sóc sức khỏe.

Makhni khuyến nghị, bác sĩ lâm sẵn sàng và nhà phát triển phải hợp tác chặt chẽ phát triển vòng đời phát triển AI, dự đoán và gặp rủi ro về thiên đường, đảm bảo hiệu suất tối ưu. Điều này giúp xác định bối cảnh phù hợp nhất để áp dụng AI thuật toán, đồng thời giám sát kỹ năng càng trong các trường hợp cần thiết.

Tiến sĩ Matthew Johnson, người đứng đầu chương trình CAIRT, đã xác định chương trình này tạo cơ sở thu thập thử nghiệm dữ liệu lớn, khám phá các vấn đề tiềm ẩn và giải pháp xác thực giảm thiểu rủi ro. Những nỗ lực này sẽ định hình nghiên cứu và phát triển các hệ thống GenAI, đảm bảo khả năng phát triển khai an toàn trong tương lai.
Đọc chi tiết tại đây: https://www.healthcareitnews.com/news/dod-develop-scalable-genai-testing-datasets
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top