DoD phát triển bộ dữ liệu thử nghiệm genAI có khả năng mở rộng

NhatDuy · 09:02, Thứ 7

Văn phòng Trí tuệ nhân tạo và Kỹ thuật số của Bộ Quốc phòng Hoa Kỳ (DoD) cùng tổ chức Humane Intelligence vừa hoàn thành chương trình thử nghiệm Đảm bảo đội đỏ trí tuệ nhân tạo (AI), tập trung thử nghiệm các chatbot mô hình ngôn ngữ lớn (LLM) trong dịch vụ y tế quân đội. Chương trình cải thiện chất lượng Chăm sóc y tế thông qua việc góp thủ các giải pháp quản lý rủi ro khi ứng dụng AI.

Gần đây, hơn 200 nhà cung cấp dịch vụ lâm sàng và nhà phân tích sức khỏe đã tham gia thử nghiệm, so sánh ba LLM cho hai trường hợp sử dụng: summ tắt ghi chú lâm sàng và chatbot tư vấn y tế. Qua đó, hơn 800 lỗ hổng và sai lệch ẩn đã được phát hiện , giúp nâng cao chất lượng dịch vụ y tế quân đội.

CAIRT hướng dẫn xây dựng cộng đồng thực hiện đánh giá thuật toán, hợp tác với Cơ quan Y tế Quốc phòng. Năm 2024, chương trình dự kiến tung ra "tiền thưởng thiên vị AI" nhằm phát hiện những rủi ro chưa biết trong LLM, hãy bắt đầu bằng cách mở nguồn chatbot. Những phát hiện này sẽ giúp xác định các danh sách chính và thực tiễn tốt nhất cho công việc sử dụng AI một cách có trách nhiệm trong Phòng Quốc gia.

Thử nghiệm liên tục qua chương trình CAIRT được đánh giá là quan trọng để cung cấp AI nhanh chóng và chứng minh tính đáng tin cậy trong các trường hợp sử dụng GenAI của DoD.

Đồng thời, sự tin tưởng vào AI là yếu tố rồi chốt để các bác sĩ lâm sàng ứng dụng công nghệ này. Tiến sĩ Sonya Makhni từ Mayo Clinic Platform nhấn mạnh, để đảm bảo an toàn khi sử dụng AI, cần đáp ứng kỳ vọng về hiệu suất, đảm bảo công cụ minh bạch, giải thích được và không gây thiên vị. Bà lưu ý rằng lỗi trong giả định phát triển AI có thể dẫn đến sai lệch kết quả, ảnh hưởng đến công việc chăm sóc sức khỏe.

Makhni khuyến nghị, bác sĩ lâm sẵn sàng và nhà phát triển phải hợp tác chặt chẽ phát triển vòng đời phát triển AI, dự đoán và gặp rủi ro về thiên đường, đảm bảo hiệu suất tối ưu. Điều này giúp xác định bối cảnh phù hợp nhất để áp dụng AI thuật toán, đồng thời giám sát kỹ năng càng trong các trường hợp cần thiết.

Tiến sĩ Matthew Johnson, người đứng đầu chương trình CAIRT, đã xác định chương trình này tạo cơ sở thu thập thử nghiệm dữ liệu lớn, khám phá các vấn đề tiềm ẩn và giải pháp xác thực giảm thiểu rủi ro. Những nỗ lực này sẽ định hình nghiên cứu và phát triển các hệ thống GenAI, đảm bảo khả năng phát triển khai an toàn trong tương lai.
Đọc chi tiết tại đây: https://www.healthcareitnews.com/news/dod-develop-scalable-genai-testing-datasets

Có thể bạn quan tâm

DoD phát triển bộ dữ liệu thử nghiệm genAI có khả năng mở rộng

NhatDuy

Writer

NhatDuy

Giấc mơ tàu siêu tốc Hyperlooptan nhanh 1.200km/h của Elon Musk giờ ra sao?

FDA hoàn thành giai đoạn đầu tiên của nghiên cứu về khả năng tiếp xúc với kim loại từ băng vệ sinh

Chutes & Ladders—Việc mua lại Vincerx dẫn đến sự thay đổi trong bộ phận C-suite

Người dân hoảng hốt tưởng bị tấn công quân sự khi "chiếc nhẫn" 500 Kg rơi xuống sau tiếng nổ lớn

Apple coi chừng, thị trường kính XR năm nay hứa hẹn sôi động hơn

Ở thời kỳ Thiên Long Bát Bộ, có cao thủ nào đánh bại được Tiêu Phong thần võ hay không?

Bị người đời cho là kẻ ngốc dại khờ, đây lại là các cao thủ trong thế giới kiếm hiệp Kim Dung

Geely bán được 2,1 triệu xe trong năm 2024, mục tiêu đạt 2,71 triệu xe vào năm 2025

Mặt trời lên thiên đỉnh là gì?

Mức tiền thưởng huân chương Lao động hạng 3 của các cầu thủ đội tuyển Việt Nam là bao nhiêu?

HLV Park Hang Seo hé lộ thông tin gì sau chiến thắng của tuyển Việt Nam tại AFF Cup 2024?

Viettel tung loạt ưu đãi xuyên suốt Tết Dương lịch và Tết Nguyên đán Ất Tỵ 2025

Samsung ra mắt The Frame Pro: cũng là Mini-LED mà nó lạ lắm

Nguyễn Xuân Son khi nào bình phục? Chi tiết về chấn thương của Nguyễn Xuân Son

Đánh giá nổi bật