VnReview
Hà Nội

"Siêu sao dữ liệu" 27 tuổi dự đoán hầu như chính xác số người chết vì Covid-19 tại Mỹ

Một chàng trai trẻ người Mỹ đã trở thành siêu sao dữ liệu Covid-19 khi dự đoán chuẩn xác hầu hết số người chết vì dịch bệnh ở nước này trong khoảng thời gian dài.

Đầu năm 2020, với sự xuất hiện của đại dịch Covid-19, cả thế giới cố gắng đánh giá mức độ nguy hiểm của nó qua 2 hệ thống dự báo. Một là hệ thống được xây dựng bởi Đại học Hoàng gia London, Vương quốc Anh và hệ thống còn lại được thực hiện bởi Viện Đánh giá và Đo lường sức khỏe (IHME), có trụ sở tại Seattle, Mỹ.

Khi đó, hai mô hình này đưa ra các dự đoán một cách khác biệt. Hệ thống của Đại học Hoàng gia London dự báo rằng Mỹ có thể chứng kiến khoảng 2 triệu ca tử vong vì Covid-19 vào mùa hè năm ngoái. Trong khi đó, IHME thận trọng hơn nhiều, dự đoán có khoảng 60.000 người chết vì dịch bệnh vào tháng 8/2020. Kết quả cuối cùng là Mỹ có khoảng 160.000 người chết vì Covid-19 tính đến khoảng thời gian nói trên.

Sự khác biệt lớn trong dự báo của 2 mô hình kể trên thu hút sự chú ý của một nhà khoa học dữ liệu 26 tuổi có tên Youyang Gu. Chàng trai trẻ này có bằng thạc sĩ kỹ thuật điện và khoa học máy tính tại Học viện Công nghệ Massachusetts và một bằng khác về toán học nhưng không được đào tạo chính thức trong lĩnh vực liên quan đến đại dịch như y học hay dịch tễ học. Tuy nhiên, anh cho rằng mô hình dữ liệu của mình có thể phát huy tác dụng trong đại dịch.

"Siêu sao dữ liệu" dự đoán chính xác số người chết vì Covid-19 tại Mỹ

Vào tháng 4/2020, Gu khi đó đang sống với cha mẹ ở Santa Clara, California đã dành 1 tuần để xây dựng công cụ dự đoán số người chết vì Covid-19 của riêng mình. Ngoài ra, anh cũng thiết lập một trang web để thông báo số liệu về dịch tễ. Chẳng bao lâu sau, mô hình của anh đã cho ra kết quả chính xác hơn so với hệ thống của các tổ chức có hàng trăm triệu USD tài trợ và hàng chục năm kinh nghiệm.

Jeremy Howard, một chuyên gia dữ liệu và nhà khoa học nghiên cứu nổi tiếng tại Đại học San Francisco cho biết: 'Môt hình của Gu có vẻ là mô hình duy nhất mang lại hiệu quả. Các hệ thống khác được chứng minh là vô nghĩa hết lần này đến lần khác. Tuy nhiên, những người thiết lập chúng không hề xem xét để giải quyết vấn đề. Gu có vẻ là người thực sự xem xét dữ liệu về Covid-19 một cách nghiêm túc'.

Mô hình dự báo mà Gu xây dựng được thực hiện theo một cách khá đơn giản. Đầu tiên, anh xem xét các số liệu về số xét nghiệm virus SARS-CoV-2, số người nhập viện và các yếu tố khác để nhận thấy dữ liệu báo cáo của các bang và chính phủ là không nhất quán. Số liệu đáng tin cậy có vẻ là số người chết vì dịch bệnh hàng ngày.

Gu cho biết: 'Các mô hình khác sử dụng nhiều nguồn dữ liệu nhưng tôi quyết định chỉ dựa vào số người tử vong hàng ngày để dự đoán về những cái chết trong tương lai. Đó có vẻ là số liệu ít sai sót nhất'.

Mặc dù không phải là hoàn hảo nhưng mô hình của Gu đã hoạt động tốt ngay từ những thời điểm ban đầu. Vào cuối tháng 4/2020, anh dự đoán Mỹ sẽ có 80.000 người chết vì Covid-19 vào ngày 9/5. Số liệu chính xác khi đó là 79.926. Trong khi đó, cũng vào cuối tháng 4, IHME dự đoán Mỹ sẽ không vượt quá 80.000 ca tử vong trong cả năm 2020

Gu cũng dự đoán Mỹ sẽ có 90.000 ca tử vong vì Covid-19 vào ngày 18/5/2020 và 100.000 ca tử vong vào ngày 27/5/2020. Những dự đoán này một lần nữa lại rất sát với những gì đã xảy ra. IHME dự đoán virus SARS-CoV-2 sẽ biến mất tại Mỹ do sự cách ly xã hội và nhiều chính sách khác thì Gu lại cho rằng một làn sóng lây nhiễm mới sẽ xảy ra và số liệu tử vong sẽ tăng vọt tại nhiều bang khi biện pháp cách ly được dỡ bỏ. Một lần nữa Gu lại đúng.

Vào tháng 3 và 4 năm ngoái, IHME phải đối mặt với một số lời chỉ trích vì đưa ra các dự đoán không đúng. Tuy nhiên, đây là một nơi có uy tín và được quỹ Bill & Melinda Gates tài trợ hơn 500 triệu USD.

Vào ngày 19/4 năm ngoái, Gu đưa ra dự báo về làn sóng dịch thứ 2 tại Mỹ trong khi Tổng thống của nước này lúc bấy giờ là ông Donald Trump lại dẫn ra số liệu của IHME và cho rằng cuộc chiến chống dịch ở đây sẽ sớm kết thúc. Những người quản lý IHME tích cực quảng bá các số liệu của họ. Gu nói: 'IHME liên tục xuất hiện trên truyền thông và cho rằng số người chết vì Covid-19 sẽ về mức 0 vào tháng 7 năm ngoái. Việc đó thật vô ích bởi bất kỳ ai cũng có thể thấy rằng số người tử vong sẽ duy trì ở mức 1.000 - 1.500 trường hợp trong một thời gian'.

Ông Christopher Murray - Giám đốc của IHME cho rằng tổ chức này đã xử lý số liệu về virus SARS-CoV-2 tốt hơn và các dự báo của họ đã được cải thiện một cách đáng kể. Tuy nhiên, lúc đó người ta bắt đầu chú ý đến những tuyên bố của Gu nhiều hơn. Vào cuối tháng 4, một nhà sinh vật học nổi tiếng của Đại học Washington là Carl Bergstrom đã đăng tải mô hình của Gu lên Twitter. Không lâu sau đó, trung tâm kiểm soát và phòng ngừa dịch bệnh Mỹ (CDC) đưa các con số anh dự đoán lên trang web về Covid-19 của họ.

Khi đại dịch ngày càng phức tạp tại Mỹ, Gu thường xuyên dự họp với CDC và các chuyên gia thống kê, các chuyên gia dịch tễ học chuyên nghiệp. Cùng vào thời điểm đó, lưu lượng truy cập vào trang web của anh bùng nổ với hàng triệu người đăng ký tài khoản để cập nhập tình hình dịch bệnh nơi họ sống.

Với sự quan tâm sâu sắc của dư luận, Mỹ bùng nổ các mô hình dự đoán về số người nhiễm bệnh, tử vong vì Covid-19. Đến tháng 11 năm ngoái, Gu quyết định ngừng hoạt động mô hình của mình. Nicholas Reich - một chuyên gia tại Đại học Massachusetts cho rằng mô hình của Gu luôn nằm trong top đầu về sự chính xác và việc Gu ngừng dự án là vì thấy các hệ thống khác đang hoạt động tốt, công việc của mình đã hoàn thành.

Một tháng trước khi ngừng dự án, Gu cho rằng Mỹ sẽ có 231.000 người chết vì Covid-19 vào ngày 1/11. Con số chính xác thực tế là 230.995 người tử vong. Gu hiện nay đã bước sang tuổi 27, sống trong một căn hộ ở New York và đang tiếp tục tạo ra các mô hình dự đoán của mình. Hiện tại, anh đang tạo ra số liệu liên quan đến số lượng người Mỹ nhiễm Covid-19, tốc độ triển khai vắc xin và khả năng đạt được miễn dịch cộng đồng của nước này.

Trước đại dịch, Gu hy vọng sẽ có một công việc kinh doanh trong lĩnh vực phân tích thể thao. Hiện tại, anh đang xem xét việc gắn bó với sức khỏe cộng đồng.

Nguyễn Dương Theo Bloomberg

Chủ đề khác