AI của DeepMind đánh bại các hệ thống đẳng cấp thế giới về dự đoán thời tiết

Mô hình AI tạo ra những dự đoán trước 15 ngày có xác suất chính xác hơn mô hình hàng đầu thế giới. Và nó còn tỏ ra vượt trội hơn về mặt thời gian.

Worldview, Earth Observing System Data and Information System (EOSDIS)/AP/Alamy
DeepMind Google đã phát triển mô hình AI đầu tiên của dạng này để dự đoán thời tiết chính xác hơn hệ thống xuất sắc nhất hiện đang được sử dụng. Mô hình nào tạo ra những dự đoán trước tới 15 ngày – và thực hiện trong ít phút, vượt trội tới hàng giờ so với những chương trình dự báo ngày nay.

Bão Hagibis trên đường đến Nhật Bản vào năm 2019. Cơn bão này là một trong những sự kiện dùng để nghiên cứu sự chính xác của hệ thống dự báo dựa trên AI. Credit: NASA

Hệ AI thuần túy đánh bại mô hình vận hành dự báo hạng vừa tốt nhất thế giới, đó là mô hình của Trung tâm dự báo thời tiết hạn vừa châu Âu (ENS) khi dự báo các hiện tượng thời tiết cực đoan như sóng nhiệt và bão nhiệt đới. Đột phá này có thể giúp mở ra kỷ nguyên dự báo thời tiết bằng AI nhanh hơn và tin cậy hơn so với các hệ thống ngày nay, các nhà nghiên cứu nói. Hệ thống này, GenCast, được miêu tả trong một bài báo trên Nature.

Dự báo thời tiết thông thường, bao gồm những dự báo từ ENS, dựa trên những mô hình toán học mô phỏng các lực của vật lý chi phối bầu khí quyển trái đất. Họ sử dụng các siêu máy tính để xử lý dữ liệu từ vệ tinh và các trạm thời tiết – một quá trình đòi hỏi mất nhiều giờ và ngốn rất nhiều nguồn lực tính toán.

GenCast, trái ngược với điều đó, đã được huấn luyện dựa trên dữ liệu thời tiết trong quá khứ, tăng cường hệ thống này bằng việc rút ra các mối quan hệ phức tạp giữa các biến như áp suất khí quyển, độ ẩm, nhiệt độ và gió. Điều đó giúp nó trở nên vượt trội so với các hệ vật lý, theo Ilan Price, một nhà nghiên cứu tại DeepMind Google ở London và là một trong số các tác giả của bài báo.

“Chúng tôi đang trong một quá trình tiến triển cực nhanh để bắt kịp và vượt qua các hệ vật lý đó bằng máy học”, Price nói.

Sự tiến công của AI

Dự báo thời tiết bằng AI đang tiến triển nhanh chóng, với rất nhiều công ty chạy đua để phát triển các mô hình mới tốt hơn, trong đó có Huawei2 ở Thâm Quyến, Trung Quốc và Nvidia ở Santa Clara, California. Đầu năm nay, Google ra mắt NeuralGCM3, một hệ lai kết hợp mô hình vật lý với AI để tạo ra những dự báo ngắn hạn và dài hạn trong sự kết cặp với các mô hình thông thường.

Một số hệ AI được ra mắt là các mô hình ‘tất định’, nghĩa là chúng chỉ đưa ra một dự đoán mà không ước tính khả năng dự báo đó chính xác hay không. Ngược lại, GenCast tạo ra dự báo “tập hợp”: một bộ thông tin dự báo mà mỗi dự báo lại có sự khác biệt nhỏ về các điều kiện hình thành. Bằng việc kết hợp các dự báo đó thành một tập hợp, các nhà khoa học có thể tạo ra một dự báo cuối cùng và ước tính xác suất thời tiết được dự báo sẽ có thể xảy ra.

Price và đồng nghiệp đã huấn luyện AI trên dữ liệu thời tiết toàn cầu từ năm 1979 đến năm 2018 và sau đó dự đoán thời tiết năm 2019. Để kiểm tra độ chính xác, họ so sánh dự báo của GenCast với dữ liệu thời tiết thực tế và dự báo của ENS cho năm đó.

GenCast chính xác hơn ENS trên 97% đo lường được sử dụng bằng bảng đánh giá dự báo “xác suất”. Đó là sự vượt trội về sự báo nhiệt cực đoan (nóng, lạnh) và gió cũng như quỹ đạo của xoáy thuận nhiệt đới.

GenCast tạo ra một dự báo 15 ngày trong vòng 8 phút trên một chip xử lý AI. Điều nay làm tăng tốc ‘nhanh một cách bền vững’ so với những mô hình thông thường, Price nói.

Mã cho tất cả

Các nhà nghiên cứu đã công khai mã cơ bản và khiến cho các tham số mô hình mà người ta gọi là ‘trọng số’ sẵn sàng cho sử dụng phi lợi nhuận. Price nói điều này giúp ‘dân chủ hóa’ nghiên cứu và gia tăng sự truy cập công khai để mô hình hóa thời tiết.

“Đây là một đóng góp thực sự lớn lao cho khoa học mở”, Matthew Chantry, một nhà điều phối máy học tại Trung tâm dự báo thời tiết hạn vừa châu Âu ở Reading, Anh, nói. “Chúng ta cần hiểu về cách các mô hình đó dự đoán về các sự kiện thời tiết ngày càng cực đoan hơn”, và việc xuất bản mô hình và dữ liệu đó một cách công khai sẽ cho phép cộng đồng nghiên cứu có thể truy cập chúng, ông nói.

Chantry đọc một bản thảo của bài báo đó khi nó được đưa lên một kho tiền ấn phẩm vào năm ngoái và được truyền cảm hứng từ cách tiếp cận ‘khuếch tán’ của GenCast, đưa nhiễu ngẫu nhiên vào mô hình để tinh chỉnh độ tin cậy của nó. “Chúng ta trên thực tế đã bổ sung một số đột phá chính vào mô hình máy học của chúng ta,” anh nói. Mô hình kết quả mà anh phát triển mang tên Hệ AI/dự báo tích hợp (AIFS) sẽ sớm được ra mắt, anh cho biết thêm.

Việc có những bản tin dự báo chính xác và nhanh hơn có thể giúp mọi người ra được quyết định, Price nói, đặc biệt cho những ai sống ở trên đường bão nhiệt đới đi qua.

Vũ Anh Phạm dịch từ Nature

Nguồn dịch: doi: https://doi.org/10.1038/d41586-024-03957-3