Nghiên cứu các kỹ thuật học máy trong việc ước lượng và dự báo lượng mưa

Dự báo chính xác lượng mưa rất quan trọng trong nông nghiệp, quản lý nguồn nước và ứng phó thiên tai, giúp giảm thiểu thiệt hại do hạn hán, bão lũ. Tuy nhiên, khí hậu phức tạp và biến động đột ngột gây nhiều thách thức. Phương pháp truyền thống dựa trên radar, vệ tinh và mô hình vật lý tốn thời gian, ít linh hoạt. Trong khi đó, kỹ thuật học máy và học sâu đã chứng minh khả năng xử lý dữ liệu lớn, khám phá mẫu ẩn và nâng cao độ chính xác dự báo. Đề tài cấp Học viện 2025: “Nghiên cứu các kỹ thuật học máy trong việc ước lượng và dự báo lượng mưa”, mã số T2025-10-41 do ThS. Nguyễn Hữu Hải – Khoa Công nghệ thông tin chủ trì đã phát triển và cải tiến các kỹ thuật này nhằm nâng cao độ tin cậy của dự báo khí hậu.

Nghiên cứu tập trung phân tích, đánh giá các kỹ thuật học máy như Rừng ngẫu nhiên (Random Forest), Support Vector Machine (SVM), Mạng neuron nhiều lớp (MLP), cùng các thuật toán Boosting như XGBoost, Gradient Boosting. Mục tiêu là dự báo lượng mưa hàng ngày tại thành phố Vinh, Nghệ An – vùng khí hậu nhiệt đới gió mùa, thường xuyên xuất hiện các hiện tượng thời tiết cực đoan như mưa lớn, bão. Đồng thời, đề xuất phương pháp cải tiến dữ liệu đầu vào theo hướng đa bước, giúp mô hình phản ánh tốt hơn các mối quan hệ phi tuyến và phụ thuộc thời gian của dữ liệu khí tượng.

 Hình 1. Nhiệt độ lớn nhất, nhỏ nhất và nhiệt độ trung bình theo ngày giai đoạn 2014-2022
 Hình 2. Lượng mưa theo tháng giai đoạn 2014-2022
 Hình 3. Lượng mưa hằng năm giai đoạn 2014-2022

Kết qủa nghiên cứu cho thấy, các mô hình học máy, đặc biệt như XGBoost và Gradient Boosting đạt hiệu quả vượt trội so với phương pháp truyền thống. Khi áp dụng kỹ thuật cải tiến dữ liệu, hiệu quả dự báo còn tăng lên rõ rệt.

– Mô hình XGBoost đạt độ chính xác khoảng 86%, nhận diện chính xác các trận mưa lớn, giúp giảm thiểu tác động của các hiện tượng thời tiết cực đoan.

– Các mô hình khác như MLP, Gradient Boosting cũng cho kết quả khả quan, phù hợp để dự báo khí hậu, cảnh báo thiên tai.

 Hình 4. Tương quan giữa lượng mưa và các đặc trưng thời tiết quan trọng
 Hình 5. Ma trận tương quan giữa các đặc trưng thời tiết

Kết quả của đề tài giúp nâng cao khả năng dự báo lượng mưa chính xác, hỗ trợ công tác khí tượng thủy văn, quản lý nguồn nước, phòng chống thiên tai. Các tài liệu và bài báo khoa học của đề tài còn là nguồn dữ liệu tham khảo quý giá cho các nhà nghiên cứu, sinh viên và tổ chức trong lĩnh vực khí tượng và dữ liệu lớn.

 Hình 6. Sơ đồ tổng quan giải pháp cải tiến dữ liệu đa bước

Nghiên cứu chứng minh vai trò của các kỹ thuật học máy như RF và Boosting trong việc nâng cao độ chính xác dự báo lượng mưa, đặc biệt trong điều kiện khí hậu ngày càng biến đổi phức tạp. Các mô hình này xử lý tốt dữ liệu khí tượng phức tạp, nhiễu cao, giúp dự báo mưa lớn chính xác hơn, tăng độ tin cậy của dự báo khí tượng khu vực. Phương pháp cải tiến dữ liệu và mô hình kết hợp mở ra hướng đi mới cho công tác dự báo khí hậu tại Việt Nam và khu vực, góp phần ứng phó hiệu quả với biến đổi khí hậu.

Khoa Công nghệ thông tin