نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشجوی کارشناسی ارشد گروه علوم و مهندسی آب، دانشکده کشاورزی، دانشگاه تبریز، تبریز، ایران
2 استاد گروه علوم و مهندسی آب، دانشکده کشاورزی، دانشگاه تبریز، تبریز، ایران
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
Abstract
The primary objective of this study was to evaluate the stability and generalizability of machine learning models under varying climatic conditions and identify the optimal approach for seasonal precipitation prediction. This research is novel in its first-time application of the hybrid CNN-BiLSTM model in the arid climate of Yazd, alongside a comparison with the humid climate of Rasht. The findings provided valuable insights for enhancing early warning systems and improving water resource management across different climates. To achieve this, we assessed the performance of 4 models: Support Vector Machine (SVM), Deep Neural Network (DNN), Bidirectional Long Short-Term Memory (BiLSTM), and the hybrid Convolutional Neural Network BiLSTM (CNN-BiLSTM). This evaluation utilized 28 years of climatic and precipitation data (1995–2022) from Rasht and Yazd stations. Two input scenarios were designed: the first included climatic parameters (minimum temperature, maximum relative humidity, average wind speed, and sunshine hours), while the second combined these parameters with 3 rainfall time lags. The dataset was divided into training and testing subsets using a ratio of 70:30. The results indicated that the second scenario significantly outperformed the first due to the inclusion of rainfall lags. In Yazd, the CNN-BiLSTM model achieved the best performance with a correlation coefficient of 0.89, a Root Mean Square Error (RMSE) of 7.48 mm, and a Nash–Sutcliffe efficiency of 0.76. In Rasht, the same model produced even better results, with a correlation coefficient of 0.94, an RMSE of 61.89 mm, and a Nash–Sutcliffe efficiency of 0.90. These findings underscore the effectiveness of hybrid deep learning architectures in capturing complex spatio-temporal precipitation patterns across diverse climatic conditions.
Keywords: Arid and Humid Climate, Precipitation Prediction, Seasonal Modeling, Deep Learning, CNN-BiLSTM.
Introduction
Rainfall is a fundamental component of the hydrological cycle, playing a crucial role in water supply, agricultural planning, flood control, drought mitigation, and environmental management. Accurate seasonal rainfall forecasting remains a significant challenge in water and climate sciences, directly influencing management decisions, sustainable development, and food security. With the intensification of climate change and increasing irregularities in rainfall patterns, the demand for timely and reliable forecasts of this complex climatic variable has become increasingly critical.
The nonlinear, complex, and stochastic nature of rainfall resulting from the interaction of multiple climatic and atmospheric factors makes its prediction a challenging scientific and technical task. Factors like temperature, humidity, wind speed, solar radiation, rainfall intensity and duration, evaporation, and large-scale teleconnection phenomena, such as the Madden–Julian Oscillation (MJO), significantly affect rainfall variability, creating highly intricate interdependencies.
Recent advances in machine learning and deep learning have enabled more effective modeling of these nonlinear and complex relationships. Traditional methods, such as linear regression and time series models, are limited by their linear assumptions and their inability to capture dynamic dependencies. In contrast, modern models—such as Support Vector Machines (SVMs), Artificial Neural Networks (ANNs), Recurrent Neural Networks (RNNs), and particularly advanced hybrid architectures like CNN-BiLSTM—have shown promising accuracy in modeling and forecasting climatic variables.
However, most existing research has focused on humid and semi-humid regions, with relatively few studies addressing arid and semi-arid zones, particularly in Iran. These regions characterized by low and irregular rainfall require more sophisticated modeling and detailed analysis. Additionally, comparative evaluations of models across contrasting climatic zones can provide valuable insights into model robustness and generalizability, which are essential for enhancing forecasting systems.
Thus, the main objective of this study was to assess the performance and generalizability of 4 machine learning and deep learning models—SVM, DNN, BiLSTM, and CNN-BiLSTM—in predicting seasonal rainfall in two climatically distinct regions: Rasht (humid) and Yazd (arid). This research pioneered the application of the CNN-BiLSTM model in the arid climate of Yazd and compares its performance with that in the humid climate of Rasht, offering practical recommendations for flood early-warning systems and water resource management.
Materials & Methods
The dataset utilized in this research comprised seasonal climate and rainfall data from the meteorological stations of Rasht and Yazd over a 28-year period (1995–2022). The climatic variables included minimum temperature, maximum relative humidity, average wind speed, and sunshine duration, along with seasonal rainfall data.
Two input scenarios were designed to assess the impact of past rainfall data on model performance: Scenario 1 included only the climatic parameters, while Scenario 2 combined these with 3 rainfall time lags. These scenarios aimed to evaluate how different input configurations influenced the predictive capabilities of the models.
The dataset was divided into 70% for training and 30% for testing, following standard practices in machine learning research. The four main models employed in the study were:
SVM (Support Vector Machine): A classic machine learning model known for its effectiveness in modeling nonlinear relationships
DNN (Deep Neural Network): Capable of learning complex patterns and features from high-dimensional data
BiLSTM (Bidirectional Long Short-Term Memory): Effective at capturing long- and short-term dependencies from both forward and backward temporal directions
CNN-BiLSTM (Convolutional Neural Network – BiLSTM): A hybrid architecture where the CNN extracts spatial and short-term features, while the BiLSTM models temporal dependencies
The CNN component employs convolutional filters to reduce noise and extract local patterns, while the BiLSTM component captures bidirectional temporal relationships. This hybrid design enabled the model to effectively reconstruct complex rainfall patterns across diverse climatic conditions.
The performances of the models were evaluated using 4 criteria: Correlation Coefficient (R), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), and Nash-Sutcliffe Efficiency (NSE). Each of these metrics reflected different aspects of the model's accuracy and reliability.
Research Findings
The results clearly demonstrated the effectiveness of Scenario 2, which incorporated past rainfall data, in enhancing model performance. The inclusion of lagged rainfall significantly improved prediction accuracy across both regions.
In the humid and complex climate of Rasht, the CNN-BiLSTM model achieved impressive results with a correlation coefficient (R) of 0.94, a Root Mean Square Error (RMSE) of 61.89 mm, and a Nash-Sutcliffe Efficiency (NSE) of 0.90. The model effectively captured intricate and variable rainfall patterns, providing accurate seasonal forecasts.
In Yazd characterized by sporadic and irregular rainfall, the CNN-BiLSTM model still demonstrated high accuracy, achieving an R of 0.89, an RMSE of 7.48 mm, and an NSE of 0.76. These results highlighted the model's robustness, even under challenging climatic conditions.
The BiLSTM model ranked second due to its bidirectional temporal memory followed by the DNN and SVM models, which were less effective in capturing complex temporal dependencies. The differences in performance were particularly evident during extreme rainfall events and periods of seasonal variability.
These findings confirmed the importance of incorporating past rainfall data as model input, as well as the superiority of deep and hybrid architectures in addressing temporal and nonlinear relationships. The results aligned with similar studies and underscored the value of memory-based and hierarchical feature extraction models.
Discussion of Results & Conclusion
Incorporation of rainfall time lags significantly improved the predictive accuracy of all models, especially in irregular climates like that in Yazd. Notably, the CNN-BiLSTM model surpassed all other models in both regions, highlighting the benefits of hybrid deep learning architectures for managing complex spatiotemporal data.
This study enhanced the broader understanding of intelligent forecasting systems for climate-related applications. It illustrated the adaptability and robustness of the CNN-BiLSTM model across various climatic conditions, providing reliable support for decision-making in water management, agricultural planning, and disaster preparedness.
To further enrich this research, it is recommended to integrate satellite and radar datasets, expand temporal data coverage, and assess model performance across wider and more diverse geographical regions. These initiatives will strengthen the accuracy and generalizability of seasonal rainfall forecasts.
کلیدواژهها [English]
مقدمه
بارش یکی از مؤلفههای اصلی چرخه هیدرولوژیکی است که نقش حیاتی در تأمین منابع آب، برنامهریزی کشاورزی، کنترل سیلاب و مقابله با خشکسالی ایفا میکند (Ali et al., 2018; Bagirov et al., 2017). پیشبینی دقیق و قابل اعتماد بارندگی، بهویژه در مقیاس فصلی، ضرورتی انکارناپذیر برای مدیریت پایدار منابع آب، طراحی سامانههای هشدار سیلاب و ارتقای بهرهوری در بخش کشاورزی بهشمار میرود. از سوی دیگر، تغییرات اقلیمی و نوسانات شدید در الگوهای بارش، چالشهای متعددی در پیشبینی این متغیر پیچیده ایجاد کرده است (Yilmaz, 2015). فرایند بارش از نظر مکانی و زمانی ماهیتی غیرخطی و تصادفی دارد و تحت تأثیر عوامل مختلفی چون دما، فشار، رطوبت، باد، تابش خورشید، شدت و مدت بارندگی، تبخیر و حتی پدیدههای جوی دورپیوندی نظیر نوسان مادن-ژولین قرار میگیرد (Pariyar et al., 2020; Liyew et al., 2021). در چنین شرایطی، استفاده از مدلهای پیشرفته که قادر به درک روابط پیچیده و غیرخطی میان متغیرهای اقلیمی باشند، ضرورتی اجتنابناپذیر است. در سالهای اخیر، مدلهای یادگیری ماشین و عمیق بهطور گسترده برای مدلسازی روابط غیرخطی در علوم جوی بهکار رفتهاند. در این میان، مدلهای کلاسیک مانند رگرسیون خطی و سریهای زمانی به دلیل وابستگی به فرضیات خطی و ناتوانی در شناسایی روابط پیچیده میان متغیرهای اقلیمی، کارایی محدودی در پیشبینی بارش داشتهاند. در مقابل، مدلهای یادگیری ماشین نظیر ماشین بردار پشتیبان (SVM)، جنگل تصادفی (Random Forest) و پرسپترون چندلایه[1] (MLP) در مطالعات متعددی نتایج بهتری از خود نشان دادهاند (Mosavi et al., 2018). ستاری و همکاران (1392) در بررسی حداکثر بارش روزانه در ایستگاههای اهر و جلفا دریافتند که مدل درختی M5 با ساختار ساده و تفسیرپذیر، قابلیت زیادی در مدلسازی بارش ماهانه دارد. مدلهای یادگیری عمیق به دلیل معماری پیچیده خود در شناسایی الگوهای پنهان، نسبت به سایر مدلها از دقت بالاتری برخوردارند. موسوی و همکاران در مرور جامعی نشان دادند که مدلهایی نظیر شبکه عصبی مصنوعی، SVM، درخت تصمیم و ترکیبی، دقت بالاتری نسبت به روشهای آماری در پیشبینی سیلاب دارند (Mosavi et al., 2018). فهاد و همکاران با توسعه مدلی مبتنی بر واحد بازگشتی دروازهای (GRU) برای پیشبینی بارش در پاکستان طی دوره 1991 تا 2020 نشان دادند که حذف دادههای پرت و انتخاب ویژگیهای مؤثر، نقش کلیدی در بهبود عملکرد مدلهای عمیق ایفا میکند (Fahad et al., 2023). شو و همکاران با معرفی مدل ترکیبیDC-CNN-BiLSTM برای پیشبینی بارش در چین نشان دادند که ترکیب کانولوشنهای علّی و توسعهیافته با شبکه حافظه کوتاهمدت و بلندمدت دوسویه (BiLSTM) میتواند ویژگیهای مکانی - زمانی بارش را با دقت بالاتری شناسایی کند (Shu et al., 2025). وانگ و همکاران با توسعه مدلی هیبریدی مبتنی بر CNN-LSTM برای پیشبینی شاخص چندبعدی بارش در ایالت مهاراشترا هند (شهر پونه) طی دوره 1972 تا 2002 نشان دادند که این مدل توانایی بالایی در شناسایی ویژگیهای محلی و وابستگیهای بلندمدت زمانی دارد (Wang et al., 2025)؛ با این حال، پژوهش مذکور تأکید کرده است که این مدل در مقیاسهای بزرگ به منابع محاسباتی بالایی نیاز دارد و پیشبینی دادههای چندبعدی بارش همچنان نیازمند بهبود است. با وجود پیشرفتهای چشمگیر در این حوزه، بررسی مطالعات موجود نشان میدهد که تمرکز عمده این پژوهشها بر مناطق مرطوب و نیمهمرطوب بوده و کاربرد این مدلها در مناطق خشک ایران، بهویژه شهر یزد، کمتر بررسی شده است. این در حالی است که مناطق خشک به دلیل آسیبپذیری بیشتر در برابر تغییرات اقلیمی و کمبود منابع آبی، به مطالعات دقیقتری در این زمینه نیاز دارند. همچنین، مقایسه عملکرد مدلها در اقلیمهای متضاد میتواند درک دقیقتری از پایداری و تعمیمپذیری آنها فراهم کند. در این پژوهش، با استفاده از دادههای اقلیمی و هواشناسی طی دوره ۲۸ساله (۱۹۹۵ تا ۲۰۲۲)، عملکرد چهار مدل یادگیری پیشرفته شامل شبکه عصبی عمیق (DNN)، ماشین بردار پشتیبان (SVM)، شبکه بازگشتی دوسویه (BiLSTM) و مدل ترکیبی CNN-BiLSTM برای پیشبینی بارش فصلی بررسی شده است. در این راستا، دو منطقه با اقلیم کاملاً متضاد، شامل اقلیم مرطوب رشت و اقلیم خشک یزد، بهعنوان مطالعه موردی انتخاب شدند. هدف اصلی تحقیق، ارزیابی دقت، پایداری و قابلیت تعمیم این مدلها در شرایط اقلیمی متفاوت و شناسایی مناسبترین مدل برای پیشبینی بارش فصلی است و مقصود از مدلسازی، پیشبینی داده محور با مدلهای یادگیری ماشین است. نوآوری پژوهش حاضر، بهکارگیری مدل ترکیبی CNN-BiLSTM برای نخستینبار در منطقه خشک یزد و مقایسه آن با نتایج منطقه مرطوب رشت است؛ یافتههایی که میتوانند در ارتقای سامانههای پیشآگاهی سیلاب و مدیریت منابع آب در اقلیمهای مختلف کشور نقش مؤثری ایفا کنند.
روششناسی پژوهش
این پژوهش از نوع کاربردی و مبتنی بر پیشبینی دادهمحور با استفاده از روشهای یادگیری ماشین و یادگیری عمیق انجام شده است. در این راستا، دادههای بارش فصلی دو ایستگاه رشت و یزد طی دوره ۲۸ساله (۱۹۹۵ تا ۲۰۲۲) برای آموزش، ارزیابی و صحتسنجی مدلها بهکار گرفته شد. انتخاب این دو ایستگاه که نماینده اقلیمهای کاملاً متفاوت مرطوب خزری (رشت) و خشک بیابانی (یزد) هستند، امکان مقایسه دقیقتر توانایی مدلها در پیشبینی بارش را در شرایط اقلیمی متضاد فراهم ساخت. ایستگاه رشت در مختصات جغرافیایی37 درجه و 16 دقیقه عرض شمالی و 49 درجه و 36 دقیقه طول شرقی واقع شده است و دارای اقلیم مرطوب خزری است. ایستگاه یزد نیز در محدوده طول جغرافیایی 31 درجه و ۵4 دقیقه عرض شمالی و 54 درجه و 22 دقیقه طول شرقی قرار دارد و اقلیم خشک بیابانی را داراست (حیدریعلمدارلو و همکاران، 1398). ویژگیهای آبوهوایی این دو ایستگاه در جدول ۱ ارائه شده است و موقعیت جغرافیایی آنها در شکل ۱ نمایش داده شده است.
شکل 1: موقعیت جغرافیایی ایستگاههای رشت و یزد (منبع: نویسندگان)
Figure 1: Geographical location of the stations of Rasht and Yazd (Source: Authors)
جدول 1: ویژگیهای آبوهوایی ایستگاههای رشت و یزد (منبع: سازمان هواشناسی شهر یزد و رشت)
Table 1: Weather characteristics of Rasht and Yazd stations (Source: Yazd and Rasht Meteorological Organization)
|
ایستگاه رشت |
ایستگاه یزد |
ویژگیهای آماری ایستگاه |
|
°C40 |
°C 56 |
بیشینه دمای ثبتشده |
|
°C19- |
°C 12- |
کمینه دمای ثبتشده |
|
1359 میلیمتر |
2/59 میلیمتر |
میانگین بارش سالانه |
|
138 روز |
27 روز |
تعداد روزهای بارانی |
|
170 میلیمتر |
9 میلیمتر |
حداکثر بارش ۲۴ ساعته |
متغیرهای هواشناسی استفادهشده در این پژوهش شامل پارامترهای حداقل دما (°c)، حداکثر رطوبت نسبی (%)، سرعت باد میانگین (m/s) و ساعات آفتابی (h) و سه تأخیر بارش فصلی (mm) بهعنوان پارامتر پیشبینی کننده و میزان بارش فصلی (mm) بهعنوان پارامتر وابسته است که در دوسناریوی مختلف با ترکیبی متفاوت از پارامترهای ورودی مورد توجه قرار گرفت. سناریو اول شامل، پارامترهای هواشناسی و سناریو دوم ادغام پارامترهای هواشناسی با تأخیرهای بارش فصلی است. انتخاب تاخیرهای زمانی براساس تحلیل سریهای زمانی و مطالعات پیشین صورت گرفت. پژوهشهایی مانند(2017) Qin et al. و (2025) Guo et al. نشان دادهاند که بارش فصلی دارای وابستگیهای زمانی تا چند فصل گذشته است و لحاظ این تأخیرها موجب افزایش دقت پیشبینی در مدلهای یادگیری عمیق میشود؛ بنابراین، سه تأخیر فصلی انتخاب شد تا حافظه زمانی بارش در ورودی مدلها لحاظ شود. دادههای استفادهشده در این پژوهش، قبل از انجام فرآیند مدلسازی مورد بررسی آماری و صحتسنجی قرار گرفت. مشخصات آماری هر ایستگاه در جدول ۲ ارائه شدهاند تا نشان داده شود که هر دو ایستگاه از نظر میانگین، انحراف معیار و دامنه تغییرات، نماینده ساختار کلی دادهها هستند.
جدول 2: مشخصات آماری پارامترهای آب و هواشناسی ایستگاههای رشت و یزد در مقیاس فصلی (منبع: نویسندگان)
Table 2: Statistical characteristics of weather and meteorological parameters of Rasht and Yazd cities on a seasonal scale (Source: Authors)
|
یزد |
||||||||
|
بارش |
تأخیر سوم |
تأخیر دوم |
تأخیر اول |
ساعات آفتابی |
حداکثر رطوبت نسبی |
حداقل دما |
میانگین سرعت باد |
آماری |
|
(میلیمتر) |
(میلیمتر) |
(میلیمتر) |
(میلیمتر) |
(ساعت) |
(%) |
(درجه سلسیوس) |
(متر بر ثانیه) |
|
|
64/105 |
64/105 |
64/105 |
64/105 |
1107 |
93/80 |
36/25 |
54/3 |
بیشینه |
|
25/13 |
79/12 |
17/13 |
67/12 |
17/851 |
52/40 |
48/13 |
6/2 |
میانگین |
|
0 |
0 |
0 |
0 |
1/549 |
83/15 |
29/0- |
27/1 |
کمینه |
|
1/7 |
1/7 |
1/7 |
04/7 |
95/837 |
63/40 |
09/13 |
7/2 |
میانه |
|
48/16 |
96/15 |
5/16 |
85/15 |
01/147 |
44/15 |
84/7 |
47/0 |
انحراف معیار |
|
رشت |
||||||||
|
بارش |
تأخیر سوم |
تأخیر دوم |
تأخیر اول |
ساعات آفتابی |
حداکثر رطوبت نسبی |
حداقل دما |
میانگین سرعت باد |
آماری |
|
(میلیمتر) |
(میلیمتر) |
(میلیمتر) |
(میلیمتر) |
(ساعت) |
(%) |
(درجه سلسیوس) |
(متر بر ثانیه) |
|
|
79/802 |
79/802 |
79/802 |
79/802 |
766 |
72/99 |
68/22 |
08/2 |
بیشینه |
|
06/317 |
66/316 |
76/315 |
28/318 |
29/443 |
58/96 |
45/12 |
36/1 |
میانگین |
|
91/50 |
91/50 |
91/50 |
91/50 |
9/122 |
25/91 |
09/1 |
43/0 |
کمینه |
|
05/289 |
05/289 |
05/289 |
4/293 |
65/410 |
65/96 |
38/12 |
46/1 |
میانه |
|
2/182 |
02/182 |
62/182 |
05/182 |
59/155 |
64/1 |
17/6 |
37/0 |
انحراف معیار |
شاخصهای آماری بیانگر تفاوتهای اقلیمی چشمگیر بین رشت و یزد هستند. میانگین بارش فصلی در رشت برابر با 06/317 میلیمتر و در یزد تنها 25/13 میلیمتر است. دمای میانگین در یزد با 48/13 درجه سانتیگراد، نوسانات بیشتری نسبت به رشت (45/12 درجه سانتیگراد) دارد. رطوبت نسبی بیشینه در رشت بالا و پایدار (58/96 درصد) و در یزد پایینتر و ناپایدارتر (52/40 درصد) است. ساعات آفتابی در یزد 17/851 و در رشت 29/443 ساعت گزارش شده است. همچنین میانگین تأخیر بارشها در رشت بسیار بیشتر از یزد بوده است. این تفاوتها، لزوم بهکارگیری مدلهای متناسب با ساختار اقلیمی هر منطقه را نشانمیدهند.
مدلسازی در این پژوهش با استفاده از نرمافزار Python و چهار الگوریتم یادگیری ماشین و یادگیری عمیق شامل CNN-BiLSTM، BiLSTM، DNN و SVM انجام شد. بهمنظور آموزش و ارزیابی مدلها، دادههای بارش فصلی و پارامترهای اقلیمی طی دوره ۲۸ساله (۱۹۹۵-۲۰۲۲) بهصورت ترتیبی و براساس زمان به دو بخش تقسیم شدند، ۷۰% ابتدایی دوره (۱۹۹۵-۲۰۱۵) برای آموزش و ۳۰% انتهایی دوره (۲۰۱۶-۲۰۲۲) برای صحتسنجی. این تقسیمبندی سری زمانی از نشت اطلاعات آینده به مدل جلوگیری میکند و ارزیابی واقعگرایانهتری از عملکرد مدلها فراهم میسازد. بهمنظور اطمینان از نمایندگی هر دو بخش از کل دادهها مشخصات آماری جداگانه برای دادههای آموزش و صحتسنجی در ایستگاههای رشت و یزد محاسبه شد (جدول 3). نتایج نشان داد که میانگین، انحراف معیار، کمینه و بیشینه بارش در هر بخش اختلاف چشمگیری با کل دادهها ندارند؛ بنابراین، هر دو بخش بهخوبی ساختار کلی سری زمانی را نمایندگی میکنند. همچنین، فرآیند نرمالسازی دادهها با استفاده از روش Min-Max normalizationدر محیط Python انجام شد. این نرمالسازی دادهها را به بازه [0,1] تبدیل کرد و موجب بهبود عملکرد مدلها، افزایش پایداری در آموزش و تطابق بهتر با ویژگیهای الگوریتمهای مورد استفاده شد. پیش از انجام مدلسازی، دادههای بارش فصلی و پارامترهای اقلیمی مورد بررسی آماری و پیشپردازش قرار گرفتند. ابتدا دادهها از نظر وجود نواقص و مقادیر گمشده بررسی شدند. در مواردی که دادههای گمشده محدود و مربوط به یک فصل بودند، از روش میانگینگیری فصلی ایستگاه مربوطه برای جایگزینی استفاده شد. در مواردی که دادههای گمشده متوالی یا گسترده بودند، آن فصل از تحلیل حذف شد تا از ورود نویز به مدل جلوگیری شود. فلوچارت مراحل مدلسازی و پیشبینی بارش فصلی در شکل 2 نمایش داده شده است.
جدول 3: ویژگیهای آماری دادههای آموزش و صحتسنجی در ایستگاههای رشت و یزد (منبع: نویسندگان)
Table 3. Statistical characteristics of the training and validation data at Rasht and Yazd stations (Source: Authors)
|
انحراف معیار |
کمینه (mm) |
بیشینه (mm) |
میانگین بارش (mm) |
تعداد نمونه |
بخش داده |
ایستگاه |
|
76/178 |
67/52 |
79/802 |
78/317 |
78 |
آموزش |
رشت |
|
42/192 |
91/50 |
36/743 |
44/315 |
34 |
آزمون |
رشت |
|
04/17 |
0 |
64/105 |
98/12 |
78 |
آموزش |
یزد |
|
39/15 |
0 |
41/56 |
86/13 |
34 |
آزمون |
یزد |
شکل 2: فلوچارت مراحل پیشبینی بارش فصلی (منبع: نویسندگان)
Figure 2: Flowchart of seasonal precipitation forecasting steps (Source: Authors)
شبکه عصبی پیچشی - بازگشتی (CNN-BiLSTM)
مدل CNN-BiLSTM یک معماری هیبریدی یادگیری عمیق است که از شبکههای عصبی کانولوشنی[2] (CNN) برای استخراج ویژگیهای محلی و نوسانات کوتاهمدت در دادههای چندمتغیره زمانی استفاده میکند و سپس با بهرهگیری از شبکههای حافظه بلندمدت و کوتاهمدت دوطرفه[3] (BiLSTM)، وابستگیهای زمانی بلندمدت و غیرخطی را از هر دو جهت زمانی مدلسازی میکند ( Ismail Fawaz et al., 2019; Lim et al., 2021). CNN با اعمال فیلترهای چندبعدی بر ورودی، سیگنالهای مهم را تقویت و نویز را کاهش میدهد و همبستگیهای مکانی بین متغیرها را استخراج میکند. خروجی CNN به BiLSTM منتقل میشود تا روابط پیچیده زمانی از گذشته به آینده و بالعکس تحلیل شود ( Lim et al., 2021; Cao et al., 2025). درنهایت، ویژگیهای استخراجشده به لایههای کاملاً متصل (Fully Connected) داده میشود و پیشبینی نهایی صورت میگیرد. آموزش مدل معمولاً با الگوریتم Adam و توابع هزینه MSE یا MAE انجام میشود (Huang et al., 2014). فرمول کلی خروجی یک فیلتر کانولوشنی یکبعدی در رابطه 1 بهصورت زیر آورده شده است:
(1)
که در آن ویژگی استخراجشده در زمان t توسط فیلتر k، ω پهنای فیلتر، وزنهای فیلتر کانولوشنی، داده ورودی در زمان t+i، بایاس فیلتر، k تعداد فیلترها و (⋅)𝑓 یک فعالسازی غیرخطی (مثلاً ReLU) است. خروجی این بخش به شبکه BiLSTM منتقل میشود تا وابستگیهای زمانی بلندمدت و غیرخطی از دو جهت (گذشته به آینده و آینده به گذشته) مدلسازی شوند. معادلات بازگشتی BiLSTM در رابطه 2 و 3 بهصورت زیر بیان شده است:
(2)
(3)
که در آن بردار حالت مخفی در جهت رو به جلو، بردار حالت مخفی در جهت رو به عقب، ویژگیهای استخراجشده توسط CNN در زمان t و بردار نهایی ترکیبشده (concat) از دو جهت. چارچوب CNN-BiLSTM لایههای کانولوشنی را برای استخراج ویژگیهای محلی با لایههای LSTM دوطرفه برای ثبت وابستگیهای بلندمدت ترکیب میکند و آن را برای وظایف پیشبینی سریهای زمانی مؤثر میسازد (Marjani et al., 2024). مدل CNN‑BiLSTM بهمنظور مدلسازی دادههای چندمتغیره زمانی طراحی و پیادهسازی شد. در این معماری، ابتدا سه لایه کانولوشنی (Conv1D) با ۱۲۸ فیلتر و اندازه کرنل ۱ بهکار گرفته شد تا ویژگیهای محلی و نوسانات کوتاهمدت از دادهها استخراج شوند. خروجی این بخش به دو لایه حافظه بلندمدت و کوتاهمدت دوطرفه (Bidirectional LSTM) با ۷۴ و ۶۴ واحد منتقل شد. بهمنظور کاهش بیشبرازش، در این لایهها از dropout با نرخهای 2/0 و 4/0 و همچنین recurrent dropout با مقادیر 1/0 و 8/0 استفاده شد. در ادامه، یک لایه Dense با ۳۲ نرون و تابع فعالسازی ReLU و درنهایت یک لایه خروجی با تابع فعالسازی خطی به مدل افزوده شد تا پیشبینی نهایی انجام شود. فرآیند آموزش مدل با استفاده از الگوریتم Adam و نرخ یادگیری 0004/0 انجام شد. تابع هزینه انتخابشده log-cosh بود که در مقایسه با MSE و MAE عملکرد بهتری در دادههای نوسانی ارائه داد. مدل در ۲۰ دوره (epoch) و با اندازه دسته (batch size) برابر با ۶ آموزش داده شد. پیش از آموزش، دادهها با استفاده از نرمالسازی Min-Max مقیاسبندی شدند. در این مدل از معیار توقف زودهنگام (Early Stopping) استفاده نشد و مقدار seed بهصورت صریح تنظیم نشد. در جدول 4 جزئیات معماری مدل ارائه شده است.
جدول 4: جزئیات معماری مدل CNN-BiLSTM (منبع: نویسندگان)
Table 4: Architectural details of the CNN-BiLSTM model (Source: Authors)
|
Parameter (CNN-BiLSTM) |
Value / Description |
|
Optimizer |
Adam (learning rate = 0.0004) |
|
Loss Function |
Log-cosh |
|
Epochs |
20 |
|
Batch Size |
6 |
|
Dropout Rate |
0.2 (first BiLSTM layer), 0.4 (second BiLSTM layer) |
|
Recurrent Dropout |
0.1 (first BiLSTM layer), 0.8 (second BiLSTM layer) |
|
Activation Functions |
ReLU (Conv1D and Dense layers), tanh (BiLSTM layers), Linear (output layer) |
|
Normalization Method |
Min-Max scaling applied to both input features and target variable |
|
Sequence Window Size |
1 |
|
Early Stopping |
Not applied |
|
Random Seed |
Not explicitly set |
|
Hyperparameter Tuning |
Manual trial-and-error; selected based on RMSE and NSE on validation data |
شبکه عصبی بازگشتی دوسویه (BiLSTM)
شبکههای BiLSTM نوعی خاص از شبکههای عصبی بازگشتی[4] (RNN) هستند که دارای دو مسیر زمانی مجزا هستند: یکی به جلو (از گذشته به آینده) و دیگری به عقب (از آینده به گذشته). این معماری دوطرفه امکان درک همزمان اطلاعات گذشته و آینده و مدلسازی دقیقتر وابستگیهای زمانی بلندمدت را فراهم میکند. در ساختار هر واحد LSTM سه دروازه اصلی وجود دارد: فراموشی (Ft)، ورودی (It) و خروجی (Ot) که بهطور مداوم وضعیت حافظه سلولی را کنترل و بهروزرسانی میکنند. در هر گام زمانی، این دروازهها ورودی فعلی و خروجی مرحله قبلی را پردازش کرده و به مدل اجازه میدهند تا وابستگیهای زمانی پیچیده و غیرخطی را یاد بگیرد (Guo et al., 2025). مدل شبکه عصبی بازگشتی دوسویه (BiLSTM) با هدف مدلسازی وابستگیهای زمانی بلندمدت و غیرخطی در دادههای چندمتغیره طراحی و پیادهسازی شد. این مدل از سه لایه بازگشتی دوطرفه (Bidirectional LSTM) بهره میبرد که بهترتیب دارای ۱۲۸، ۱۲۸ و ۱۶ واحد هستند. لایههای اول و دوم بهصورت دنبالهدار (return_sequences=True) تعریف شدند تا خروجی هر گام زمانی به گام بعدی منتقل شود. پس از هر یک از این دو لایه، از لایه Dropout با نرخ 3/0 استفاده شد تا از بیشبرازش جلوگیری شود. در ادامه، یک لایه Dense با ۱۰ نرون و تابع فعالسازی ReLU و در نهایت یک لایه خروجی با تابع فعالسازی خطی برای پیشبینی مقدار بارش به مدل افزوده شد. فرآیند آموزش مدل با استفاده از الگوریتم Adam و تابع هزینه MAE انجام شد. مدل در ۱۰۰ دوره (epoch) و با اندازه دسته (batch size) برابر با ۸ آموزش داده شد. دادهها پیش از ورود به مدل با استفاده از نرمالسازی Min-Max مقیاسبندی شدند. در این مدل از معیار توقف زودهنگام (Early Stopping) استفاده نشد و مقدار seed بهصورت صریح تنظیم نشد. تنظیم ابرپارامترها بهصورت دستی و از طریق روش آزمون و خطا انجام شد. ترکیبهای مختلفی از تعداد واحدهای LSTM، نرخ dropout، تعداد نرونهای لایه Dense و تعداد epoch بررسی شدند و در نهایت، بهترین پیکربندی براساس کمینهسازی RMSE و بیشینهسازی NSE روی دادههای اعتبارسنجی انتخاب شد. در جدول 5 جزئیات معماری مدل ارائه شده است.
جدول 5: جزئیات معماری مدل BiLSTM (منبع: نویسندگان)
Table 5: Architectural details of the BiLSTM model (Source: Authors)
|
Parameter (BiLSTM) |
Value / Description |
|
Optimizer |
Adam (default learning rate) |
|
Loss Function |
Mean Absolute Error (MAE) |
|
Epochs |
100 |
|
Batch Size |
8 |
|
Dropout Rate |
0.3 (applied after first and second BiLSTM layers) |
|
Activation Functions |
tanh (BiLSTM layers), ReLU (Dense layer), Linear (output layer) |
|
Normalization Method |
Min-Max scaling applied to both input features and target variable |
|
Sequence Window Size |
1 |
|
Early Stopping |
Not applied |
|
Random Seed |
Not explicitly set |
|
Hyperparameter Tuning |
Manual trial-and-error; selected based on RMSE and NSE on validation data |
شبکه عصبی عمیق (DNN)
شبکه عصبی عمیق[5] (DNN) زیرمجموعهای از یادگیری ماشین است که با بهرهگیری از چندین لایه پردازشی، قادر به استخراج ویژگیهای سطح بالا از دادههای خام است (Leyiw et al., 2021). این مدلها با تحلیل الگوهای گذشته، پیشبینی دقیق در زمینههایی مانند هیدرولوژی، آبوهوا و تقاضای مشاغل ارائه میدهند. هر نورون ورودیها را با وزنهای معین و یک بایاس ترکیب میکند. سپس با استفاده از تابع فعالسازی غیرخطی پردازش و به لایه بعدی منتقل میکند (Mai et al., 2021). وزنها در طی فرآیند آموزش برای کاهش خطا بهینه میشوند. از چالشهای مهم شبکههای عمیق نیاز به حجم بالای دادههای آموزشی و منابع محاسباتی قوی است که میتواند محدودیتهایی برای پژوهشگران و سازمانهای کوچک ایجاد کند (Mittal, 2020). مدل شبکه عصبی عمیق (DNN) بهمنظور پیشبینی بارش با استفاده از دادههای چندمتغیره طراحی و پیادهسازی شد. این مدل شامل سه لایه پنهان از نوع Dense با تعداد نرونهای ۱۲، ۱۶ و ۱۶ بود که بهترتیب با تابع فعالسازی ReLU عمل میکردند. در این مدل از لایه Dropoutاستفاده نشد. فرآیند آموزش مدل با استفاده از الگوریتم Adam و تابع هزینه MSE انجام شد. مدل در ۱۰۰ دوره (epoch) و با اندازه دسته (batch size) برابر با ۳۲ آموزش داده شد. دادهها پیش از ورود به مدل با استفاده از نرمالسازی Min-Max مقیاسبندی شدند. در این مدل از معیار توقف زودهنگام (Early Stopping) استفاده نشد و مقدار seed بهصورت صریح تنظیم نشد. تنظیم ابرپارامترها بهصورت دستی و با روش آزمون و خطا انجام شد. ترکیبهای مختلفی از تعداد نرونها در لایههای پنهان، نرخ یادگیری، تعداد epoch و اندازه batch بررسی شدند و درنهایت، بهترین پیکربندی براساس کمینهسازی RMSEو بیشینهسازی NSE روی دادههای اعتبارسنجی انتخاب شد. در جدول 6 جزئیات معماری مدل ارائه شده است.
جدول 6: جزئیات معماری مدل DNN (منبع: نویسندگان)
Table 6: Architectural details of the SVM model (Source: Authors)
|
Parameter (DNN) |
Value / Description |
|
Optimizer |
Adam (default learning rate) |
|
Loss Function |
Mean Squared Error (MSE) |
|
Epochs |
100 |
|
Batch Size |
32 |
|
Dropout Rate |
Not applied |
|
Activation Functions |
ReLU (hidden layers), Linear (output layer) |
|
Normalization Method |
Min-Max scaling applied to both input features and target variable |
|
Sequence Window Size |
1 |
|
Early Stopping |
Not applied |
|
Random Seed |
Not explicitly set |
|
Hyperparameter Tuning |
Manual trial-and-error; selected based on RMSE and NSE on validation data |
ماشین بردار پشتیبان (SVM)
ماشین بردار پشتیبان[6] (SVM) مجموعهای از روشهای یادگیری تحت نظارت است که معمولاً برای طبقهبندی دوگانه در فضای ویژگیهای دلخواه اجرا میشود؛ بنابراین، برای مسائل پیشبینی مناسب است (Pai & Hong, 2007). مدلهای SVM بهطور کلی به دو دسته تقسیم میشوند: مدلهای طبقهبندی (SVC) و مدلهای رگرسیونی (SVR). در کاربرد رگرسیونی، SVM از یک روش مبتنی بر نگاشت غیرخطی استفاده میکند که در آن دادههای ورودی با استفاده از توابع هسته (Kernel Functions) به یک فضای ویژگی با ابعاد بالاتر نگاشت میشوند. سپس، یک ابرصفحه بهینه در این فضای جدید برای پیشبینی مقادیر هدف ایجاد میشود. هدف مدل، کمینهسازی تابع هزینه بهگونهای است که خطای پیشبینی کاهش یابد. دقت و عملکرد مدل SVM به شدت به نوع تابع هسته انتخابی، پارامترهای تنظیم و اندازه مجموعه آموزشی بستگی دارد. در این فضای جدید، مدل به دنبال یافتن یک تابع رگرسیونی بهینه بهشکل رابطه 4 است (Smola et al., 2004):
(4)
که در آنw بردار وزنها،b بایاس وx بردار ورودی است. مسئله بهینهسازی مربوط به SVR بهصورت رابطه 5 تعریف میشود:
(5)
با قیود:
که در آن مقدار واقعی بارش، پارامتر خطای مجاز (ε-insensitive loss)، و متغیرهای کمکی (slack variables) برای نمونههای خارج از محدوده خطای مجاز، پارامتر جریمه که موازنه بین پیچیدگی مدل و میزان خطای مجاز را کنترل میکند. مدل ماشین بردار پشتیبان (SVM) در این پژوهش بهصورت رگرسیونی (SVR) پیادهسازی شد تا مقادیر بارش را براساس دادههای چندمتغیره پیشبینی کند. در این مدل، دادههای ورودی با استفاده از توابع هسته (Kernel Functions) به فضای ویژگی با ابعاد بالاتر نگاشت شدند تا امکان مدلسازی روابط غیرخطی فراهم شود. سپس، یک ابرصفحه بهینه در این فضای جدید برای پیشبینی خروجی هدف (بارش) ایجاد شد. بهمنظور افزایش دقت مدل، از نرمالسازی Min-Max برای مقیاسبندی دادههای ورودی و خروجی استفاده شد. برای آموزش مدل، از تابع هزینه ε-insensitive loss استفاده شد که در ساختار SVR بهطور پیشفرض اعمال میشود. فرآیند آموزش شامل هیچ دوره (epoch) یا دستهبندی (batch size) خاصی نبود؛ زیرا مدل SVM بر پایه حل مسائل بهینهسازی محدب عمل میکند و نیازی به آموزش تکراری ندارد. همچنین، از معیار توقف زودهنگام (Early Stopping) استفاده نشد و مقدار seed بهصورت صریح تنظیم نشد. تنظیم ابرپارامترهای مدل شامل انتخاب مقدار مناسب برای پارامترهای C، ε و γ بود. برای این منظور، از روش GridSearchCV با اعتبارسنجی متقاطع سهتایی (3-fold cross-validation) استفاده شد. ترکیبهای مختلفی از مقادیر C ∈ {1, 100}،ε ∈ {0.1, 0.5, 1} و γ ∈ {scale, auto, 0.001, 0.01, {0.1, 1, 10 بررسی شدند و بهترین پیکربندی براساس کمینهسازی RMSE و بیشینهسازی NSE روی دادههای اعتبارسنجی انتخاب شد. در جدول 7 جزئیات معماری مدل ارائه شده است.
جدول 7: جزئیات معماری مدل SVM (منبع: نویسندگان)
Table 7: Architectural details of the SVM model (Source: Authors)
|
Parameter (SVM) |
Value / Description |
|
Model Type |
Support Vector Regression (SVR) |
|
Loss Function |
ε-insensitive loss |
|
Epochs |
Not applicable |
|
Batch Size |
Not applicable |
|
Optimizer |
Not applicable (SVR uses quadratic programming) |
|
Activation Functions |
Not applicable |
|
Normalization Method |
Min-Max scaling applied to both input features and target variable |
|
Sequence Window Size |
1 |
|
Early Stopping |
Not applied |
|
Random Seed |
Not explicitly set |
|
Hyperparameter Tuning |
GridSearchCV with 3-fold cross-validation; C ∈ {1, 100}, ε ∈ {0.1, 0.5, 1}, γ ∈ {scale, auto, 0.001–10} |
برای ارزیابی عملکرد مدلهای استفادهشده در این پژوهش، از معیارهای آماری شامل ضریب همبستگی[7] (R)، جذر میانگین مربعات خطا[8] (RMSE) و ضریب نش - ساتکلیف[9] (NSE) استفاده شده است. R، معیاری آماری است که قدرت و جهت رابطه بین دو متغیر را توصیف میکند. ضریب نزدیک به 1- یا 1 نشاندهنده همبستگی قوی است؛ در حالی که ضریب صفر نشاندهنده عدم همبستگی است (رابطه 6). RMSE بهعنوان یکی از معیارهای اصلی برای ارزیابی و مقایسه عملکرد مدلها مورد استفاده قرار میگیرد. مقدار RMSE در بازه صفر تا مثبت بینهایت قرار دارد که بر این اساس، بهترین مدل، مدلی است که کمترین RMSE را داشته باشد (رابطه 7). NSE یک معیار پرکاربرد در هیدرولوژی برای ارزیابی مهارت پیشبینی مدلهای هیدرولوژیکی است که محدوده آن از منفی بینهایت تا یک است، که در آن بازه یک، نشاندهنده تطابق کامل بین مدل و دادههای مشاهده شده است، مقادیر کمتر از صفر نشان میدهند که میانگین مشاهدات عملکرد بهتری نسبت به مدل ارائه میدهد و بنابراین مدل فاقد کارایی است (رابطه 8). میانگین خطای مطلق (MAE) نیز بهعنوان یکی از شاخصهای پرکاربرد برای ارزیابی دقت مدلها به کار گرفته میشود. این معیار میانگین قدر مطلق اختلاف بین مقادیر مشاهدهای و مقادیر شبیهسازیشده را محاسبه میکند و برخلاف RMSE، اندازه خطاها را بهصورت خطی در نظر میگیرد. مقدار MAE همواره غیرمنفی است و هرچه به صفر نزدیکتر باشد، نشاندهنده عملکرد بهتر مدل است (رابطه 9).
(6)
(7)
(8)
(9)
در روابط (9-6)، پارامترهای Pi و Oi بهترتیب مقادیر پیشبینیشده مدل و مشاهداتی در زمان i، میانگین مقادیر مشاهده شده، میانگین مقادیر پیشبینیشده و n تعداد کل دادهها (یا بازههای زمانی) هستند.
یافتههای پژوهش و تجزیهوتحلیل
در این پژوهش، طراحی سناریوهای ورودی براساس نتایج پیشپردازش دادهها و تحلیل همبستگی بین متغیرها انجام شد. پارامترهای هواشناسی به دلیل نقش مستقیم در فرایند بارش و همبستگی قابلقبول با متغیر هدف (بارش فصلی)، بهعنوان ورودی پایه در نظر گرفته شدند. علاوه بر آن، بهمنظور لحاظکردن وابستگیهای زمانی و افزایش توان مدل در بازسازی روندهای گذشته، سه تأخیر متوالی بارش نیز به ترکیب ورودیها افزوده شد؛ بنابراین، سناریوی اول شامل پارامترهای هواشناسی و سناریوی دوم شامل ترکیب پارامترهای هواشناسی و تأخیرهای بارش است. این طراحی امکان مقایسه اثر ورودیهای پایه و ورودیهای گستردهتر را فراهم میسازد و با رویکرد ارائهشده در بخش پیشپردازش دادهها سازگار است. در شکل 3، برای بررسی روابط بین متغیرهای ورودی، ماتریس همبستگی بین پارامترهای اقلیمی و تأخیرهای زمانی بارش در دو ایستگاه محاسبه شد. متغیرهای استفادهشده شامل بارش فصلی (Rain)، دمای کمینه (Tmin)، میانگین سرعت باد (FFm)، سرعت بیشینه باد (Umax)، ساعات آفتابی (SSHN) و سه تأخیر زمانی بارش (First-Lag، Second-Lag، Third-Lag) بودند. براساس ماتریس همبستگی، تأخیر سوم بارش، ساعات آفتابی و رطوبت نسبی بیشترین همبستگی را با بارش فصل جاری دارند، که در انتخاب ورودیهای مدل لحاظ شدند.
شکل 3: نمودار ماتریس همبستگی بارش فصلی ایستگاه یزد و رشت (منبع: نویسندگان)
Figure 3: Correlation matrix diagram of seasonal precipitation in Yazd and Rasht station (Source: Authors)
در ادامه، عملکرد مدلهای SVM، CNN-BiLSTM،BiLSTM و DNN روی دادهها بررسی شد. برای سنجش دقت مدلها، معیارهای آماری شامل ضریب همبستگی (R)، جذر میانگین مربعات خطا (RMSE) و ضریب نش - ساتکلیف (NSE) و میانگین خطای مطلق (MAE) در مرحله آموزش و آزمون محاسبه شد و نتایج آنها در جدول 8 و جدول 9 گزارش شدهاند.
جدول 8: شاخصهای ارزیابی عملکرد مدلهای مورد مطالعه در مرحله آموزش در ایستگاههای رشت و یزد (منبع: نویسندگان)
Table 8: Performance evaluation metrics of the studied models during the training phase at Rasht and Yazd stations (Source: Authors)
|
|
رشت |
ایستگاه |
|||
|
MAE |
NSE |
RMSE (mm) |
R |
مدل |
سناریو |
|
16/67 |
75/0 |
46/88 |
88/0 |
CNN-BiLSTM |
1 |
|
39/99 |
56/0 |
71/110 |
80/0 |
BiLSTM |
1 |
|
32/78 |
66/0 |
06/113 |
85/0 |
DNN |
1 |
|
62/87 |
60/0 |
35/117 |
76/0 |
SVM |
1 |
|
90/8 |
99/0 |
66/11 |
99/0 |
CNN-BiLSTM |
2 |
|
45/13 |
99/0 |
04/15 |
99/0 |
BiLSTM |
2 |
|
28/35 |
94/0 |
91/41 |
98/0 |
DNN |
2 |
|
41/38 |
92/0 |
09/49 |
96/0 |
SVM |
2 |
|
یزد |
ایستگاه |
||||
|
MAE |
NSE |
RMSE (mm) |
R |
مدل |
سناریو |
|
35/4 |
71/0 |
09/9 |
86/0 |
CNN-BiLSTM |
1 |
|
83/4 |
64/0 |
15/10 |
81/0 |
BiLSTM |
1 |
|
30/5 |
72/0 |
01/9 |
85/0 |
DNN |
1 |
|
10/5 |
60/0 |
60/10 |
80/0 |
SVM |
1 |
|
94/0 |
99/0 |
65/1 |
99/0 |
CNN-BiLSTM |
2 |
|
49/2 |
96/0 |
30/3 |
99/0 |
BiLSTM |
2 |
|
20/4 |
86/0 |
40/6 |
92/0 |
DNN |
2 |
|
72/2 |
77/0 |
16/8 |
91/0 |
SVM |
2 |
جدول 9: شاخصهای ارزیابی عملکرد مدلهای مورد مطالعه در مرحله آزمون (صحتسنجی) در ایستگاههای رشت و یزد (منبع: نویسندگان)
Table 9: Performance evaluation metrics of the studied models during the testing (validation) phase at Rasht and Yazd stations (Source: Authors)
|
|
رشت |
ایستگاه |
|||
|
MAE |
NSE |
RMSE (mm) |
R |
مدل |
سناریو |
|
51/89 |
60/0 |
79/122 |
82/0 |
CNN-BiLSTM |
1 |
|
89/115 |
40/0 |
56/161 |
70/0 |
BiLSTM |
1 |
|
34/124 |
34/0 |
18/154 |
68/0 |
DNN |
1 |
|
84/104 |
57/0 |
92/124 |
78/0 |
SVM |
1 |
|
88/29 |
90/0 |
89/61 |
94/0 |
CNN-BiLSTM |
2 |
|
02/27 |
88/0 |
58/64 |
93/0 |
BiLSTM |
2 |
|
71/54 |
85/0 |
24/73 |
93/0 |
DNN |
2 |
|
01/57 |
85/0 |
62/74 |
93/0 |
SVM |
2 |
|
یزد |
ایستگاه |
||||
|
MAE |
NSE |
RMSE (mm) |
R |
مدل |
سناریو |
|
61/7 |
40/0 |
99/11 |
65/0 |
CNN-BiLSTM |
1 |
|
03/8 |
36/0 |
13/12 |
63/0 |
BiLSTM |
1 |
|
73/8 |
28/0 |
88/12 |
58/0 |
DNN |
1 |
|
71/8 |
30/0 |
76/12 |
62/0 |
SVM |
1 |
|
88/1 |
80/0 |
48/7 |
89/0 |
CNN-BiLSTM |
2 |
|
30/3 |
70/0 |
33/8 |
84/0 |
BiLSTM |
2 |
|
97/5 |
64/0 |
14/9 |
81/0 |
DNN |
2 |
|
47/4 |
69/0 |
47/8 |
83/0 |
SVM |
2 |
مطابق جدول 8 (مرحله آموزش) و جدول 9 (مرحله آزمون)، عملکرد مدلها در دو سناریوی ورودی و در دو ایستگاه اقلیمی متفاوت (رشت و یزد) مقایسه شد. در مرحله آموزش و در سناریوی اول، مدل CNN-BiLSTM در ایستگاه رشت با ضریب همبستگی 82/0، خطای RMSE برابر با 79/122 میلیمتر،MAE معادل 51/89 میلیمتر و NSE برابر با 60/0، بهترین عملکرد را نسبت به سایر مدلها داشت. این برتری بیانگر توانایی این مدل در شناسایی الگوهای پیچیده بارش در اقلیم مرطوب است، حتی با ورودیهای محدود. مدل SVM نیز با 78 /0 R=و 84/104MAE= عملکرد نسبتاً مطلوبی داشت؛ اما به دلیل ساختار ایستا و عدم توانایی در یادگیری وابستگیهای زمانی، دقت آن کمتر از CNN-BiLSTM بود. مدلهای BiLSTM و DNN نیز بهترتیب با 70/0R= و 68/0R= و MAE بالاتر (89/115 و 34/124 میلیمتر) نتایج ضعیفتری ثبت کردند که نشاندهنده نیاز این مدلها به ورودیهای غنیتر برای بهبود دقت است. در مرحله آزمون و در سناریوی دوم، با افزودن سه تأخیر بارش و پارامترهای اقلیمی، دقت همه مدلها بهطور چشمگیری افزایش یافت؛ بهویژه مدل CNN-BiLSTM در ایستگاه رشت با 94/0R=، 89/61RMSE= میلیمتر، 88/29MAE= میلیمتر و 90/0NSE= بالاترین دقت را به دست آورد. این بهبود قابل توجه نشان میدهد که ترکیب لایههای کانولوشنی با حافظه دوطرفه زمانی، امکان استخراج همزمان ویژگیهای مکانی و زمانی را فراهم میکند و مدل را قادر میسازد تا نوسانات بارش را با دقت بیشتری بازسازی کند. در ایستگاه یزد نیز که اقلیم خشک و بارشهای پراکندهتری دارد، CNN-BiLSTM با 89/0R=، 48/7RMSE= میلیمتر، 54/3MAE= میلیمتر و 94/0NSE= عملکرد بسیار مطلوبی داشت. این نتایج نشان میدهد که حتی در شرایط دادههای نامنظم، مدل ترکیبی توانایی مدلسازی رفتار غیرخطی بارش را دارد. مقایسه عملکرد مدلها در هر دو ایستگاه نشان میدهد که مدلهای دارای حافظه زمانی (BiLSTM و CNN-BiLSTM) نسبت به مدلهای ایستا (SVM و DNN) عملکرد بهتری دارند، بهویژه در سناریوی دوم که اطلاعات زمینهای بیشتری در اختیار مدلها قرار گرفته است. نمودارهای پراکنش شکل 4 نیز این یافتهها را تأیید میکنند؛ نقاط پیشبینیشده توسط CNN-BiLSTM بهطور منظمتری روی خط 45 درجه قرار گرفتهاند که نشاندهنده همبستگی بالا و پراکندگی کم است؛ با این حال، بررسی دقیقتر نمودارهای شکل 4 نشان میدهد که در ایستگاه یزد، یک نقطه خاص با مقدار واقعی حدود ۵۶ میلیمتر وجود دارد که رفتار مدلها در پیشبینی آن بسیار متفاوت بوده است. این مقدار در صدکهای بالای توزیع بارش فصلی یزد قرار دارد و بهعنوان یک رخداد حدی نادر شناخته میشود. مدلهای حافظهدار مانند CNN-BiLSTM و BiLSTM توانستهاند دامنه این رخداد را نسبتاً دقیقتر بازسازی کنند، در حالیکه مدلهای فاقد حافظه مانند SVM و DNN دچار بیشبرآوردی یا کمبرآوردی شدهاند. این تفاوت عملکرد را میتوان به توانایی مدلهای حافظهدار در یادگیری وابستگیهای زمانی و تشخیص الگوهای غیرخطی نسبت داد. بهطور کلی، الگوی رفتاری مدلها در دو ایستگاه متفاوت است؛ در یزد، مدلها تمایل به بیشبرآوردی دارند؛ در حالی که در رشت، رفتار مدلها بیشتر به سمت کمبرآوردی متمایل است. این تفاوت را میتوان با ساختار آماری دادهها توجیه کرد. در یزد، بهدلیل فراوانی مقادیر صفر و پراکندگی شدید، مدلها در مواجهه با رخدادهای نادر، دامنه پیشبینی را بزرگتر تخمین میزنند. در مقابل، در رشت با بارشهای منظمتر، مدلها روند را خوب بازسازی میکنند؛ اما در تخمین قلههای بارش، محافظهکارانهتر، عمل و مقدار واقعی را کمتر برآورد میکنند.
شکل 4: نمودار پراکنش بارش فصلی مشاهداتی و تخمین یافته در دو ایستگاه رشت و یزد (منبع: نویسندگان)
Figure 4: Scatter diagram of observed and estimated seasonal precipitation at two stations: Rasht and Yazd (Source: Authors)
در شکل 5، مقایسهای از مقادیر واقعی و پیشبینیشده بارش فصلی در ایستگاههای رشت و یزد را تحت سناریوی دوم و با استفاده از چهار مدل مختلف ارائه میدهد. همانطور که در نمودارها مشاهده میشود تمامی مدلها توانستهاند روند کلی بارش را با دقت قابلقبول بازسازی کنند؛ با این حال، مدل ترکیبی CNN-BiLSTM عملکرد بهتری در بازسازی نوسانات بارش، بهویژه در دورههای اوج و فرود، از خود نشان داده است. در ایستگاه رشت با اقلیم مرطوب، مدلها بهویژه CNN-BiLSTM توانستهاند نوسانات بارش را با دقت بیشتری دنبال کنند. این موضوع را میتوان به ساختار حافظهدار و یادگیری عمیق مدل و همچنین بهرهگیری از ورودیهای مؤثرتر نسبت داد. در ایستگاه یزد با اقلیم خشک، مدلها روند کلی بارش را حفظ کردهاند؛ اما در برخی دورهها، بهویژه در شرایط خشکسالی یا بارشهای حدی، انحرافهایی مشاهده میشود. این تفاوت عملکرد را میتوان به پراکندگی بیشتر دادهها، فراوانی مقادیر صفر و نوسانات شدید در فصلهای خشک نسبت داد که موجب کاهش دقت مدلهای فاقد حافظه مانند DNN و SVM شده است.
شکل 5: نمودار ستونی بارش فصلی مشاهداتی و تخمینیافته در دو ایستگاه رشت و یزد (منبع: نویسندگان)
Figure 5: Column chart of observed and estimated seasonal precipitation at two stations: Rasht and Yazd (Source: Authors)
در شکل 6، نمودارهای جعبهای مقایسهای بین مقادیر واقعی بارش و مقادیر پیشبینیشده توسط چهار مدل مختلف (CNN-BiLSTM، BiLSTM، DNN و SVM) را در سناریوی دوم و برای ایستگاههای رشت و یزد نمایش میدهد. این نمودارها شاخصهای آماری نظیر میانه، چارک اول و سوم، دامنه تغییرات و نقاط پرت را شامل میشوند و بهمنظور ارزیابی توانایی مدلها در بازسازی توزیع آماری بارش استفاده شدهاند. در هر دو ایستگاه، بهویژه در رشت با اقلیم مرطوب، مدل CNN-BiLSTM توانسته است توزیع دادههای واقعی را با دقت بالاتری بازسازی کند؛ به طوری که موقعیت میانه، چارکها و دامنه تغییرات در بسیاری از موارد با دادههای واقعی تطابق نزدیکی دارد. مدلهای BiLSTM و DNN نیز عملکرد پذیرفتنی داشتهاند؛ هرچند در برخی موارد پراکندگی مقادیر پیشبینیشده نسبت به دادههای واقعی بیشتر بوده است. در مقابل، مدل SVM بهویژه در ایستگاه یزد با اقلیم خشک، عملکرد ضعیفتری داشته و انحراف بیشتری از ساختار آماری بارش نشان داده است.
بهطور کلی، این نمودارها بیانگر آن هستند که استفاده از سناریوی دوم، شامل پارامترهای اقلیمی و سه تأخیر بارش، موجب بهبود بازسازی توزیع آماری بارش در بیشتر مدلها شده است. در این میان، مدل CNN-BiLSTM در بازتولید ساختار آماری بارش در دو اقلیم متفاوت، عملکرد بهتری نسبت به سایر مدلها ارائه داده است.
شکل6: نمودار جعبهای مقایسهای بارش فصلی ایستگاههای رشت و یزد (منبع: نویسندگان)
Figure 6: Comparative boxplot of seasonal precipitation at Rasht and Yazd stations (Source: Authors)
ارزیابی عددی مدلها (جدول 9) نشان داد که سناریوی دوم با ورودیهای کاملتر، دقت پیشبینیها را بهطور محسوسی افزایش داده است. این موضوع بیانگر آن است که ترکیب پارامترهای اقلیمی و تأخیرهای بارش، اطلاعات غنیتری را در اختیار مدل قرار داده و توانایی آن را در شناسایی الگوهای پیچیده بارش ارتقا داده است؛ با این حال، درخور ذکر است که افزایش تعداد ورودیها الزاماً به معنای بهبود عملکرد مدلها در تمامی شرایط نیست؛ زیرا ممکن است برخی متغیرها نقش کمرنگتری داشته باشند یا حتی موجب ایجاد نویز شوند؛ بنابراین، انجام تحلیل حساسیت برای تعیین سهم و اهمیت نسبی هر یک از پارامترهای ورودی میتواند در پژوهشهای آتی مفید باشد و به شفافتر شدن نقش متغیرهای مؤثر در فرآیند پیشبینی کمک کند. مدل CNN-BiLSTMبا ضریب همبستگی ۹۴/۰ و RMSE برابر ۸۹/۶۱ میلیمتر در رشت و R معادل ۸۹/۰ و RMSE برابر ۴۸/۷ میلیمتر در یزد، بهترین عملکرد را ارائه داد. پس از آن، مدل BiLSTM نتایج نسبتاً دقیقی داشت؛ در حالی که DNN و SVM، بهویژه در یزد، دقت پایینتری نشان دادند. نمودار راداری (شکل 7) نیز برتری CNN-BiLSTM را در همه شرایط تأیید میکند. بهطور کلی، انتخاب سناریوی دوم در بهبود دقت مدلها نقش اساسی داشته است.
شکل 7: نمودار راداری مقایسه عملکرد مدلها (منبع: نویسندگان)
Figure 7: Radar chart comparing model performance (Source: Authors)
این پژوهش با هدف ارزیابی دقت مدلهای مختلف یادگیری ماشین و یادگیری عمیق در پیشبینی بارش فصلی در دو اقلیم متضاد ایران انجام شد. در این راستا، مدل ترکیبی CNN-BiLSTM بهدلیل توانایی در مدلسازی روابط غیرخطی و یادگیری وابستگیهای زمانی پیچیده، بهعنوان مدل اصلی بررسی شد. ارزیابی عملکرد مدلها در سناریوی دوم نشان داد که CNN-BiLSTM در هر دو ایستگاه رشت و یزد، نسبت به سایر مدلها دقت بالاتری دارد.
لایههای کانولوشنی این مدل قادرند ویژگیهای محلی و نوسانات کوتاهمدت دادههای ورودی را استخراج کنند؛ در حالی که ساختار BiLSTM وابستگیهای زمانی بلندمدت را از هر دو جهت زمانی (گذشته و آینده) مدلسازی میکند. این ترکیب موجب شده است که CNN-BiLSTM بتواند الگوهای پیچیده در سریهای زمانی چندمتغیره بارش را با دقت بالاتری بازسازی کند.
در ایستگاه رشت که دارای بارشهای متوالی و با شدت متغیر است، استفاده از تأخیرهای بارش در کنار پارامترهای اقلیمی باعث شد مدلهای دارای حافظه زمانی مانند BiLSTM و CNN-BiLSTM عملکرد بسیار مطلوبی داشته باشند؛ بهویژه CNN-BiLSTM با ضریب همبستگی 94/0 و RMSE برابر با 89/61 میلیمتر نشان داد که درک دقیق وابستگیهای زمانی در اقلیمهای مرطوب نقش کلیدی در افزایش دقت پیشبینی دارد.
در ایستگاه یزد، با اقلیم خشک و بارشهای پراکنده و نامنظم، مدلهای فاقد حافظه مانند DNN عملکرد ضعیفتری داشتند. در مقابل، مدل SVM با ساختار سادهتر و مبتنی بر نگاشت غیرخطی، توانست در برخی شاخصها عملکرد بهتری نسبت به DNN ثبت کند؛ بهویژه در سناریوی دوم، ضریب همبستگی بالاتر و RMSE پایینتر مدل SVM نسبت به DNN، نشاندهنده توانایی بهتر آن در بازسازی رفتار بارش در اقلیم خشک و پراکنده یزد است. این برتری را میتوان به انعطافپذیری SVM در مواجهه با دادههای نامنظم و دارای مقادیر صفر زیاد نسبت داد؛ در حالی که مدل DNN به دلیل نیاز به دادههای حجیم و ساختارمند، در چنین شرایطی دچار افت دقت شده است؛ بنابراین، در جمعبندی نهایی مقاله، برتری نسبی SVM در ایستگاه یزد نسبت به DNN بهدرستی منعکس میشود و با نتایج عددی جدول 9 و نمودارهای مربوطه همخوانی دارد.
در مقابل،CNN-BiLSTM با بهرهگیری از سه تأخیر زمانی بارش و ساختار ترکیبی خود، توانست رفتار غیرخطی بارش را بهخوبی مدلسازی کند. مدل BiLSTM نیز بهدلیل قابلیت یادگیری وابستگیهای دوطرفه زمانی، پس از CNN-BiLSTM عملکرد مطلوبی داشت؛ در حالی که مدلهای DNN و SVM به دلیل فقدان حافظه و محدودبودن به روابط ایستا دقت کمتری ثبت کردند؛ بهویژه در دورههای بارش شدید یا ناگهانی در یزد و نوسانات فصلی در رشت.
برتری مدل CNN-BiLSTM عمدتاً ناشی از توانایی آن در استخراج همزمان ویژگیهای مکانی و زمانی از دادههای چندمتغیره است. همچنین، استفاده از سناریوی دوم که شامل تأخیرهای بارش و پارامترهای اقلیمی است، اطلاعات زمینهای بیشتری برای یادگیری فراهم میکند و موجب میشود مدلها رفتارهای گذشته سیستم را بهتر شناسایی و بازسازی کنند.
با این حال، مقایسه شکل 4 با شکل 6 نشان میدهد که جهت بایاس مدلها در دو ایستگاه بهصورت متفاوتی ظاهر شده است؛ در حالی که در شکل ۶ مدلها در یزد بیشبرآوردی و در رشت کمبرآوردی نشان میدهند، در شکل 7 این الگو معکوس شده است. این تفاوت برداشت را میتوان به نوع نمایش نمودارها نسبت داد. شکل ۶ بر پایه پراکنش مقادیر پیشبینیشده در برابر مقادیر واقعی طراحی شده است و بیشتر تحت تأثیر نقاط حدی و دامنه نوسانات قرار دارد. در مقابل، شکل 7 توزیع باقیماندهها را نمایش میدهد که گرایش مرکزی خطا را بهتر نشان میدهد. در یزد، بهدلیل غالببودن مقادیر بسیار کم و نادربودن رخدادهای پربارش، مدلها در بازههای میانی تمایل به کمبرآوردی دارند؛ اما در نقاط حدی دچار بیشبرآوردی میشوند. در رشت نیز، مدلها روند کلی را خوب بازسازی میکنند؛ اما در تخمین قلههای بارش، مقدار واقعی را کمتر از حد پیشبینی میکنند؛ بنابراین، تفاوت ظاهری بین دو شکل ناشی از تمرکز هر نمودار بر جنبهای خاص از خطای مدلهاست.
درمجموع، نتایج حاصل از دادههای ۲۸ساله (۱۹۹۵ تا ۲۰۲۲) در دو اقلیم متفاوت و دو سناریوی ورودی، نشان میدهند که مدل CNN-BiLSTM در تمامی شرایط اعم از مرطوب یا خشک، منظم یا پراکنده بهعنوان دقیقترین و پایدارترین مدل پیشبینی بارش فصلی شناخته میشود. این یافتهها نهتنها با نتایج مطالعات پیشین همراستا هستند، تأیید میکنند که استفاده از معماریهای ترکیبی و ورودیهای غنی، نقش تعیینکنندهای در افزایش دقت مدلهای اقلیمی دارد. افزون بر نتایج عددی، بررسی مقایسهای جایگاه مدلها در دو سناریوی ورودی نیز نکات مهمی را آشکار میسازد؛ برای مثال، مدل SVM که در سناریوی اول با ورودیهای اقلیمی عملکرد مناسبی داشت، در سناریوی دوم با اضافهشدن تأخیرهای زمانی بارش، به جایگاه چهارم سقوط کرد. این تغییر نشان میدهد که مدلهای حافظهدار مانند BiLSTM و CNN-BiLSTM توانایی بیشتری در بهرهبرداری از وابستگیهای زمانی دارند؛ در حالی که مدلهای غیرحافظهای مانند SVM در مواجهه با ورودیهای سریزمانی پیچیده دچار افت عملکرد میشوند.
همچنین، در مواردی مانند مدل BiLSTM، با وجود RMSE بالاتر نسبت به DNN، ضریب همبستگی بالاتری ثبت شده که نشاندهنده توانایی بهتر در بازسازی روند کلی دادههاست. این اختلاف ممکن است ناشی از حساسیت RMSE به مقادیر حدی و نوسانات شدید باشد؛ در حالی که ضریب همبستگی رفتار کلی مدل را بهتر منعکس میکند.
بررسی شاخصهای خطا در دو ایستگاه نشان میدهد که مدلها در ایستگاه رشت عملکرد بهتری داشتهاند که میتوان آن را به ساختار منظمتر دادهها و همبستگی بالاتر بین پارامترها نسبت داد. درصد بهبود RMSE در سناریوی دوم نسبت به سناریوی اول برای مدل CNN-BiLSTM در ایستگاه رشت برابر با %3/18 و در یزد برابر با %7/9 بوده است که نشان میدهد تأثیر تأخیرهای زمانی در اقلیمهای مرطوب بیشتر است. همانطور که در شکل 3 مشاهده شد، ورودیهایی با همبستگی بالا مانند تأخیر سوم بارش، حداکثر رطوبت نسبی و ساعات افتابی، نقش کلیدی در افزایش دقت مدل CNN–BiLSTM داشتند.
یافتههای این تحقیق در زمینه پیشبینی بارش فصلی با مدلهای CNN-BiLSTM، BiLSTM،DNN و SVM در ایستگاههای رشت و یزد با نتایج مطالعات معتبر مشابه همخوانی دارد؛ برای مثال، در مقایسه با مطالعه کین و همکاران (Qin et al., 2017) که در پیشبینی سریهای زمانی با استفاده از مدل dual-stage attention RNN توانستند ضریب همبستگی حدود 90/0 و RMSE بهبود یافتهای در حدود 10% نسبت به مدلهای LSTM سنتی گزارش کنند نشاندهنده افزایش دقت درخور توجهی است. آنها همچنین کاهش خطای میانگین مطلق (MAE) به 12/0 را نشان دادند که بیانگر توانایی مدل در تمرکز مؤثر بر بخشهای مهم دادههای زمانی است. گوئو و همکاران (Guo et al., 2025) در مدل پیشبینی بارش روزانه با استفاده از CNN‑BiLSTM مجهز به مکانیزم Attention، ضریب کارایی نش برابر با 993/0 گزارش کردند که در قیاس با مدلهای پایه 3/%15 و 6/%12 بهتر از CNN‑LSTM و CNN‑BiLSTM بدون Attention نشان میدهد. این نتایج نشاندهنده افزایش شایان توجه در دقت پیشبینی بارش است و کاملاً با یافتههای این تحقیق که ضریب همبستگی 94/0 و 89/0 را برای دو اقلیم مختلف دارد، همراستا و تأییدکننده ارزش استفاده از معماری ترکیبی CNN‑BiLSTM با مکانیزم توجه در مدلسازی سریهای زمانی پیچیده اقلیمی است. مطالعات دیگر مانند وانگ و همکاران (Wang et al., 2022) نیز بر اهمیت مدلهای ترکیبی CNN-BiLSTM همراه با بهینهسازیهای فراابتکاری و مکانیزم توجه تأکید کردهاند. یافتههای این پژوهش نیز تأیید میکند که مدل CNN-BiLSTM در هر دو ایستگاه و دو سناریو، نسبت به مدلهای BiLSTM، DNN و SVM، عملکرد بهتری دارد. در مطالعه ژانگ و همکاران (Zhang et al., 2024) در Xi’an چین با استفاده از مدل ترکیبیSCSSA-CNN-BiLSTM نشان داد که این مدل قادر است بهطور مؤثر ویژگیهای دادهها و وابستگیهای زمانی را در پیشبینی بارش ماهانه استخراج کند و عملکرد بهتری نسبت به مدلهای SSA-CNN-BiLSTM،SCSSA-BiLSTM وCNN-BiLSTM داشته باشد. این مدل با بهرهگیری از الگوریتم بهینهسازی SCSSA دقت پیشبینی را افزایش داده است. نتایج این مطالعه تأیید میکند که بهکارگیری مدلهای ترکیبیCNN-BiLSTM همراه با الگوریتمهای بهینهسازی میتواند عملکرد پیشبینی بارش را بهبود دهد؛ موضوعی که با یافتههای پژوهش حاضر همراستا است. با توجه به تفاوتهای اقلیمی و مقیاس زمانی میتوان گفت عملکرد مدل CNN-BiLSTM در ایران (اقلیم مرطوب رشت و خشک یزد) نیز با نتایج مطالعه چین تطابق دارد و نشاندهنده قابلیت مدل در پیشبینی دقیق سریهای زمانی بارش در اقلیمهای متنوع است. یافتههای این پژوهش در زمینه پیشبینی بارش فصلی با استفاده از مدل CNN–BiLSTM در ایستگاههای رشت و یزد، با نتایج مطالعات داخلی مرتبط با اقلیمهای خشک و نیمهخشک ایران همراستا است. در مطالعه لطفیراد و همکاران (Lotfirad et al., 2022)، مدل جنگل تصادفی (Random Forest) برای پیشبینی خشکسالی در اقلیمهای مختلف ایران به کار گرفته شد. نتایج آن نشان داد که در مناطق گرم و خشک، دقت مدل کاهش مییابد و شاخص SPEI عملکرد بهتری نسبت به SPI دارد. همچنین، همبستگی بین شاخصها در اقلیمهای معتدل تا 95/0 و در اقلیمهای خشک تا 35/0 گزارش شد. در مقایسه با این مطالعه، مدل CNN–BiLSTM در ایستگاه یزد (اقلیم خشک) با ضریب همبستگی 89/0 و RMSE برابر با 48/7 میلیمتر، عملکرد بسیار دقیقتری ارائه داده است. این تفاوت نشاندهنده توانایی بالای مدل حافظهدار CNN–BiLSTMدر مدیریت چالشهای اقلیم خشک، ازجمله پراکندگی دادهها و فراوانی مقادیر صفر است. در مطالعه هماراش و همکاران (Hamarash et al., 2022) خشکسالیهای هواشناسی در مناطق نیمهخشک ایران با استفاده از دادههای TerraClimate و شاخصهای SPI، SPEI و PDSI بررسی شد. آنها نشان دادند که مناطق گرم نیمهخشک ایران خشکسالیهای شدیدتری را تجربه کردهاند و شاخص PDSI در شناسایی دورههای بحرانی عملکرد بهتری داشته است. در پژوهش حاضر نیز مدل CNN–BiLSTM توانسته است مقادیر حدی بارش را در دورههای خشکسالی و ترسالی با دقت بالا بازسازی کند، بهویژه در ایستگاه یزد با اقلیم خشک و ایستگاه رشت با اقلیم مرطوب. مطالعه هماراش از شاخصهای آماری بهره گرفته است؛ اما این پژوهش با استفاده از یادگیری عمیق و معماری ترکیبی، رفتار غیرخطی و نوسانی بارش را بهصورت مؤثر مدلسازی کرده است. این همراستایی در نتایج، اعتبار مدل CNN–BiLSTM را در اقلیمهای چالشی ایران تأیید میکند.
نتیجهگیری
پیشبینی دقیق بارش فصلی در مناطق با اقلیمهای متضاد مانند رشت و یزد، نقش مهمی در مدیریت منابع آب، برنامهریزی کشاورزی و کاهش آسیبپذیری اقلیمی دارد. این پژوهش با استفاده از دادههای ۲۸ساله و بهکارگیری چهار مدل SVM، DNN،BiLSTM و CNN-BiLSTM، عملکرد این مدلها را در دو سناریوی ورودی بررسی کرد. نتایج نشان داد که مدل ترکیبی CNN-BiLSTM در هر دو ایستگاه، بهویژه در سناریوی دوم با ورودیهای کاملتر، دقت بیشتری در پیشبینی بارش دارد. تأثیر مثبت تأخیر سوم بارش، رطوبت نسبی و ساعات آفتابی در بهبود عملکرد مدل نیز تأیید شد. یافتههای این پژوهش با مطالعات پیشین همراستا هستند؛ برای مثال، کین و همکاران (2017) و گوئو و همکاران (2025) نیز نشان دادهاند که لحاظ وابستگیهای زمانی در ورودی مدلهای یادگیری عمیق، موجب افزایش دقت پیشبینی بارش میشود. همچنین، نتایج این تحقیق با مطالعات لیم و همکاران (2021) در زمینه برتری مدلهای ترکیبی CNN-LSTM در دادههای اقلیمی همخوانی دارد. نوآوری اصلی این پژوهش در بهکارگیری مدل CNN-BiLSTM برای نخستینبار در اقلیم خشک یزد و مقایسه آن با اقلیم مرطوب رشت است که تاکنون در مطالعات داخلی کمتر مورد توجه قرار گرفته است. این تفاوت اقلیمی و عملکرد مدلها نشان میدهد که ساختار داده و ویژگیهای منطقهای نقش تعیینکنندهای در انتخاب مدل مناسب دارند؛ با این حال، این پژوهش با محدودیتهایی نیز همراه بوده است. ازجمله حساسیت مدلهای حافظهدار به کیفیت دادههای ورودی، نیاز به حجم بالای داده برای آموزش مؤثر و کاهش دقت در مواجهه با رخدادهای حدی و نادر. همچنین، مدلهای فاقد حافظه مانند SVM و DNN در شرایط اقلیمی ناپایدار عملکرد ضعیفتری داشتند. چالش دیگر، وابستگی مدلها به نرمالسازی دقیق و تنظیمهای بهینهسازی است که در شرایط عملیاتی ممکن است با محدودیت مواجه شود. یافتههای این پژوهش میتوانند بهعنوان مبنایی برای توسعه سامانههای هوشمند هشدار بارش، مدیریت خشکسالی و بهینهسازی تخصیص منابع آبی مورد استفاده قرار گیرند؛ بهویژه در مناطق خشک، استفاده از مدلهای حافظهدار با ورودیهای چندمنبعی میتواند به شناسایی زودهنگام دورههای کمآبی کمک کند. پیشنهاد میشود در مطالعات آینده، مدلهای ترکیبی با دادههای ماهوارهای، سنجشازدور و شاخصهای خاک و پوشش گیاهی نیز بررسی شوند تا دقت پیشبینی در مقیاسهای بزرگتر و کاربردهای عملیاتی افزایش یابد. همچنین، ارزیابی مدلها در بستر سامانههای هشدار واقعی و تحلیل هزینه - فایده پیادهسازی آنها در مدیریت منابع آب، گام بعدی در جهت عملیاتیسازی این نتایج خواهد بود.
[1] Multilayer Perceptron
[2] Convolutional Neural Networks
[3] Bidirectional Long-Short Term Memory
[4] Recurrent Neural Networks
[5] Deep Neural Network
[6] Support Vector Machine
[7] Correlation
[8] Root Mean Square Error
[9] Nash-Sutcliffe coefficient