ارزیابی و پیش‌بینی بارش فصلی در اقلیم‌های متفاوت ایران با بهره‌گیری از مدل ترکیبی یادگیری عمیق (مطالعه موردی: رشت و یزد)

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد گروه علوم و مهندسی آب، دانشکده کشاورزی، دانشگاه تبریز، تبریز، ایران

2 استاد گروه علوم و مهندسی آب، دانشکده کشاورزی، دانشگاه تبریز، تبریز، ایران

چکیده

 هدف اصلی این پژوهش، بررسی پایداری و تعمیم‌پذیری مدل‌های یادگیری ماشین در شرایط اقلیمی متضاد و شناسایی مدل بهینه برای پیش‌بینی بارش فصلی است. نوآوری تحقیق، استفاده از مدل ترکیبی CNN-BiLSTM برای نخستین‌بار در منطقه خشک یزد و مقایسه عملکرد آن با نتایج منطقه مرطوب رشت است. این رویکرد می‌تواند نقش مؤثری در ارتقای سامانه‌های هشدار و مدیریت منابع آب ایفا کند. در این راستا، عملکرد چهار مدل شامل ماشین بردار پشتیبان (SVM)، شبکه عصبی عمیق (DNN)، شبکه عصبی بازگشتی دوسویه (BiLSTM) و مدل ترکیبی CNN-BiLSTM برای پیش‌بینی بارش فصلی در ایستگاه‌های رشت (اقلیم مرطوب) و یزد (اقلیم خشک) ارزیابی شد. داده‌های اقلیمی و بارش طی دوره ۲۸ ساله (1995–2022) گردآوری و در قالب دو سناریوی ورودی به مدل‌ها داده شد. سناریوی اول شامل پارامترهای اقلیمی (حداقل دما، حداکثر رطوبت نسبی، سرعت باد میانگین و ساعات آفتابی) و سناریوی دوم ترکیب این پارامترها با سه تأخیر زمانی بارش بود. نسبت داده‌های آموزش و آزمون 70 به 30 در نظر گرفته شد. نتایج نشان داد سناریوی دوم عملکرد بهتری دارد. در ایستگاه یزد، مدل CNN-BiLSTM با ضریب همبستگی 89/0، خطای RMSE برابر 48/7 میلی‌متر و ضریب نش - ساتکلیف 76/0 بهترین عملکرد را داشت. در ایستگاه رشت نیز همین مدل با ضریب همبستگی 94/0، RMSE برابر 89/61 میلی‌متر و ضریب نش - ساتکلیف 90/0 بهترین نتایج را ارائه داد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Evaluation and Prediction of Seasonal Precipitation in Different Climatic Regions of Iran Using a Hybrid Deep Learning Model (Case Study: Rasht and Yazd)

نویسندگان [English]

  • Aynaz Vafaei 1
  • Mohammad Taghi Sattari 2
1 M.Sc. student, Department of Water Science and Engineering, Faculty of Agriculture, University of Tabriz, Tabriz, Iran
2 Ph.D., Department of Water Engineering, Faculty of Agriculture, University of Tabriz, Tabriz, Iran
چکیده [English]

Abstract
The primary objective of this study was to evaluate the stability and generalizability of machine learning models under varying climatic conditions and identify the optimal approach for seasonal precipitation prediction. This research is novel in its first-time application of the hybrid CNN-BiLSTM model in the arid climate of Yazd, alongside a comparison with the humid climate of Rasht. The findings provided valuable insights for enhancing early warning systems and improving water resource management across different climates. To achieve this, we assessed the performance of 4 models: Support Vector Machine (SVM), Deep Neural Network (DNN), Bidirectional Long Short-Term Memory (BiLSTM), and the hybrid Convolutional Neural Network BiLSTM (CNN-BiLSTM). This evaluation utilized 28 years of climatic and precipitation data (1995–2022) from Rasht and Yazd stations. Two input scenarios were designed: the first included climatic parameters (minimum temperature, maximum relative humidity, average wind speed, and sunshine hours), while the second combined these parameters with 3 rainfall time lags. The dataset was divided into training and testing subsets using a ratio of 70:30. The results indicated that the second scenario significantly outperformed the first due to the inclusion of rainfall lags. In Yazd, the CNN-BiLSTM model achieved the best performance with a correlation coefficient of 0.89, a Root Mean Square Error (RMSE) of 7.48 mm, and a Nash–Sutcliffe efficiency of 0.76. In Rasht, the same model produced even better results, with a correlation coefficient of 0.94, an RMSE of 61.89 mm, and a Nash–Sutcliffe efficiency of 0.90. These findings underscore the effectiveness of hybrid deep learning architectures in capturing complex spatio-temporal precipitation patterns across diverse climatic conditions.
 
Keywords: Arid and Humid Climate, Precipitation Prediction, Seasonal Modeling, Deep Learning, CNN-BiLSTM.
 
Introduction
Rainfall is a fundamental component of the hydrological cycle, playing a crucial role in water supply, agricultural planning, flood control, drought mitigation, and environmental management. Accurate seasonal rainfall forecasting remains a significant challenge in water and climate sciences, directly influencing management decisions, sustainable development, and food security. With the intensification of climate change and increasing irregularities in rainfall patterns, the demand for timely and reliable forecasts of this complex climatic variable has become increasingly critical.
The nonlinear, complex, and stochastic nature of rainfall resulting from the interaction of multiple climatic and atmospheric factors makes its prediction a challenging scientific and technical task. Factors like temperature, humidity, wind speed, solar radiation, rainfall intensity and duration, evaporation, and large-scale teleconnection phenomena, such as the Madden–Julian Oscillation (MJO), significantly affect rainfall variability, creating highly intricate interdependencies.
Recent advances in machine learning and deep learning have enabled more effective modeling of these nonlinear and complex relationships. Traditional methods, such as linear regression and time series models, are limited by their linear assumptions and their inability to capture dynamic dependencies. In contrast, modern models—such as Support Vector Machines (SVMs), Artificial Neural Networks (ANNs), Recurrent Neural Networks (RNNs), and particularly advanced hybrid architectures like CNN-BiLSTM—have shown promising accuracy in modeling and forecasting climatic variables.
However, most existing research has focused on humid and semi-humid regions, with relatively few studies addressing arid and semi-arid zones, particularly in Iran. These regions characterized by low and irregular rainfall require more sophisticated modeling and detailed analysis. Additionally, comparative evaluations of models across contrasting climatic zones can provide valuable insights into model robustness and generalizability, which are essential for enhancing forecasting systems.
Thus, the main objective of this study was to assess the performance and generalizability of 4 machine learning and deep learning models—SVM, DNN, BiLSTM, and CNN-BiLSTM—in predicting seasonal rainfall in two climatically distinct regions: Rasht (humid) and Yazd (arid). This research pioneered the application of the CNN-BiLSTM model in the arid climate of Yazd and compares its performance with that in the humid climate of Rasht, offering practical recommendations for flood early-warning systems and water resource management.
 
Materials & Methods
The dataset utilized in this research comprised seasonal climate and rainfall data from the meteorological stations of Rasht and Yazd over a 28-year period (1995–2022). The climatic variables included minimum temperature, maximum relative humidity, average wind speed, and sunshine duration, along with seasonal rainfall data.
Two input scenarios were designed to assess the impact of past rainfall data on model performance: Scenario 1 included only the climatic parameters, while Scenario 2 combined these with 3 rainfall time lags. These scenarios aimed to evaluate how different input configurations influenced the predictive capabilities of the models.
The dataset was divided into 70% for training and 30% for testing, following standard practices in machine learning research. The four main models employed in the study were:

SVM (Support Vector Machine): A classic machine learning model known for its effectiveness in modeling nonlinear relationships
DNN (Deep Neural Network): Capable of learning complex patterns and features from high-dimensional data
BiLSTM (Bidirectional Long Short-Term Memory): Effective at capturing long- and short-term dependencies from both forward and backward temporal directions
CNN-BiLSTM (Convolutional Neural Network – BiLSTM): A hybrid architecture where the CNN extracts spatial and short-term features, while the BiLSTM models temporal dependencies

The CNN component employs convolutional filters to reduce noise and extract local patterns, while the BiLSTM component captures bidirectional temporal relationships. This hybrid design enabled the model to effectively reconstruct complex rainfall patterns across diverse climatic conditions.
The performances of the models were evaluated using 4 criteria: Correlation Coefficient (R), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), and Nash-Sutcliffe Efficiency (NSE). Each of these metrics reflected different aspects of the model's accuracy and reliability.
Research Findings
The results clearly demonstrated the effectiveness of Scenario 2, which incorporated past rainfall data, in enhancing model performance. The inclusion of lagged rainfall significantly improved prediction accuracy across both regions.
In the humid and complex climate of Rasht, the CNN-BiLSTM model achieved impressive results with a correlation coefficient (R) of 0.94, a Root Mean Square Error (RMSE) of 61.89 mm, and a Nash-Sutcliffe Efficiency (NSE) of 0.90. The model effectively captured intricate and variable rainfall patterns, providing accurate seasonal forecasts.
In Yazd characterized by sporadic and irregular rainfall, the CNN-BiLSTM model still demonstrated high accuracy, achieving an R of 0.89, an RMSE of 7.48 mm, and an NSE of 0.76. These results highlighted the model's robustness, even under challenging climatic conditions.
The BiLSTM model ranked second due to its bidirectional temporal memory followed by the DNN and SVM models, which were less effective in capturing complex temporal dependencies. The differences in performance were particularly evident during extreme rainfall events and periods of seasonal variability.
These findings confirmed the importance of incorporating past rainfall data as model input, as well as the superiority of deep and hybrid architectures in addressing temporal and nonlinear relationships. The results aligned with similar studies and underscored the value of memory-based and hierarchical feature extraction models.
 
Discussion of Results & Conclusion
Incorporation of rainfall time lags significantly improved the predictive accuracy of all models, especially in irregular climates like that in Yazd. Notably, the CNN-BiLSTM model surpassed all other models in both regions, highlighting the benefits of hybrid deep learning architectures for managing complex spatiotemporal data.
This study enhanced the broader understanding of intelligent forecasting systems for climate-related applications. It illustrated the adaptability and robustness of the CNN-BiLSTM model across various climatic conditions, providing reliable support for decision-making in water management, agricultural planning, and disaster preparedness.
To further enrich this research, it is recommended to integrate satellite and radar datasets, expand temporal data coverage, and assess model performance across wider and more diverse geographical regions. These initiatives will strengthen the accuracy and generalizability of seasonal rainfall forecasts.
 

کلیدواژه‌ها [English]

  • Arid and Humid Climate
  • Precipitation Prediction
  • Seasonal Modeling
  • Deep Learning
  • CNN-BiLSTM

مقدمه

بارش یکی از مؤلفه‌های اصلی چرخه هیدرولوژیکی است که نقش حیاتی در تأمین منابع آب، برنامه‌ریزی کشاورزی، کنترل سیلاب و مقابله با خشکسالی ایفا می‌کند (Ali et al., 2018; Bagirov et al., 2017). پیش‌بینی دقیق و قابل اعتماد بارندگی، به‌ویژه در مقیاس فصلی، ضرورتی انکارناپذیر برای مدیریت پایدار منابع آب، طراحی سامانه‌های هشدار سیلاب و ارتقای بهره‌وری در بخش کشاورزی به‌شمار می‌رود. از سوی دیگر، تغییرات اقلیمی و نوسانات شدید در الگوهای بارش، چالش‌های متعددی در پیش‌بینی این متغیر پیچیده ایجاد کرده است (Yilmaz, 2015). فرایند بارش از نظر مکانی و زمانی ماهیتی غیرخطی و تصادفی دارد و تحت تأثیر عوامل مختلفی چون دما، فشار، رطوبت، باد، تابش خورشید، شدت و مدت بارندگی، تبخیر و حتی پدیده‌های جوی دورپیوندی نظیر نوسان مادن-ژولین قرار می‌گیرد (Pariyar et al., 2020; Liyew et al., 2021). در چنین شرایطی، استفاده از مدل‌های پیشرفته که قادر به درک روابط پیچیده و غیرخطی میان متغیرهای اقلیمی باشند، ضرورتی اجتناب‌ناپذیر است. در سال‌های اخیر، مدل‌های یادگیری ماشین و عمیق به‌طور گسترده برای مدل‌سازی روابط غیرخطی در علوم جوی به‌کار رفته‌اند. در این میان، مدل‌های کلاسیک مانند رگرسیون خطی و سری‌های زمانی به دلیل وابستگی به فرضیات خطی و ناتوانی در شناسایی روابط پیچیده میان متغیرهای اقلیمی، کارایی محدودی در پیش‌بینی بارش داشته‌اند. در مقابل، مدل‌های یادگیری ماشین نظیر ماشین بردار پشتیبان (SVM)، جنگل تصادفی (Random Forest) و پرسپترون چندلایه[1] (MLP) در مطالعات متعددی نتایج بهتری از خود نشان داده‌اند (Mosavi et al., 2018). ستاری و همکاران (1392) در بررسی حداکثر بارش روزانه در ایستگاه‌های اهر و جلفا دریافتند که مدل درختی M5  با ساختار ساده و تفسیرپذیر، قابلیت زیادی در مدل‌سازی بارش ماهانه دارد. مدل‌های یادگیری عمیق به دلیل معماری پیچیده خود در شناسایی الگوهای پنهان، نسبت به سایر مدل‌ها از دقت بالاتری برخوردارند. موسوی و همکاران در مرور جامعی نشان ‌دادند که مدل‌هایی نظیر شبکه عصبی مصنوعی، SVM، درخت تصمیم و ترکیبی، دقت بالاتری نسبت به روش‌های آماری در پیش‌بینی سیلاب دارند (Mosavi et al., 2018). فهاد و همکاران با توسعه مدلی مبتنی بر واحد بازگشتی دروازه‌ای (GRU) برای پیش‌بینی بارش در پاکستان طی دوره 1991 تا 2020 نشان ‌دادند که حذف داده‌های پرت و انتخاب ویژگی‌های مؤثر، نقش کلیدی در بهبود عملکرد مدل‌های عمیق ایفا می‌کند (Fahad et al., 2023). شو و همکاران با معرفی مدل ترکیبیDC-CNN-BiLSTM  برای پیش‌بینی بارش در چین نشان دادند که ترکیب کانولوشن‌های علّی و توسعه‌یافته با شبکه حافظه کوتاه‌مدت و بلندمدت دوسویه (BiLSTM) می‌تواند ویژگی‌های مکانی - زمانی بارش را با دقت بالاتری شناسایی کند (Shu et al., 2025). وانگ و همکاران با توسعه مدلی هیبریدی مبتنی بر CNN-LSTM  برای پیش‌بینی شاخص چندبعدی بارش در ایالت مهاراشترا هند (شهر پونه) طی دوره 1972 تا 2002 نشان دادند که این مدل توانایی بالایی در شناسایی ویژگی‌های محلی و وابستگی‌های بلندمدت زمانی دارد (Wang et al., 2025)؛ با این حال، پژوهش مذکور تأکید کرده است که این مدل در مقیاس‌های بزرگ به منابع محاسباتی بالایی نیاز دارد و پیش‌بینی داده‌های چندبعدی بارش همچنان نیازمند بهبود است. با وجود پیشرفت‌های چشمگیر در این حوزه، بررسی مطالعات موجود نشان می‌دهد که تمرکز عمده این پژوهش‌ها بر مناطق مرطوب و نیمه‌مرطوب بوده و کاربرد این مدل‌ها در مناطق خشک ایران، به‌ویژه شهر یزد، کمتر بررسی شده است. این در حالی است که مناطق خشک به دلیل آسیب‌پذیری بیشتر در برابر تغییرات اقلیمی و کمبود منابع آبی، به مطالعات دقیق‌تری در این زمینه نیاز دارند. همچنین، مقایسه عملکرد مدل‌ها در اقلیم‌های متضاد می‌تواند درک دقیق‌تری از پایداری و تعمیم‌پذیری آن‌ها فراهم کند. در این پژوهش، با استفاده از داده‌های اقلیمی و هواشناسی طی دوره ۲۸‌ساله (۱۹۹۵ تا ۲۰۲۲)، عملکرد چهار مدل یادگیری پیشرفته شامل شبکه عصبی عمیق (DNN)، ماشین بردار پشتیبان (SVM)، شبکه بازگشتی دوسویه (BiLSTM) و مدل ترکیبی CNN-BiLSTM  برای پیش‌بینی بارش فصلی بررسی شده است. در این راستا، دو منطقه با اقلیم کاملاً متضاد، شامل اقلیم مرطوب رشت و اقلیم خشک یزد، به‌عنوان مطالعه موردی انتخاب شدند. هدف اصلی تحقیق، ارزیابی دقت، پایداری و قابلیت تعمیم این مدل‌ها در شرایط اقلیمی متفاوت و شناسایی مناسب‌ترین مدل برای پیش‌بینی بارش فصلی است و مقصود از مدل‌سازی، پیش‌بینی داده محور با مدل‌های یادگیری ماشین است. نوآوری پژوهش حاضر، به‌کارگیری مدل ترکیبی CNN-BiLSTM  برای نخستین‌بار در منطقه خشک یزد و مقایسه آن با نتایج منطقه مرطوب رشت است؛ یافته‌هایی که می‌توانند در ارتقای سامانه‌های پیش‌آگاهی سیلاب و مدیریت منابع آب در اقلیم‌های مختلف کشور نقش مؤثری ایفا کنند.

 

روش‌شناسی پژوهش

این پژوهش از نوع کاربردی و مبتنی بر پیش‌بینی داده‌محور با استفاده از روش‌های یادگیری ماشین و یادگیری عمیق انجام شده است. در این راستا، داده‌های بارش فصلی دو ایستگاه رشت و یزد طی دوره ۲۸‌ساله (۱۹۹۵ تا ۲۰۲۲) برای آموزش، ارزیابی و صحت‌سنجی مدل‌ها به‌کار گرفته شد. انتخاب این دو ایستگاه که نماینده اقلیم‌های کاملاً متفاوت مرطوب خزری (رشت) و خشک بیابانی (یزد) هستند، امکان مقایسه دقیق‌تر توانایی مدل‌ها در پیش‌بینی بارش را در شرایط اقلیمی متضاد فراهم ساخت. ایستگاه رشت در مختصات جغرافیایی37 درجه و 16 دقیقه عرض شمالی و 49 درجه و 36 دقیقه طول شرقی واقع شده است و دارای اقلیم مرطوب خزری است. ایستگاه یزد نیز در محدوده طول جغرافیایی 31 درجه و ۵4 دقیقه عرض شمالی و 54 درجه و 22 دقیقه طول شرقی قرار دارد و اقلیم خشک بیابانی را داراست (حیدری‌علمدارلو و همکاران، 1398). ویژگی‌های آب‌وهوایی این دو ایستگاه در جدول ۱ ارائه شده است و موقعیت جغرافیایی آنها در شکل ۱ نمایش داده شده است.

 

شکل 1: موقعیت جغرافیایی ایستگاه‌های رشت و یزد (منبع: نویسندگان)

Figure 1: Geographical location of the stations of Rasht and Yazd (Source: Authors)

 

جدول 1: ویژگی‌های آب‌وهوایی ایستگاه‌های رشت و یزد (منبع: سازمان هواشناسی شهر یزد و رشت)

Table 1: Weather characteristics of Rasht and Yazd stations (Source: Yazd and Rasht Meteorological Organization)

ایستگاه رشت

ایستگاه یزد

ویژگی‌های آماری ایستگاه

°C40

°C 56

بیشینه دمای ثبت‌شده

°C19-

°C 12-

کمینه دمای ثبت‌شده

1359 میلی‌متر

2/59 میلی‌متر

میانگین بارش سالانه

138 روز

27 روز

تعداد روزهای بارانی

170 میلی‌متر

9 میلی‌متر

حداکثر بارش ۲۴ ساعته

 

متغیرهای هواشناسی استفاده‌شده در این پژوهش شامل پارامتر‌های حداقل دما (°c)، حداکثر رطوبت نسبی (%)، سرعت باد میانگین (m/s) و ساعات آفتابی (h) و سه تأخیر بارش فصلی (mm) به‌عنوان پارامتر پیش‌بینی کننده و میزان بارش فصلی (mm) به‌عنوان پارامتر وابسته است که در دوسناریوی مختلف با ترکیبی متفاوت از پارامترهای ورودی مورد توجه قرار گرفت. سناریو اول شامل، پارامترهای هواشناسی و سناریو دوم ادغام پارامترهای هواشناسی با تأخیرهای بارش فصلی است. انتخاب تاخیرهای زمانی براساس تحلیل سری‌های زمانی و مطالعات پیشین صورت گرفت. پژوهش‌هایی مانند(2017) Qin et al.  و (2025) Guo et al.  نشان‌ داده‌اند که بارش فصلی دارای وابستگی‌های زمانی تا چند فصل گذشته است و لحاظ این تأخیرها موجب افزایش دقت پیش‌بینی در مدل‌های یادگیری عمیق می‌شود؛ بنابراین، سه تأخیر فصلی انتخاب شد تا حافظه زمانی بارش در ورودی مدل‌ها لحاظ شود. داده‌های استفاده‌شده در این پژوهش، قبل از انجام فرآیند مدل‌سازی مورد بررسی آماری و صحت‌سنجی قرار گرفت. مشخصات آماری هر ایستگاه در جدول ۲ ارائه شده‌اند تا نشان ‌داده شود که هر دو ایستگاه از نظر میانگین، انحراف معیار و دامنه تغییرات، نماینده ساختار کلی داده‌ها هستند.

 

جدول 2: مشخصات آماری پارامترهای آب و هواشناسی ایستگاه‌های رشت و یزد در مقیاس فصلی (منبع: نویسندگان)

Table 2: Statistical characteristics of weather and meteorological parameters of Rasht and Yazd cities on a seasonal scale (Source: Authors)

یزد

 

بارش

تأخیر سوم

تأخیر دوم

تأخیر اول

ساعات آفتابی

حداکثر رطوبت نسبی

حداقل دما

میانگین سرعت باد

آماری

(میلی‌متر)

(میلی‌متر)

(میلی‌متر)

(میلی‌متر)

(ساعت)

(%)

(درجه سلسیوس)

(متر بر ثانیه)

64/105

64/105

64/105

64/105

1107

93/80

36/25

54/3

بیشینه

25/13

79/12

17/13

67/12

17/851

52/40

48/13

6/2

میانگین

0

0

0

0

1/549

83/15

29/0-

27/1

کمینه

1/7

1/7

1/7

04/7

95/837

63/40

09/13

7/2

میانه

48/16

96/15

5/16

85/15

01/147

44/15

84/7

47/0

انحراف معیار

رشت

بارش

تأخیر سوم

تأخیر دوم

تأخیر اول

ساعات آفتابی

حداکثر رطوبت نسبی

حداقل دما

میانگین سرعت باد

آماری

(میلی‌متر)

(میلی‌متر)

(میلی‌متر)

(میلی‌متر)

(ساعت)

(%)

(درجه سلسیوس)

(متر بر ثانیه)

79/802

79/802

79/802

79/802

766

72/99

68/22

08/2

بیشینه

06/317

66/316

76/315

28/318

29/443

58/96

45/12

36/1

میانگین

91/50

91/50

91/50

91/50

9/122

25/91

09/1

43/0

کمینه

05/289

05/289

05/289

4/293

65/410

65/96

38/12

46/1

میانه

2/182

02/182

62/182

05/182

59/155

64/1

17/6

37/0

انحراف معیار

 

شاخص‌های آماری بیانگر تفاوت‌های اقلیمی چشمگیر بین رشت و یزد هستند. میانگین بارش فصلی در رشت برابر با 06/317 میلی‌متر و در یزد تنها 25/13 میلی‌متر است. دمای میانگین در یزد با 48/13 درجه سانتی‌گراد، نوسانات بیشتری نسبت به رشت (45/12 درجه سانتی‌گراد) دارد. رطوبت نسبی بیشینه در رشت بالا و پایدار (58/96 درصد) و در یزد پایین‌تر و ناپایدارتر (52/40 درصد) است. ساعات آفتابی در یزد 17/851 و در رشت 29/443 ‌ساعت گزارش شده است. همچنین میانگین تأخیر بارش‌ها در رشت بسیار بیشتر از یزد بوده است. این تفاوت‌ها، لزوم به‌کارگیری مدل‌های متناسب با ساختار اقلیمی هر منطقه را نشان‌می‌دهند.

مدل‌سازی در این پژوهش با استفاده از نرم‌افزار Python و چهار الگوریتم یادگیری ماشین و یادگیری عمیق شامل  CNN-BiLSTM، BiLSTM، DNN و SVM انجام شد. به‌منظور آموزش و ارزیابی مدل‌ها، داده‌های بارش فصلی و پارامترهای اقلیمی طی دوره ۲۸‌ساله (۱۹۹۵-۲۰۲۲) به‌صورت ترتیبی و براساس زمان به دو بخش تقسیم شدند، ۷۰% ابتدایی دوره (۱۹۹۵-۲۰۱۵) برای آموزش و ۳۰% انتهایی دوره (۲۰۱۶-۲۰۲۲) برای صحت‌سنجی. این تقسیم‌بندی سری زمانی از نشت اطلاعات آینده به مدل جلوگیری می‌کند و ارزیابی واقع‌گرایانه‌تری از عملکرد مدل‌ها فراهم می‌سازد. به‌منظور اطمینان از نمایندگی هر دو بخش از کل داده‌ها مشخصات آماری جداگانه برای داده‌های آموزش و صحت‌سنجی در ایستگاه‌های رشت و یزد محاسبه شد (جدول 3). نتایج نشان داد که میانگین، انحراف معیار، کمینه و بیشینه بارش در هر بخش اختلاف چشمگیری با کل داده‌ها ندارند؛ بنابراین، هر دو بخش به‌خوبی ساختار کلی سری زمانی را نمایندگی می‌کنند. همچنین، فرآیند نرمال‌سازی داده‌ها با استفاده از روش  Min-Max normalizationدر محیط Python انجام شد. این نرمال‌سازی داده‌ها را به بازه [0,1] تبدیل کرد و موجب بهبود عملکرد مدل‌ها، افزایش پایداری در آموزش و تطابق بهتر با ویژگی‌های الگوریتم‌های مورد استفاده شد. پیش از انجام مدل‌سازی، داده‌های بارش فصلی و پارامترهای اقلیمی مورد بررسی آماری و پیش‌پردازش قرار گرفتند. ابتدا داده‌ها از نظر وجود نواقص و مقادیر گمشده بررسی شدند. در مواردی که داده‌های گمشده محدود و مربوط به یک فصل بودند، از روش میانگین‌گیری فصلی ایستگاه مربوطه برای جایگزینی استفاده شد. در مواردی که داده‌های گمشده متوالی یا گسترده بودند، آن فصل از تحلیل حذف شد تا از ورود نویز به مدل جلوگیری شود. فلوچارت مراحل مدل‌سازی و پیش‌بینی بارش فصلی در شکل 2 نمایش داده شده است.

 

جدول 3: ویژگی‌های آماری داده‌های آموزش و صحت‌سنجی در ایستگاه‌های رشت و یزد (منبع: نویسندگان)

Table 3. Statistical characteristics of the training and validation data at Rasht and Yazd stations (Source: Authors)

انحراف معیار

کمینه (mm)

بیشینه (mm)

میانگین بارش (mm)

تعداد نمونه

بخش داده

ایستگاه

76/178

67/52

79/802

78/317

78

آموزش

رشت

42/192

91/50

36/743

44/315

34

آزمون

رشت

04/17

0

64/105

98/12

78

آموزش

یزد

39/15

0

41/56

86/13

34

آزمون

یزد

 

شکل 2: فلوچارت مراحل پیش‌بینی بارش فصلی (منبع: نویسندگان)

Figure 2: Flowchart of seasonal precipitation forecasting steps (Source: Authors)

 

شبکه عصبی پیچشی - بازگشتی (CNN-BiLSTM)

مدل CNN-BiLSTM یک معماری هیبریدی یادگیری عمیق است که از شبکه‌های عصبی کانولوشنی[2] (CNN) برای استخراج ویژگی‌های محلی و نوسانات کوتاه‌مدت در داده‌های چندمتغیره زمانی استفاده می‌کند و سپس با بهره‌گیری از شبکه‌های حافظه بلندمدت و کوتاه‌مدت دوطرفه[3] (BiLSTM)، وابستگی‌های زمانی بلندمدت و غیرخطی را از هر دو جهت زمانی مدل‌سازی می‌کند ( Ismail Fawaz et al., 2019; Lim et al., 2021). CNN با اعمال فیلترهای چندبعدی بر ورودی، سیگنال‌های مهم را تقویت و نویز را کاهش می‌دهد و همبستگی‌های مکانی بین متغیرها را استخراج می‌کند. خروجی CNN به BiLSTM منتقل می‌شود تا روابط پیچیده زمانی از گذشته به آینده و بالعکس تحلیل شود ( Lim et al., 2021; Cao et al., 2025). درنهایت، ویژگی‌های استخراج‌شده به لایه‌های کاملاً متصل (Fully Connected) داده می‌شود و پیش‌بینی نهایی صورت می‌گیرد. آموزش مدل معمولاً با الگوریتم Adam  و توابع هزینه MSE یا MAE انجام می‌شود (Huang et al., 2014). فرمول کلی خروجی یک فیلتر کانولوشنی یک‌بعدی در رابطه 1 به‌صورت زیر آورده شده است:

                                                        (1)

 

که در آن  ویژگی استخراج‌شده در زمان t توسط فیلتر k، ω پهنای فیلتر،  وزن‌های فیلتر کانولوشنی،  داده ورودی در زمان t+i،  بایاس فیلتر، k تعداد فیلترها و (⋅)𝑓 یک فعال‌سازی غیرخطی (مثلاً ReLU) است. خروجی این بخش به شبکه BiLSTM منتقل می‌شود تا وابستگی‌های زمانی بلندمدت و غیرخطی از دو جهت (گذشته به آینده و آینده به گذشته) مدل‌سازی شوند. معادلات بازگشتی BiLSTM در رابطه 2 و 3 به‌صورت زیر بیان شده است:

                                                        (2)

                                                                                                                         (3)

 

که در آن  بردار حالت مخفی در جهت رو به جلو،  بردار حالت مخفی در جهت رو به عقب،  ویژگی‌های استخراج‌شده توسط CNN در زمان t و  بردار نهایی ترکیب‌شده (concat) از دو جهت. چارچوب CNN-BiLSTM لایه‌های کانولوشنی را برای استخراج ویژگی‌های محلی با لایه‌های LSTM دوطرفه برای ثبت وابستگی‌های بلندمدت ترکیب می‌کند و آن را برای وظایف پیش‌بینی سری‌های زمانی مؤثر می‌سازد (Marjani et al., 2024). مدل CNN‑BiLSTM به‌منظور مدل‌سازی داده‌های چندمتغیره زمانی طراحی و پیاده‌سازی شد. در این معماری، ابتدا سه لایه کانولوشنی (Conv1D) با ۱۲۸ فیلتر و اندازه کرنل ۱ به‌کار گرفته شد تا ویژگی‌های محلی و نوسانات کوتاه‌مدت از داده‌ها استخراج شوند. خروجی این بخش به دو لایه حافظه بلندمدت و کوتاه‌مدت دوطرفه (Bidirectional LSTM) با ۷۴ و ۶۴ واحد منتقل شد. به‌منظور کاهش بیش‌برازش، در این لایه‌ها از dropout با نرخ‌های 2/0 و 4/0 و همچنین recurrent dropout با مقادیر 1/0 و 8/0 استفاده شد. در ادامه، یک لایه Dense با ۳۲ نرون و تابع فعال‌سازی ReLU و درنهایت یک لایه خروجی با تابع فعال‌سازی خطی به مدل افزوده شد تا پیش‌بینی نهایی انجام شود. فرآیند آموزش مدل با استفاده از الگوریتم Adam و نرخ یادگیری 0004/0 انجام شد. تابع هزینه انتخاب‌شده log-cosh بود که در مقایسه با MSE و MAE عملکرد بهتری در داده‌های نوسانی ارائه داد. مدل در ۲۰ دوره (epoch) و با اندازه دسته (batch size) برابر با ۶ آموزش داده شد. پیش از آموزش، داده‌ها با استفاده از نرمال‌سازی Min-Max مقیاس‌بندی شدند. در این مدل از معیار توقف زودهنگام (Early Stopping) استفاده نشد و مقدار seed به‌صورت صریح تنظیم نشد. در جدول 4 جزئیات معماری مدل ارائه شده است.

 

جدول 4: جزئیات معماری مدل CNN-BiLSTM (منبع: نویسندگان)

Table 4: Architectural details of the CNN-BiLSTM model (Source: Authors)

Parameter (CNN-BiLSTM)

Value / Description

Optimizer

Adam (learning rate = 0.0004)

Loss Function

Log-cosh

Epochs

20

Batch Size

6

Dropout Rate

0.2 (first BiLSTM layer), 0.4 (second BiLSTM layer)

Recurrent Dropout

0.1 (first BiLSTM layer), 0.8 (second BiLSTM layer)

Activation Functions

ReLU (Conv1D and Dense layers), tanh (BiLSTM layers), Linear (output layer)

Normalization Method

Min-Max scaling applied to both input features and target variable

Sequence Window Size

1

Early Stopping

Not applied

Random Seed

Not explicitly set

Hyperparameter Tuning

Manual trial-and-error; selected based on RMSE and NSE on validation data

شبکه عصبی بازگشتی دوسویه (BiLSTM)

شبکه‌های BiLSTM نوعی خاص از شبکه‌های عصبی بازگشتی[4] (RNN) هستند که دارای دو مسیر زمانی مجزا‌ هستند: یکی به جلو (از گذشته به آینده) و دیگری به عقب (از آینده به گذشته). این معماری دوطرفه امکان درک هم‌زمان اطلاعات گذشته و آینده و مدل‌سازی دقیق‌تر وابستگی‌های زمانی بلندمدت را فراهم می‌کند. در ساختار هر واحد LSTM سه دروازه اصلی وجود دارد: فراموشی (Ft)، ورودی (It) و خروجی (Ot) که به‌طور مداوم وضعیت حافظه سلولی را کنترل و به‌روزرسانی می‌کنند. در هر گام زمانی، این دروازه‌ها ورودی فعلی و خروجی مرحله قبلی را پردازش کرده و به مدل اجازه می‌دهند تا وابستگی‌های زمانی پیچیده و غیرخطی را یاد بگیرد (Guo et al., 2025). مدل شبکه عصبی بازگشتی دوسویه (BiLSTM) با هدف مدل‌سازی وابستگی‌های زمانی بلندمدت و غیرخطی در داده‌های چندمتغیره طراحی و پیاده‌سازی شد. این مدل از سه لایه بازگشتی دوطرفه (Bidirectional LSTM) بهره می‌برد که به‌ترتیب دارای ۱۲۸، ۱۲۸ و ۱۶ واحد هستند. لایه‌های اول و دوم به‌صورت دنباله‌دار (return_sequences=True) تعریف شدند تا خروجی هر گام زمانی به گام بعدی منتقل شود. پس از هر یک از این دو لایه، از لایه Dropout با نرخ 3/0 استفاده شد تا از بیش‌برازش جلوگیری شود. در ادامه، یک لایه Dense با ۱۰ نرون و تابع فعال‌سازی ReLU و در نهایت یک لایه خروجی با تابع فعال‌سازی خطی برای پیش‌بینی مقدار بارش به مدل افزوده شد. فرآیند آموزش مدل با استفاده از الگوریتم Adam و تابع هزینه MAE انجام شد. مدل در ۱۰۰ دوره (epoch) و با اندازه دسته (batch size) برابر با ۸ آموزش داده شد. داده‌ها پیش از ورود به مدل با استفاده از نرمال‌سازی Min-Max  مقیاس‌بندی شدند. در این مدل از معیار توقف زودهنگام (Early Stopping) استفاده نشد و مقدار seed به‌صورت صریح تنظیم نشد. تنظیم ابرپارامترها به‌صورت دستی و از طریق روش آزمون و خطا انجام شد. ترکیب‌های مختلفی از تعداد واحدهای LSTM، نرخ dropout، تعداد نرون‌های لایه Dense و تعداد epoch بررسی شدند و در نهایت، بهترین پیکربندی براساس کمینه‌سازی RMSE و بیشینه‌سازی NSE روی داده‌های اعتبارسنجی انتخاب شد. در جدول 5 جزئیات معماری مدل ارائه شده است.

 

جدول 5: جزئیات معماری مدل BiLSTM (منبع: نویسندگان)

Table 5: Architectural details of the BiLSTM model (Source: Authors)

Parameter (BiLSTM)

Value / Description

Optimizer

Adam (default learning rate)

Loss Function

Mean Absolute Error (MAE)

Epochs

100

Batch Size

8

Dropout Rate

0.3 (applied after first and second BiLSTM layers)

Activation Functions

tanh (BiLSTM layers), ReLU (Dense layer), Linear (output layer)

Normalization Method

Min-Max scaling applied to both input features and target variable

Sequence Window Size

1

Early Stopping

Not applied

Random Seed

Not explicitly set

Hyperparameter Tuning

Manual trial-and-error; selected based on RMSE and NSE on validation data

شبکه عصبی‌‌ عمیق (DNN)

شبکه عصبی عمیق[5] (DNN) زیرمجموعه‌ای از یادگیری ماشین است که با بهره‌گیری از چندین لایه پردازشی، قادر به استخراج ویژگی‌های سطح بالا از داده‌های خام است (Leyiw et al., 2021). این مدل‌ها با تحلیل الگوهای گذشته، پیش‌بینی دقیق در زمینه‌هایی مانند هیدرولوژی، آب‌وهوا و تقاضای مشاغل ارائه می‌دهند. هر نورون ورودی‌ها را با وزن‌های معین و یک بایاس ترکیب می‌کند. سپس با استفاده از تابع فعال‌سازی غیرخطی پردازش و به لایه بعدی منتقل می‌کند (Mai et al., 2021). وزن‌ها در طی فرآیند آموزش برای کاهش خطا بهینه می‌شوند. از چالش‌های مهم شبکه‌های عمیق نیاز به حجم بالای داده‌های آموزشی و منابع محاسباتی قوی است که می‌تواند محدودیت‌هایی برای پژوهشگران و سازمان‌های کوچک ایجاد کند (Mittal, 2020). مدل شبکه عصبی عمیق (DNN) به‌منظور پیش‌بینی بارش با استفاده از داده‌های چندمتغیره طراحی و پیاده‌سازی شد. این مدل شامل سه لایه پنهان از نوع Dense با تعداد نرون‌های ۱۲، ۱۶ و ۱۶ بود که به‌ترتیب با تابع فعال‌سازی ReLU عمل می‌کردند. در این مدل از لایه  Dropoutاستفاده نشد. فرآیند آموزش مدل با استفاده از الگوریتم Adam و تابع هزینه MSE انجام شد. مدل در ۱۰۰ دوره (epoch) و با اندازه دسته (batch size) برابر با ۳۲ آموزش داده شد. داده‌ها پیش از ورود به مدل با استفاده از نرمال‌سازی  Min-Max مقیاس‌بندی شدند. در این مدل از معیار توقف زودهنگام (Early Stopping) استفاده نشد و مقدار seed به‌صورت صریح تنظیم نشد. تنظیم ابرپارامترها به‌صورت دستی و با روش آزمون و خطا انجام شد. ترکیب‌های مختلفی از تعداد نرون‌ها در لایه‌های پنهان، نرخ یادگیری، تعداد epoch و اندازه batch بررسی شدند و درنهایت، بهترین پیکربندی براساس کمینه‌سازی  RMSEو بیشینه‌سازی NSE روی داده‌های اعتبارسنجی انتخاب شد. در جدول 6 جزئیات معماری مدل ارائه شده است.

 

جدول 6: جزئیات معماری مدل DNN (منبع: نویسندگان)

Table 6: Architectural details of the SVM model (Source: Authors)

Parameter (DNN)

Value / Description

Optimizer

Adam (default learning rate)

Loss Function

Mean Squared Error (MSE)

Epochs

100

Batch Size

32

Dropout Rate

Not applied

Activation Functions

ReLU (hidden layers), Linear (output layer)

Normalization Method

Min-Max scaling applied to both input features and target variable

Sequence Window Size

1

Early Stopping

Not applied

Random Seed

Not explicitly set

Hyperparameter Tuning

Manual trial-and-error; selected based on RMSE and NSE on validation data

 

 

 

ماشین بردار پشتیبان (SVM)

ماشین بردار پشتیبان[6] (SVM) مجموعه‌ای از روش‌های یادگیری تحت نظارت است که معمولاً برای طبقه‌بندی دوگانه در فضای ویژگی‌های دلخواه اجرا می‌شود؛ بنابراین، برای مسائل پیش‌بینی مناسب است (Pai & Hong, 2007). مدل‌های SVM به‌طور کلی به دو دسته تقسیم می‌شوند: مدل‌های طبقه‌بندی (SVC) و مدل‌های رگرسیونی (SVR). در کاربرد رگرسیونی، SVM  از یک روش مبتنی بر نگاشت غیرخطی استفاده می‌کند که در آن داده‌های ورودی با استفاده از توابع هسته (Kernel Functions) به یک فضای ویژگی با ابعاد بالاتر نگاشت می‌شوند. سپس، یک ابرصفحه بهینه در این فضای جدید برای پیش‌بینی مقادیر هدف ایجاد می‌شود. هدف مدل، کمینه‌سازی تابع هزینه به‌گونه‌ای است که خطای پیش‌بینی کاهش یابد. دقت و عملکرد مدل  SVM به شدت به نوع تابع هسته انتخابی، پارامترهای تنظیم و اندازه مجموعه آموزشی بستگی دارد. در این فضای جدید، مدل به دنبال یافتن یک تابع رگرسیونی بهینه به‌شکل رابطه 4 است (Smola et al., 2004):

                                                                                       (4)

 

که در آنw  بردار وزن‌ها،b  بایاس وx  بردار ورودی است. مسئله بهینه‌سازی مربوط به SVR به‌صورت رابطه 5 تعریف می‌شود:

                                                         (5)

با قیود:

 

 

که در آن  مقدار واقعی بارش،  پارامتر خطای مجاز (ε-insensitive loss)،  و  متغیرهای کمکی (slack variables) برای نمونه‌های خارج از محدوده خطای مجاز،  پارامتر جریمه که موازنه بین پیچیدگی مدل و میزان خطای مجاز را کنترل می‌کند. مدل ماشین بردار پشتیبان (SVM) در این پژوهش به‌صورت رگرسیونی (SVR) پیاده‌سازی شد تا مقادیر بارش را براساس داده‌های چندمتغیره پیش‌بینی کند. در این مدل، داده‌های ورودی با استفاده از توابع هسته (Kernel Functions) به فضای ویژگی با ابعاد بالاتر نگاشت شدند تا امکان مدل‌سازی روابط غیرخطی فراهم شود. سپس، یک ابرصفحه بهینه در این فضای جدید برای پیش‌بینی خروجی هدف (بارش) ایجاد شد. به‌منظور افزایش دقت مدل، از نرمال‌سازی Min-Max برای مقیاس‌بندی داده‌های ورودی و خروجی استفاده شد. برای آموزش مدل، از تابع هزینه ε-insensitive loss استفاده شد که در ساختار SVR به‌طور پیش‌فرض اعمال می‌شود. فرآیند آموزش شامل هیچ دوره (epoch) یا دسته‌بندی (batch size) خاصی نبود؛ زیرا مدل SVM بر پایه حل مسائل بهینه‌سازی محدب عمل می‌کند و نیازی به آموزش تکراری ندارد. همچنین، از معیار توقف زودهنگام (Early Stopping) استفاده نشد و مقدار seed به‌صورت صریح تنظیم نشد. تنظیم ابرپارامترهای مدل شامل انتخاب مقدار مناسب برای پارامترهای C، ε  و γ بود. برای این منظور، از روش GridSearchCV با اعتبارسنجی متقاطع سه‌تایی (3-fold cross-validation) استفاده شد. ترکیب‌های مختلفی از مقادیر C ∈ {1, 100}،ε ∈ {0.1, 0.5, 1}  و γ ∈ {scale, auto, 0.001, 0.01, {0.1, 1, 10 بررسی شدند و بهترین پیکربندی براساس کمینه‌سازی RMSE و بیشینه‌سازی NSE روی داده‌های اعتبارسنجی انتخاب شد. در جدول 7 جزئیات معماری مدل ارائه شده است.

 

جدول 7: جزئیات معماری مدل SVM (منبع: نویسندگان)

Table 7: Architectural details of the SVM model (Source: Authors)

Parameter (SVM)

Value / Description

Model Type

Support Vector Regression (SVR)

Loss Function

ε-insensitive loss

Epochs

Not applicable

Batch Size

Not applicable

Optimizer

Not applicable (SVR uses quadratic programming)

Activation Functions

Not applicable

Normalization Method

Min-Max scaling applied to both input features and target variable

Sequence Window Size

1

Early Stopping

Not applied

Random Seed

Not explicitly set

Hyperparameter Tuning

GridSearchCV with 3-fold cross-validation; C ∈ {1, 100}, ε ∈ {0.1, 0.5, 1}, γ ∈ {scale, auto, 0.001–10}

 

برای ارزیابی عملکرد مدل‌های استفاده‌شده در این پژوهش، از معیارهای آماری شامل ضریب همبستگی[7] (R)، جذر میانگین مربعات خطا[8] (RMSE) و ضریب نش - ساتکلیف[9] (NSE) استفاده شده است. R، معیاری آماری است که قدرت و جهت رابطه بین دو متغیر را توصیف می‌کند. ضریب نزدیک به 1- یا 1 نشان‌دهنده همبستگی قوی است؛ در حالی که ضریب صفر نشان‌دهنده عدم همبستگی است (رابطه 6). RMSE به‌عنوان یکی از معیارهای اصلی برای ارزیابی و مقایسه عملکرد مدل‌ها مورد استفاده قرار می‌گیرد. مقدار RMSE در بازه صفر تا مثبت بی‌نهایت قرار دارد که بر این اساس، بهترین مدل، مدلی است که کمترین RMSE را داشته باشد (رابطه 7). NSE یک معیار پرکاربرد در هیدرولوژی برای ارزیابی مهارت پیش‌بینی مدل‌های هیدرولوژیکی است که محدوده آن از منفی بی‌نهایت تا یک است، که در آن بازه یک، نشان‌دهنده تطابق کامل بین مدل و داده‌های مشاهده شده است، مقادیر کمتر از صفر نشان می‌دهند که میانگین مشاهدات عملکرد بهتری نسبت به مدل ارائه می‌دهد و بنابراین مدل فاقد کارایی است (رابطه 8). میانگین خطای مطلق (MAE) نیز به‌عنوان یکی از شاخص‌های پرکاربرد برای ارزیابی دقت مدل‌ها به کار گرفته می‌شود. این معیار میانگین قدر مطلق اختلاف بین مقادیر مشاهده‌ای و مقادیر شبیه‌سازی‌شده را محاسبه می‌کند و برخلاف RMSE، اندازه خطاها را به‌صورت خطی در نظر می‌گیرد. مقدار MAE همواره غیرمنفی است و هرچه به صفر نزدیک‌تر باشد، نشان‌دهنده عملکرد بهتر مدل است (رابطه 9).

(6)                                                                        

(7)                                                                        

(8)                                                                              

                                                                               (9)

 

در روابط (9-6)، پارامتر‌های Pi و Oi به‌ترتیب مقادیر پیش‌بینی‌شده مدل و مشاهداتی در زمان i،  میانگین مقادیر مشاهده شده،  میانگین مقادیر پیش‌بینی‌شده و n تعداد کل داده‌ها (یا بازه‌های زمانی) هستند.

 

یافته‌های پژوهش و تجزیه‌وتحلیل

در این پژوهش، طراحی سناریوهای ورودی براساس نتایج پیش‌پردازش داده‌ها و تحلیل همبستگی بین متغیرها انجام شد. پارامترهای هواشناسی به دلیل نقش مستقیم در فرایند بارش و همبستگی قابل‌قبول با متغیر هدف (بارش فصلی)، به‌عنوان ورودی پایه در نظر گرفته شدند. علاوه بر آن، به‌منظور لحاظ‌کردن وابستگی‌های زمانی و افزایش توان مدل در بازسازی روندهای گذشته، سه تأخیر متوالی بارش نیز به ترکیب ورودی‌ها افزوده شد؛ بنابراین، سناریوی اول شامل پارامترهای هواشناسی و سناریوی دوم شامل ترکیب پارامترهای هواشناسی و تأخیرهای بارش است. این طراحی امکان مقایسه اثر ورودی‌های پایه و ورودی‌های گسترده‌تر را فراهم می‌سازد و با رویکرد ارائه‌شده در بخش پیش‌پردازش داده‌ها سازگار است. در شکل 3، برای بررسی روابط بین متغیرهای ورودی، ماتریس همبستگی بین پارامترهای اقلیمی و تأخیرهای زمانی بارش در دو ایستگاه محاسبه شد. متغیرهای استفاده‌شده شامل بارش فصلی (Rain)، دمای کمینه (Tmin)، میانگین سرعت باد (FFm)، سرعت بیشینه باد (Umax)، ساعات آفتابی (SSHN) و سه تأخیر زمانی بارش (First-Lag، Second-Lag، Third-Lag) بودند. براساس ماتریس همبستگی، تأخیر سوم بارش، ساعات آفتابی و رطوبت نسبی بیشترین همبستگی را با بارش فصل جاری دارند، که در انتخاب ورودی‌های مدل لحاظ شدند.

 

شکل 3: نمودار ماتریس همبستگی بارش فصلی ایستگاه یزد و رشت (منبع: نویسندگان)

Figure 3: Correlation matrix diagram of seasonal precipitation in Yazd and Rasht station (Source: Authors)

در ادامه، عملکرد مدل‌های SVM، CNN-BiLSTM،BiLSTM  و DNN روی داده‌ها بررسی شد. برای سنجش دقت مدل‌ها، معیارهای آماری شامل ضریب همبستگی (R)، جذر میانگین مربعات خطا (RMSE) و ضریب نش - ساتکلیف (NSE) و میانگین خطای مطلق (MAE) در مرحله آموزش و آزمون محاسبه شد و نتایج آن‌ها در جدول 8  و جدول 9 گزارش شده‌اند.

 

جدول 8: شاخص‌های ارزیابی عملکرد مدل‌های مورد مطالعه در مرحله آموزش در ایستگاه‌های رشت و یزد (منبع: نویسندگان)

Table 8: Performance evaluation metrics of the studied models during the training phase at Rasht and Yazd stations (Source: Authors)

 

رشت

ایستگاه

MAE

NSE

RMSE (mm)

R

مدل

سناریو

16/67

75/0

46/88

88/0

CNN-BiLSTM

1

39/99

56/0

71/110

80/0

BiLSTM

1

32/78

66/0

06/113

85/0

DNN

1

62/87

60/0

35/117

76/0

SVM

1

90/8

99/0

66/11

99/0

CNN-BiLSTM

2

45/13

99/0

04/15

99/0

BiLSTM

2

28/35

94/0

91/41

98/0

DNN

2

41/38

92/0

09/49

96/0

SVM

2

یزد

ایستگاه

MAE

NSE

RMSE (mm)

R

مدل

سناریو

35/4

71/0

09/9

86/0

CNN-BiLSTM

1

83/4

64/0

15/10

81/0

BiLSTM

1

30/5

72/0

01/9

85/0

DNN

1

10/5

60/0

60/10

80/0

SVM

1

94/0

99/0

65/1

99/0

CNN-BiLSTM

2

49/2

96/0

30/3

99/0

BiLSTM

2

20/4

86/0

40/6

92/0

DNN

2

72/2

77/0

16/8

91/0

SVM

2

 

 

 

جدول 9: شاخص‌های ارزیابی عملکرد مدل‌های مورد مطالعه در مرحله آزمون (صحت‌سنجی) در ایستگاه‌های رشت و یزد (منبع: نویسندگان)

Table 9: Performance evaluation metrics of the studied models during the testing (validation) phase at Rasht and Yazd stations (Source: Authors)

 

رشت

ایستگاه

MAE

NSE

RMSE (mm)

R

مدل

سناریو

51/89

60/0

79/122

82/0

CNN-BiLSTM

1

89/115

40/0

56/161

70/0

BiLSTM

1

34/124

34/0

18/154

68/0

DNN

1

84/104

57/0

92/124

78/0

SVM

1

88/29

90/0

89/61

94/0

CNN-BiLSTM

2

02/27

88/0

58/64

93/0

BiLSTM

2

71/54

85/0

24/73

93/0

DNN

2

01/57

85/0

62/74

93/0

SVM

2

یزد

ایستگاه

MAE

NSE

RMSE (mm)

R

مدل

سناریو

61/7

40/0

99/11

65/0

CNN-BiLSTM

1

03/8

36/0

13/12

63/0

BiLSTM

1

73/8

28/0

88/12

58/0

DNN

1

71/8

30/0

76/12

62/0

SVM

1

88/1

80/0

48/7

89/0

CNN-BiLSTM

2

30/3

70/0

33/8

84/0

BiLSTM

2

97/5

64/0

14/9

81/0

DNN

2

47/4

69/0

47/8

83/0

SVM

2

 

مطابق جدول 8 (مرحله آموزش) و جدول 9 (مرحله آزمون)، عملکرد مدل‌ها در دو سناریوی ورودی و در دو ایستگاه اقلیمی متفاوت (رشت و یزد) مقایسه شد. در مرحله آموزش و در سناریوی اول، مدل CNN-BiLSTM در ایستگاه رشت با ضریب همبستگی 82/0، خطای RMSE برابر با 79/122 میلی‌متر،MAE  معادل 51/89 میلی‌متر و NSE برابر با 60/0، بهترین عملکرد را نسبت به سایر مدل‌ها داشت. این برتری بیانگر توانایی این مدل در شناسایی الگوهای پیچیده بارش در اقلیم مرطوب است، حتی با ورودی‌های محدود. مدل SVM نیز با 78 /0 R=و 84/104MAE= عملکرد نسبتاً مطلوبی داشت؛ اما به دلیل ساختار ایستا و عدم توانایی در یادگیری وابستگی‌های زمانی، دقت آن کمتر از CNN-BiLSTM بود. مدل‌های BiLSTM و DNN نیز به‌ترتیب با 70/0R= و 68/0R= و MAE بالاتر (89/115 و 34/124 میلی‌متر) نتایج ضعیف‌تری ثبت کردند که نشان‌دهنده نیاز این مدل‌ها به ورودی‌های غنی‌تر برای بهبود دقت است. در مرحله آزمون و در سناریوی دوم، با افزودن سه تأخیر بارش و پارامترهای اقلیمی، دقت همه مدل‌ها به‌طور چشمگیری افزایش یافت؛ به‌ویژه مدل CNN-BiLSTM در ایستگاه رشت با 94/0R=، 89/61RMSE= میلی‌متر، 88/29MAE= میلی‌متر و 90/0NSE= بالاترین دقت را به دست آورد. این بهبود قابل توجه نشان می‌دهد که ترکیب لایه‌های کانولوشنی با حافظه دوطرفه زمانی، امکان استخراج هم‌زمان ویژگی‌های مکانی و زمانی را فراهم می‌کند و مدل را قادر می‌سازد تا نوسانات بارش را با دقت بیشتری بازسازی کند. در ایستگاه یزد نیز که اقلیم خشک و بارش‌های پراکنده‌تری دارد، CNN-BiLSTM با 89/0R=، 48/7RMSE= میلی‌متر، 54/3MAE= میلی‌متر و 94/0NSE= عملکرد بسیار مطلوبی داشت. این نتایج نشان می‌دهد که حتی در شرایط داده‌های نامنظم، مدل ترکیبی توانایی مدل‌سازی رفتار غیرخطی بارش را دارد. مقایسه عملکرد مدل‌ها در هر دو ایستگاه نشان می‌دهد که مدل‌های دارای حافظه زمانی (BiLSTM و CNN-BiLSTM) نسبت به مدل‌های ایستا (SVM و DNN) عملکرد بهتری دارند، به‌ویژه در سناریوی دوم که اطلاعات زمینه‌ای بیشتری در اختیار مدل‌ها قرار گرفته است. نمودارهای پراکنش شکل 4 نیز این یافته‌ها را تأیید می‌کنند؛ نقاط پیش‌بینی‌شده توسط CNN-BiLSTM به‌طور منظم‌تری روی خط 45 درجه قرار گرفته‌اند که نشان‌دهنده همبستگی بالا و پراکندگی کم است؛ با این حال، بررسی دقیق‌تر نمودارهای شکل 4 نشان می‌دهد که در ایستگاه یزد، یک نقطه خاص با مقدار واقعی حدود ۵۶ میلی‌متر وجود دارد که رفتار مدل‌ها در پیش‌بینی آن بسیار متفاوت بوده است. این مقدار در صدک‌های بالای توزیع بارش فصلی یزد قرار دارد و به‌عنوان یک رخداد حدی نادر شناخته می‌شود. مدل‌های حافظه‌دار مانند CNN-BiLSTM و BiLSTM توانسته‌اند دامنه این رخداد را نسبتاً دقیق‌تر بازسازی کنند، در حالی‌که مدل‌های فاقد حافظه مانند SVM و DNN دچار بیش‌برآوردی یا کم‌برآوردی شده‌اند. این تفاوت عملکرد را می‌توان به توانایی مدل‌های حافظه‌دار در یادگیری وابستگی‌های زمانی و تشخیص الگوهای غیرخطی نسبت داد. به‌طور کلی، الگوی رفتاری مدل‌ها در دو ایستگاه متفاوت است؛ در یزد، مدل‌ها تمایل به بیش‌برآوردی دارند؛ در حالی ‌که در رشت، رفتار مدل‌ها بیشتر به سمت کم‌برآوردی متمایل است. این تفاوت را می‌توان با ساختار آماری داده‌ها توجیه کرد. در یزد، به‌دلیل فراوانی مقادیر صفر و پراکندگی شدید، مدل‌ها در مواجهه با رخدادهای نادر، دامنه پیش‌بینی را بزرگ‌تر تخمین می‌زنند. در مقابل، در رشت با بارش‌های منظم‌تر، مدل‌ها روند را خوب بازسازی می‌کنند؛ اما در تخمین قله‌های بارش، محافظه‌کارانه‌تر، عمل و مقدار واقعی را کمتر برآورد می‌کنند.

 

 

 

شکل 4: نمودار پراکنش بارش فصلی مشاهداتی و تخمین یافته در دو ایستگاه رشت و یزد (منبع: نویسندگان)

Figure 4: Scatter diagram of observed and estimated seasonal precipitation at two stations: Rasht and Yazd (Source: Authors)

در شکل 5، مقایسه‌ای از مقادیر واقعی و پیش‌بینی‌شده بارش فصلی در ایستگاه‌های رشت و یزد را تحت سناریوی دوم و با استفاده از چهار مدل مختلف ارائه می‌دهد. همان‌طور که در نمودارها مشاهده می‌شود تمامی مدل‌ها توانسته‌اند روند کلی بارش را با دقت قابل‌قبول بازسازی کنند؛ با این حال، مدل ترکیبی CNN-BiLSTM عملکرد بهتری در بازسازی نوسانات بارش، به‌ویژه در دوره‌های اوج و فرود، از خود نشان داده است. در ایستگاه رشت با اقلیم مرطوب، مدل‌ها به‌ویژه  CNN-BiLSTM توانسته‌اند نوسانات بارش را با دقت بیشتری دنبال کنند. این موضوع را می‌توان به ساختار حافظه‌دار و یادگیری عمیق مدل و همچنین بهره‌گیری از ورودی‌های مؤثرتر نسبت داد. در ایستگاه یزد با اقلیم خشک، مدل‌ها روند کلی بارش را حفظ کرده‌اند؛ اما در برخی دوره‌ها، به‌ویژه در شرایط خشکسالی یا بارش‌های حدی، انحراف‌هایی مشاهده می‌شود. این تفاوت عملکرد را می‌توان به پراکندگی بیشتر داده‌ها، فراوانی مقادیر صفر و نوسانات شدید در فصل‌های خشک نسبت داد که موجب کاهش دقت مدل‌های فاقد حافظه مانند DNN و SVM شده است.

 

 

 

شکل 5: نمودار ستونی بارش فصلی مشاهداتی و تخمین‌یافته در دو ایستگاه رشت و یزد (منبع: نویسندگان)

Figure 5: Column chart of observed and estimated seasonal precipitation at two stations: Rasht and Yazd (Source: Authors)

 

در شکل 6، نمودارهای جعبه‌ای مقایسه‌ای بین مقادیر واقعی بارش و مقادیر پیش‌بینی‌شده توسط چهار مدل مختلف (CNN-BiLSTM، BiLSTM، DNN و SVM) را در سناریوی دوم و برای ایستگاه‌های رشت و یزد نمایش می‌دهد. این نمودارها شاخص‌های آماری نظیر میانه، چارک اول و سوم، دامنه تغییرات و نقاط پرت را شامل می‌شوند و به‌منظور ارزیابی توانایی مدل‌ها در بازسازی توزیع آماری بارش استفاده شده‌اند. در هر دو ایستگاه، به‌ویژه در رشت با اقلیم مرطوب، مدل CNN-BiLSTM توانسته است توزیع داده‌های واقعی را با دقت بالاتری بازسازی کند؛ به ‌طوری که موقعیت میانه، چارک‌ها و دامنه تغییرات در بسیاری از موارد با داده‌های واقعی تطابق نزدیکی دارد. مدل‌های BiLSTM و DNN نیز عملکرد پذیرفتنی داشته‌اند؛ هرچند در برخی موارد پراکندگی مقادیر پیش‌بینی‌شده نسبت به داده‌های واقعی بیشتر بوده است. در مقابل، مدل SVM  به‌ویژه در ایستگاه یزد با اقلیم خشک، عملکرد ضعیف‌تری داشته و انحراف بیشتری از ساختار آماری بارش نشان داده است.

به‌طور کلی، این نمودارها بیانگر آن هستند که استفاده از سناریوی دوم، شامل پارامترهای اقلیمی و سه تأخیر بارش، موجب بهبود بازسازی توزیع آماری بارش در بیشتر مدل‌ها شده است. در این میان، مدل CNN-BiLSTM در بازتولید ساختار آماری بارش در دو اقلیم متفاوت، عملکرد بهتری نسبت به سایر مدل‌ها ارائه داده است.

 

شکل6: نمودار جعبه‌ای مقایسه‌ای بارش فصلی ایستگاه‌های رشت و یزد (منبع: نویسندگان)

Figure 6: Comparative boxplot of seasonal precipitation at Rasht and Yazd stations (Source: Authors)

 

ارزیابی عددی مدل‌ها (جدول 9) نشان داد که سناریوی دوم با ورودی‌های کامل‌تر، دقت پیش‌بینی‌ها را به‌طور محسوسی افزایش داده است. این موضوع بیانگر آن است که ترکیب پارامترهای اقلیمی و تأخیرهای بارش، اطلاعات غنی‌تری را در اختیار مدل قرار داده و توانایی آن را در شناسایی الگوهای پیچیده بارش ارتقا داده است؛ با این حال، درخور ذکر است که افزایش تعداد ورودی‌ها الزاماً به معنای بهبود عملکرد مدل‌ها در تمامی شرایط نیست؛ زیرا ممکن است برخی متغیرها نقش کمرنگ‌تری داشته باشند یا حتی موجب ایجاد نویز شوند؛ بنابراین، انجام تحلیل حساسیت برای تعیین سهم و اهمیت نسبی هر یک از پارامترهای ورودی می‌تواند در پژوهش‌های آتی مفید باشد و به شفاف‌تر شدن نقش متغیرهای مؤثر در فرآیند پیش‌بینی کمک کند. مدل  CNN-BiLSTMبا ضریب همبستگی ۹۴/۰ و RMSE برابر ۸۹/۶۱ میلی‌متر در رشت و R معادل ۸۹/۰ و RMSE  برابر ۴۸/۷ میلی‌متر در یزد، بهترین عملکرد را ارائه داد. پس از آن، مدل BiLSTM نتایج نسبتاً دقیقی داشت؛ در حالی ‌که DNN  و SVM، به‌ویژه در یزد، دقت پایین‌تری نشان دادند. نمودار راداری (شکل 7) نیز برتری  CNN-BiLSTM را در همه شرایط تأیید می‌کند. به‌طور کلی، انتخاب سناریوی دوم در بهبود دقت مدل‌ها نقش اساسی داشته است.

 

شکل 7: نمودار راداری مقایسه عملکرد مدل‌ها (منبع: نویسندگان)

Figure 7: Radar chart comparing model performance (Source: Authors)

 

این پژوهش با هدف ارزیابی دقت مدل‌های مختلف یادگیری ماشین و یادگیری عمیق در پیش‌بینی بارش فصلی در دو اقلیم متضاد ایران انجام شد. در این راستا، مدل ترکیبی CNN-BiLSTM به‌دلیل توانایی در مدل‌سازی روابط غیرخطی و یادگیری وابستگی‌های زمانی پیچیده، به‌عنوان مدل اصلی بررسی شد. ارزیابی عملکرد مدل‌ها در سناریوی دوم نشان داد که  CNN-BiLSTM در هر دو ایستگاه رشت و یزد، نسبت به سایر مدل‌ها دقت بالاتری دارد.

لایه‌های کانولوشنی این مدل قادرند ویژگی‌های محلی و نوسانات کوتاه‌مدت داده‌های ورودی را استخراج کنند؛ در حالی ‌که ساختار BiLSTM وابستگی‌های زمانی بلندمدت را از هر دو جهت زمانی (گذشته و آینده) مدل‌سازی می‌کند. این ترکیب موجب شده است که CNN-BiLSTM بتواند الگوهای پیچیده در سری‌های زمانی چندمتغیره بارش را با دقت بالاتری بازسازی کند.

در ایستگاه رشت که دارای بارش‌های متوالی و با شدت متغیر است، استفاده از تأخیرهای بارش در کنار پارامترهای اقلیمی باعث شد مدل‌های دارای حافظه زمانی مانند BiLSTM و CNN-BiLSTM عملکرد بسیار مطلوبی داشته باشند؛ به‌ویژه  CNN-BiLSTM  با ضریب همبستگی 94/0 و RMSE برابر با 89/61 میلی‌متر نشان داد که درک دقیق وابستگی‌های زمانی در اقلیم‌های مرطوب نقش کلیدی در افزایش دقت پیش‌بینی دارد.

در ایستگاه یزد، با اقلیم خشک و بارش‌های پراکنده و نامنظم، مدل‌های فاقد حافظه مانند DNN عملکرد ضعیف‌تری داشتند. در مقابل، مدل SVM با ساختار ساده‌تر و مبتنی بر نگاشت غیرخطی، توانست در برخی شاخص‌ها عملکرد بهتری نسبت به DNN  ثبت کند؛ به‌ویژه در سناریوی دوم، ضریب همبستگی بالاتر و RMSE پایین‌تر مدل SVM نسبت به DNN، نشان‌دهنده توانایی بهتر آن در بازسازی رفتار بارش در اقلیم خشک و پراکنده یزد است. این برتری را می‌توان به انعطاف‌پذیری SVM در مواجهه با داده‌های نامنظم و دارای مقادیر صفر زیاد نسبت داد؛ در حالی ‌که مدل DNN به‌ دلیل نیاز به داده‌های حجیم و ساختارمند، در چنین شرایطی دچار افت دقت شده است؛ بنابراین، در جمع‌بندی نهایی مقاله، برتری نسبی SVM در ایستگاه یزد نسبت به  DNN به‌درستی منعکس می‌شود و با نتایج عددی جدول 9 و نمودارهای مربوطه هم‌خوانی دارد.

در مقابل،CNN-BiLSTM  با بهره‌گیری از سه تأخیر زمانی بارش و ساختار ترکیبی خود، توانست رفتار غیرخطی بارش را به‌خوبی مدل‌سازی کند. مدل BiLSTM نیز به‌دلیل قابلیت یادگیری وابستگی‌های دوطرفه زمانی، پس از CNN-BiLSTM عملکرد مطلوبی داشت؛ در حالی ‌که مدل‌های DNN و SVM به ‌دلیل فقدان حافظه و محدودبودن به روابط ایستا دقت کمتری ثبت کردند؛ به‌ویژه در دوره‌های بارش شدید یا ناگهانی در یزد و نوسانات فصلی در رشت.

برتری مدل CNN-BiLSTM عمدتاً ناشی از توانایی آن در استخراج همزمان ویژگی‌های مکانی و زمانی از داده‌های چندمتغیره است. همچنین، استفاده از سناریوی دوم که شامل تأخیرهای بارش و پارامترهای اقلیمی است، اطلاعات زمینه‌ای بیشتری برای یادگیری فراهم می‌کند و موجب می‌شود مدل‌ها رفتارهای گذشته سیستم را بهتر شناسایی و بازسازی کنند.

با این حال، مقایسه شکل 4 با شکل 6 نشان می‌دهد که جهت بایاس مدل‌ها در دو ایستگاه به‌صورت متفاوتی ظاهر شده است؛ در حالی‌ که در شکل ۶ مدل‌ها در یزد بیش‌برآوردی و در رشت کم‌برآوردی نشان می‌دهند، در شکل 7 این الگو معکوس شده است. این تفاوت برداشت را می‌توان به نوع نمایش نمودارها نسبت داد. شکل ۶ بر پایه پراکنش مقادیر پیش‌بینی‌شده در برابر مقادیر واقعی طراحی شده است و بیشتر تحت تأثیر نقاط حدی و دامنه نوسانات قرار دارد. در مقابل، شکل 7 توزیع باقیمانده‌ها را نمایش می‌دهد که گرایش مرکزی خطا را بهتر نشان می‌دهد. در یزد، به‌دلیل غالب‌بودن مقادیر بسیار کم و نادربودن رخدادهای پربارش، مدل‌ها در بازه‌های میانی تمایل به کم‌برآوردی دارند؛ اما در نقاط حدی دچار بیش‌برآوردی می‌شوند. در رشت نیز، مدل‌ها روند کلی را خوب بازسازی می‌کنند؛ اما در تخمین قله‌های بارش، مقدار واقعی را کمتر از حد پیش‌بینی می‌کنند؛ بنابراین، تفاوت ظاهری بین دو شکل ناشی از تمرکز هر نمودار بر جنبه‌ای خاص از خطای مدل‌هاست.

درمجموع، نتایج حاصل از داده‌های ۲۸‌ساله (۱۹۹۵ تا ۲۰۲۲) در دو اقلیم متفاوت و دو سناریوی ورودی، نشان می‌دهند که مدل CNN-BiLSTM در تمامی شرایط اعم از مرطوب یا خشک، منظم یا پراکنده به‌عنوان دقیق‌ترین و پایدارترین مدل پیش‌بینی بارش فصلی شناخته می‌شود. این یافته‌ها نه‌تنها با نتایج مطالعات پیشین هم‌راستا هستند، تأیید می‌کنند که استفاده از معماری‌های ترکیبی و ورودی‌های غنی، نقش تعیین‌کننده‌ای در افزایش دقت مدل‌های اقلیمی دارد. افزون بر نتایج عددی، بررسی مقایسه‌ای جایگاه مدل‌ها در دو سناریوی ورودی نیز نکات مهمی را آشکار می‌سازد؛ برای مثال، مدل SVM که در سناریوی اول با ورودی‌های اقلیمی عملکرد مناسبی داشت، در سناریوی دوم با اضافه‌شدن تأخیرهای زمانی بارش، به جایگاه چهارم سقوط کرد. این تغییر نشان می‌دهد که مدل‌های حافظه‌دار مانند BiLSTM و CNN-BiLSTM توانایی بیشتری در بهره‌برداری از وابستگی‌های زمانی دارند؛ در حالی‌ که مدل‌های غیرحافظه‌ای مانند SVM در مواجهه با ورودی‌های سری‌زمانی پیچیده دچار افت عملکرد می‌شوند.

همچنین، در مواردی مانند مدل BiLSTM، با وجود RMSE بالاتر نسبت به DNN، ضریب همبستگی بالاتری ثبت شده که نشان‌دهنده توانایی بهتر در بازسازی روند کلی داده‌هاست. این اختلاف ممکن است ناشی از حساسیت RMSE به مقادیر حدی و نوسانات شدید باشد؛ در حالی ‌که ضریب همبستگی رفتار کلی مدل را بهتر منعکس می‌کند.

بررسی شاخص‌های خطا در دو ایستگاه نشان می‌دهد که مدل‌ها در ایستگاه رشت عملکرد بهتری داشته‌اند که می‌توان آن را به ساختار منظم‌تر داده‌ها و همبستگی بالاتر بین پارامترها نسبت داد. درصد بهبود RMSE در سناریوی دوم نسبت به سناریوی اول برای مدل CNN-BiLSTM در ایستگاه رشت برابر با %3/18 و در یزد برابر با %7/9 بوده است که نشان می‌دهد تأثیر تأخیرهای زمانی در اقلیم‌های مرطوب بیشتر است. همان‌طور که در شکل 3 مشاهده شد، ورودی‌هایی با همبستگی بالا مانند تأخیر سوم بارش، حداکثر رطوبت نسبی و ساعات افتابی، نقش کلیدی در افزایش دقت مدل CNN–BiLSTM داشتند.

یافته‌های این تحقیق در زمینه پیش‌بینی بارش فصلی با مدل‌های CNN-BiLSTM، BiLSTM،DNN  و SVM در ایستگاه‌های رشت و یزد با نتایج مطالعات معتبر مشابه همخوانی دارد؛ برای مثال، در مقایسه با مطالعه کین و همکاران (Qin et al., 2017) که در پیش‌بینی سری‌های زمانی با استفاده از مدل dual-stage attention RNN توانستند ضریب همبستگی حدود 90/0 و RMSE بهبود یافته‌ای در حدود 10% نسبت به مدل‌های LSTM سنتی گزارش کنند نشان‌دهنده افزایش دقت درخور توجهی است. آنها همچنین کاهش خطای میانگین مطلق (MAE) به 12/0 را نشان دادند که بیانگر توانایی مدل در تمرکز مؤثر بر بخش‌های مهم داده‌های زمانی است. گوئو و همکاران (Guo et al., 2025) در مدل پیش‌بینی بارش روزانه با استفاده از CNN‑BiLSTM مجهز به مکانیزم Attention، ضریب کارایی نش برابر با 993/0 گزارش کردند که در قیاس با مدل‌های پایه 3/%15 و 6/‌%12 بهتر از CNN‑LSTM  و CNN‑BiLSTM بدون Attention نشان می‌دهد. این نتایج نشان‌دهنده افزایش شایان توجه در دقت پیش‌بینی بارش است و کاملاً با یافته‌های این تحقیق که ضریب همبستگی 94/0 و 89/0 را برای دو اقلیم مختلف دارد، هم‌راستا و تأییدکننده ارزش استفاده از معماری ترکیبی CNN‑BiLSTM با مکانیزم توجه در مدل‌سازی سری‌های زمانی پیچیده اقلیمی است. مطالعات دیگر مانند وانگ و همکاران (Wang et al., 2022) نیز بر اهمیت مدل‌های ترکیبی CNN-BiLSTM  همراه با بهینه‌سازی‌های فراابتکاری و مکانیزم توجه تأکید کرده‌اند. یافته‌های این پژوهش نیز تأیید می‌کند که مدل CNN-BiLSTM  در هر دو ایستگاه و دو سناریو، نسبت به مدل‌های BiLSTM، DNN و SVM، عملکرد بهتری دارد. در مطالعه ژانگ و همکاران (Zhang et al., 2024) در Xi’an چین با استفاده از مدل ترکیبیSCSSA-CNN-BiLSTM  نشان داد که این مدل قادر است به‌طور مؤثر ویژگی‌های داده‌ها و وابستگی‌های زمانی را در پیش‌بینی بارش ماهانه استخراج کند و عملکرد بهتری نسبت به مدل‌های SSA-CNN-BiLSTM،SCSSA-BiLSTM  وCNN-BiLSTM  داشته باشد. این مدل با بهره‌گیری از الگوریتم بهینه‌سازی SCSSA دقت پیش‌بینی را افزایش داده است. نتایج این مطالعه تأیید می‌کند که به‌کارگیری مدل‌های ترکیبیCNN-BiLSTM  همراه با الگوریتم‌های بهینه‌سازی می‌تواند عملکرد پیش‌بینی بارش را بهبود دهد؛ موضوعی که با یافته‌های پژوهش حاضر هم‌راستا است. با توجه به تفاوت‌های اقلیمی و مقیاس زمانی می‌توان گفت عملکرد مدل CNN-BiLSTM در ایران (اقلیم مرطوب رشت و خشک یزد) نیز با نتایج مطالعه چین تطابق دارد و نشان‌دهنده قابلیت مدل در پیش‌بینی دقیق سری‌های زمانی بارش در اقلیم‌های متنوع است. یافته‌های این پژوهش در زمینه پیش‌بینی بارش فصلی با استفاده از مدل CNN–BiLSTM در ایستگاه‌های رشت و یزد، با نتایج مطالعات داخلی مرتبط با اقلیم‌های خشک و نیمه‌خشک ایران هم‌راستا است. در مطالعه لطفی‌راد و همکاران (Lotfirad et al., 2022)، مدل جنگل تصادفی (Random Forest) برای پیش‌بینی خشکسالی در اقلیم‌های مختلف ایران به ‌کار گرفته شد. نتایج آن نشان داد که در مناطق گرم و خشک، دقت مدل کاهش می‌یابد و شاخص  SPEI عملکرد بهتری نسبت به SPI  دارد. همچنین، همبستگی بین شاخص‌ها در اقلیم‌های معتدل تا 95/0 و در اقلیم‌های خشک تا 35/0 گزارش شد. در مقایسه با این مطالعه، مدل CNN–BiLSTM در ایستگاه یزد (اقلیم خشک) با ضریب همبستگی 89/0 و RMSE برابر با 48/7 میلی‌متر، عملکرد بسیار دقیق‌تری ارائه داده است. این تفاوت نشان‌دهنده توانایی بالای مدل حافظه‌دار  CNN–BiLSTMدر مدیریت چالش‌های اقلیم خشک، ازجمله پراکندگی داده‌ها و فراوانی مقادیر صفر است. در مطالعه هماراش و همکاران (Hamarash et al., 2022) خشکسالی‌های هواشناسی در مناطق نیمه‌خشک ایران با استفاده از داده‌های TerraClimate و شاخص‌های SPI، SPEI  و PDSI  بررسی شد. آنها نشان دادند که مناطق گرم نیمه‌خشک ایران خشکسالی‌های شدیدتری را تجربه کرده‌اند و شاخص PDSI  در شناسایی دوره‌های بحرانی عملکرد بهتری داشته است. در پژوهش حاضر نیز مدل CNN–BiLSTM توانسته است مقادیر حدی بارش را در دوره‌های خشکسالی و ترسالی با دقت بالا بازسازی کند، به‌ویژه در ایستگاه یزد با اقلیم خشک و ایستگاه رشت با اقلیم مرطوب. مطالعه هماراش از شاخص‌های آماری بهره گرفته است؛ اما این پژوهش با استفاده از یادگیری عمیق و معماری ترکیبی، رفتار غیرخطی و نوسانی بارش را به‌صورت مؤثر مدل‌سازی کرده است. این هم‌راستایی در نتایج، اعتبار مدل CNN–BiLSTM را در اقلیم‌های چالشی ایران تأیید می‌کند.

 

نتیجه‌گیری

پیش‌بینی دقیق بارش فصلی در مناطق با اقلیم‌های متضاد مانند رشت و یزد، نقش مهمی در مدیریت منابع آب، برنامه‌ریزی کشاورزی و کاهش آسیب‌پذیری اقلیمی دارد. این پژوهش با استفاده از داده‌های ۲۸‌ساله و به‌کارگیری چهار مدل SVM، DNN،BiLSTM  و CNN-BiLSTM، عملکرد این مدل‌ها را در دو سناریوی ورودی بررسی کرد. نتایج نشان داد که مدل ترکیبی CNN-BiLSTM در هر دو ایستگاه، به‌ویژه در سناریوی دوم با ورودی‌های کامل‌تر، دقت بیشتری در پیش‌بینی بارش دارد. تأثیر مثبت تأخیر سوم بارش، رطوبت نسبی و ساعات آفتابی در بهبود عملکرد مدل نیز تأیید شد. یافته‌های این پژوهش با مطالعات پیشین هم‌راستا هستند؛ برای مثال، کین و همکاران (2017) و گوئو و همکاران (2025)  نیز نشان داده‌اند که لحاظ وابستگی‌های زمانی در ورودی مدل‌های یادگیری عمیق، موجب افزایش دقت پیش‌بینی بارش می‌شود. همچنین، نتایج این تحقیق با مطالعات لیم و همکاران (2021) در زمینه برتری مدل‌های ترکیبی CNN-LSTM در داده‌های اقلیمی هم‌خوانی دارد. نوآوری اصلی این پژوهش در به‌کارگیری مدل CNN-BiLSTM برای نخستین‌بار در اقلیم خشک یزد و مقایسه آن با اقلیم مرطوب رشت است که تاکنون در مطالعات داخلی کمتر مورد توجه قرار گرفته است. این تفاوت اقلیمی و عملکرد مدل‌ها نشان می‌دهد که ساختار داده و ویژگی‌های منطقه‌ای نقش تعیین‌کننده‌ای در انتخاب مدل مناسب دارند؛ با این حال، این پژوهش با محدودیت‌هایی نیز همراه بوده است. ازجمله حساسیت مدل‌های حافظه‌دار به کیفیت داده‌های ورودی، نیاز به حجم بالای داده برای آموزش مؤثر و کاهش دقت در مواجهه با رخدادهای حدی و نادر. همچنین، مدل‌های فاقد حافظه مانند SVM و DNN در شرایط اقلیمی ناپایدار عملکرد ضعیف‌تری داشتند. چالش دیگر، وابستگی مدل‌ها به نرمال‌سازی دقیق و تنظیم‌های بهینه‌سازی است که در شرایط عملیاتی ممکن است با محدودیت مواجه شود. یافته‌های این پژوهش می‌توانند به‌عنوان مبنایی برای توسعه سامانه‌های هوشمند هشدار بارش، مدیریت خشکسالی و بهینه‌سازی تخصیص منابع آبی مورد استفاده قرار گیرند؛ به‌ویژه در مناطق خشک، استفاده از مدل‌های حافظه‌دار با ورودی‌های چندمنبعی می‌تواند به شناسایی زودهنگام دوره‌های کم‌آبی کمک کند. پیشنهاد می‌شود در مطالعات آینده، مدل‌های ترکیبی با داده‌های ماهواره‌ای، سنجش‌از‌دور و شاخص‌های خاک و پوشش گیاهی نیز بررسی شوند تا دقت پیش‌بینی در مقیاس‌های بزرگ‌تر و کاربردهای عملیاتی افزایش یابد. همچنین، ارزیابی مدل‌ها در بستر سامانه‌های هشدار واقعی و تحلیل هزینه - فایده پیاده‌سازی آنها در مدیریت منابع آب، گام بعدی در جهت عملیاتی‌سازی این نتایج خواهد بود.

 

[1] Multilayer Perceptron

[2] Convolutional Neural Networks

[3] Bidirectional Long-Short Term Memory

[4] Recurrent Neural Networks

[5] Deep Neural Network

[6] Support Vector Machine

[7] Correlation

[8] Root Mean Square Error

[9] Nash-Sutcliffe coefficient

منابع
حیدری علمدارلو، اسماعیل، خسروی، حسن، و نسب‌پور مولایی، سحر (۱۳۹۸). مطالعه شاخص اقلیم آسایش گردشگری در مناطق خشک: مطالعه موردی استان یزد. تحقیقات کاربردی علوم جغرافیایی، ۱۹(۵۴)، ۲۰۵–۲۱۷.
ستاری، محمدتقی، و نهرین، فرناز (1392). پیش‌بینی مقادیر حداکثر بارش روزانه با استفاده از سیستم‌های هوشمند و مقایسه آن با مدل درختی  M5؛ مطالعه موردی ایستگاه‌های اهر و جلفا. نشریه علمی‌پژوهشی مهندسی آبیاری و آب ایران، 4(2)، 83-98. http://www.waterjournal.ir/article_70880.html
Reference
Ali, M., Deo, R. C., Downs, N. J., & Maraseni, T. (2018). Multi-stage hybridized online sequential extreme learning machine integrated with Markov Chain Monte Carlo Copula-Bat algorithm for rainfall forecasting. Atmospheric Research213, 450-464.
Bagirov, A. M., Mahmood, A., & Barton, A. (2017). Prediction of monthly rainfall in Victoria, Australia: Clusterwise linear regression approach. Atmospheric Research188, 20-29. http://doi.org/10.1016/j.atmosres.2017.01.003
Cao, X., Zheng, S., Zhang, J. et al. (2025). A hybrid CNN-Bi-LSTM model with feature fusion for accurate epilepsy seizure detection. BMC Medical Informatics and Decision Making, 25, 6. http://doi.org/10.1186/s12911-024-02845-0
Fahad, S., Su, F., Khan, S. U., Naeem, M. R., & Wei, K. (2023). Implementing a novel deep learning technique for rainfall forecasting via climatic variables: An approach via hierarchical clustering analysis. Science of The Total Environment854, 158760.
Guo, L., Pu, Y., & Zhao, W. (2025). CNN-BiLSTM Daily Precipitation Prediction Based on Attention Mechanism. Atmosphere16(3), 333. http://doi.org/10.3390/atmos16030333
Hamarash, H., Hamad, R., & Rasul, A. (2022). Meteorological drought in semi-arid regions: A case study of Iran. Journal of Arid Land14(11), 1212-1233. http://doi.org/10.1007/s40333-022-0106-9
Heydari Alamdarlo, A., Khosravi, H., & Nasbpour Molaei, S. (2019). Study of Tourist Comfort Climate Index in Dry Areas: Case Study of Yazd Province. Applied Research in Geographical Sciences, 19(54), 205–217. http://doi.org/10.29252/jgs.19.54.205 [In Persian]
Huang, W., Song, G., Hong, H., & Xie, K. (2014). Deep architecture for traffic flow prediction: Deep belief networks with multitask learning. IEEE Transactions on Intelligent Transportation Systems15(5), 2191-2201. http://doi.org/10.1109/TITS.2014.2311123
Lim, B., Arık, S. Ö., Loeff, N., & Pfister, T. (2021). Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting. International Journal of Forecasting, 37(4), 1748–1764.
Liyew, C. M., & Melese, H. A. (2021). Machine learning techniques to predict daily rainfall amount. Journal of Big Data8, 1-11. http://doi.org/10.1186/s40537-021-00545-4
Lotfirad, M., Esmaeili-Gisavandani, H., & Adib, A. (2022). Drought monitoring and prediction using SPI, SPEI, and random forest model in various climates of Iran. Journal of Water and Climate Change13(2), 383-406.  http://doi.org/10.2166/wcc.2021.287
Mai, H. V. T., Nguyen, T. A., Ly, H. B., & Tran, V. Q. (2021). Investigation of ANN Model Containing One Hidden Layer for Predicting Compressive Strength of Concrete with Blast‐Furnace Slag and Fly Ash. Advances in Materials Science and Engineering2021(1), 5540853.
Marjani, M., Mahdianpari, M., & Mohammadimanesh, F. (2024). CNN-BiLSTM: A Novel Deep Learning Model for Near-Real-Time Daily Wildfire Spread Prediction. Remote Sensing16(8), 1467. http://doi.org/10.3390/rs16081467
Mittal, S. (2020). A survey on modeling and improving reliability of DNN algorithms and accelerators. Journal of Systems Architecture104, 101689.
Mosavi, A., Ozturk, P., & Chau, K.-W. (2018). Flood Prediction Using Machine Learning Models: Literature Review. Water, 10(11), 1536. http://doi.org/10.3390/w10111536
Pai, P. F., & Hong, W. C. (2007). A recurrent support vector regression model in rainfall forecasting. Hydrological Processes: An International Journal21(6), 819-827.
Pariyar, S. K., Keenlyside, N., Sorteberg, A., Spengler, T., Bhatt, B. C., & Ogawa, F. (2020). Factors affecting extreme rainfall events in the South Pacific. Weather and Climate Extremes29, 100262.
Qin, Y., Song, D., Chen, H., Cheng, W., Jiang, G., & Cottrell, G. W. (2017). A dual-stage attention-based recurrent neural network for time series prediction. Proceedings of the 26th International Joint Conference on Artificial Intelligence, (IJCAI-17), 2627–2633.
Sattari, Mohammad Taghi and Nahrin, Farnaz. (2013). Forecasting maximum daily precipitation values ‌‌using intelligent systems and comparing it with the M5 tree model; A case study of Ahar and Jolfa stations. Iranian Journal of Irrigation and Water Engineering, 4(2), 83-98.
Shu, P., Duan, X., Shao, C., Liu, J., Tian, Y., & Li, S. (2025). Precipitation Spatio-Temporal Forecasting in China via DC-CNN-BiLSTM. Water17(9), 1381.
Smola, A. J., & Schölkopf, B. (2004). A tutorial on support vector regression. Statistics and Computing, 14(3), 199–222. http://doi.org/10.1023/B:STCO.0000035301.49549.88
Ismail Fawaz, H., Forestier, G., Weber, J., Idoumghar, L., & Muller, P. A. (2019). Deep learning for time series classification: a review. Data Mining and Knowledge Discovery, 33(4), 917–963.
Wang, H., Zeng, J., Ma, L., & Guan, L. (2022). Tiny-RainNet: A Deep CNN-BiLSTM Model for Short-Term Rainfall Prediction. Authorea Preprints. http://doi.org/10.1002/essoar.10501344.1
Wang, Y., Jia, P., Shu, Z., Liu, K., & Shariff, A. R. M. (2025). Multidimensional precipitation index prediction based on CNN-LSTM hybrid framework. arXiv preprint arXiv:2504.20442.
Yilmaz, A. G. (2015). The effects of climate change on historical and future extreme rainfall in Antalya, Turkey. Hydrological Sciences Journal60(12), 2148-2162.
Zhang, X., Yang, Y., Liu, J., Zhang, Y., & Zheng, Y. (2024). A CNN-BILSTM monthly rainfall prediction model based on SCSSA optimization. Journal of Water and Climate Change15(9), 4862-4876. http://doi.org/10.2166/wcc.2024.389