Crop Mapping from Landsat-8 Images Time Series Using Machine-Learning Methods (Case Study: Marvdasht in Fars Province)

Document Type : Research Paper

Author

Department of Mapping Engineering, Faculty of Civil Engineering and Transportation, Isfahan University, Isfahan, Iran

Abstract

 
Abstract
One of the key priorities of the Ministry of Agriculture Jihad is the mapping of croplands to estimate crop acreage and annual yield. In recent decades, remote sensing technology has proven to be highly effective in estimating the extent of crop cultivation through the use of timely images and synchronized data with diverse spatial, temporal, and spectral resolutions, leveraging advanced machine-learning algorithms. This study presented a framework for crop mapping in Marvdasht, Fars Province, by utilizing time series of Landsat-8 satellite images and advanced machine-learning algorithms. The employed algorithms included Decision Tree (DT), Random Forest (RF), Rotation Forest (RoF), Support Vector Machine (SVM), and Dynamic Time Warping (DTW) analysis. The results indicated that the dynamic time warping and random forest methods outperformed others, achieving significantly higher accuracy (with an overall accuracy improvement of 10-12%) in generating the agricultural land-use map of the study area. Furthermore, this research demonstrated the effectiveness of Bands 2-5 of Landsat-8 satellite in confidently identifying all crops in this region using the mentioned methods.
 
Keywords: Crop Mapping, Crop Acreage Estimation, Landsat-8 Satellite, Machine Learning, Random Forest (RF), Support Vector Machine (SVM), Dynamic Time Warping (DTW), Remote Sensing.
 
Introduction
One of the key priorities of the Ministry of Agricultural Jihad and the related organizations is to create a cropland map for estimating crop area and annual yield of strategic products. This study aimed to establish a framework based on classification algorithms using time series of Landsat-8 satellite images to estimate the crop acreage of agricultural products. The study area was the city of Marvdasht in Fars Province, which boasted a relatively diverse range of agricultural crop types. In addition to the main satellite bands, the NDVI time series was also utilized for collecting the data in this research. Various classification methods, such as Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), and Rotation Forest (RoF), were compared with the Dynamic Time Warping (DTW) method as well. Furthermore, a reliable cropland map of the study area was prepared by using each method.
 
Methodology
In this study, a rule-based framework utilizing well-known classifiers, such as DT, RF, RoF, SVM, and DTW methods, was proposed by using an 8-day time series of Landsat-8 satellite images and the Digital Elevation Model (DEM) of the region. The proposed framework consisted of two fundamental steps: Firstly, non-agricultural areas, including urban areas, water bodies, and mountainous regions, were masked in the region by using several rules. Subsequently, the agricultural fields were classified. To mask urban areas, the Standard Deviation (SD) of the time series of the NDVI index was employed. For identifying water bodies, a simple thresholding method was used based on the negative NDVI values. Additionally, the DEM of the region was utilized to mask highland areas. Finally, the pixels belonging to agricultural areas were classified by using the five algorithms, i.e., DT, RF, RoF, SVM, and DTW.
 
Research Findings
Using only the NDVI index, the methods achieved an overall accuracy between 81% and 86% (Kappa coefficient of 0.78-0.83). Notably, the RF and DTW methods exhibited the highest overall accuracy. The resulting SD also indicated the high stability of these two methods compared to the others. Conversely, the RoF method demonstrated the lowest accuracy, while the DT method proved to be less stable than all the other methods. The SVM method, exhibited similar inefficiency and low reliability in identifying summer crops and tomato products as the RoF method although it achieved relatively a good overall accuracy and kappa coefficient. In contrast, the RF and DTW methods were able to distinguish tomato products with relatively good accuracy, but they did not perform well in detecting summer crops. It appeared that regardless of the classification method, relying solely on the NDVI index was insufficient for vegetation identification.
Another important observation was that none of these methods achieved the standard accuracy of 85% for identifying products in the study area. Even the RF and DTW methods, which exhibited higher F-score values in most classes compared to the other methods, could not meet this standard accuracy for most classes, including sugar beet, wheat, corn, summer crops, and tomatoes. Therefore, it could be concluded that relying solely on the NDVI index might not be effective for classifying the agricultural croplands of this region.
When the time series of the spectral bands were used in conjunction with the NDVI index time series, the overall accuracy of all the methods improved from 88% to 96% (a 6-12% increase in accuracy). The highest increase in accuracy was 12% and 10% for the DTW and RF methods, respectively. Additionally, these two methods exhibited greater stability compared to the other methods. The inclusion of spectral bands even provided additional assistance to the DT, RoF, and SVM methods in identifying certain crops, such as summer crops and tomatoes, which had been challenging to identify in the previous stage. Another noteworthy point was that, with the addition of spectral bands, the standard accuracy of 85% was ultimately achieved for all crop types in the city of Marvdasht by the two methods of DTW and RF.
 
Discussion of Results & Conclusion
This article explored the creation of a cropland map for the agricultural fields of Marvdasht City in Fars Province during the 2014-15 crop year using remote sensing images. An 8-day time series of the spectral bands of 2 to 5 and the NDVI index of Landsat-8 satellite images were employed. This case study encompassed a wide variety of crops, including alfalfa, barley, wheat, corn, sugar beet, tomato, rice, and summer crops. The classification methods utilized in this study comprised Decision Tree (DT), Random Forest (RF), Rotation Forest (RoF), Support Vector Machine (SVM), and Dynamic Time Warping (DTW) algorithms. The implementation of these methods in the mentioned area led to the following conclusions: The DTW and RF methods proved to be more effective than the other methods in identifying agricultural crop types in the study area. Conversely, the DT and RoF methods exhibited subpar performance. The overall low accuracy and inability to identify certain products, such as tomatoes and summer crops, by relying solely on the NDVI index, raised doubts about the efficacy of this method in this region. On the other hand, the DTW method as a novel approach demonstrated excellent efficiency in identifying the agricultural crop types in this region. In summary, this article underscored that, relying solely on the NDVI index for creating a reliable and effective cropland map in Marvdasht was insufficient and it was imperative to incorporate additional features, such as spectral bands, to achieve high accuracy in crop mapping.
 

Keywords

Main Subjects


مقدمه

بخش کشاورزی به‌عنوان یکی از ارکان بنیادی و کلان اقتصاد ملی نه‌تنها نقش بسزایی در تأمین مواد غذایی مردم دارد، به‌عنوان یک مؤلفۀ اساسی از اقتدار و امنیت ملی کشورها به‌ویژه ایران شناخته می‌شود. مدیریت کارآمد، هدفمند و پایش دقیق این بخش تأثیر فوری و مستقیمی بر اقتصاد داخلی و نیز روابط بین‌المللی کشور دارد. یکی از اولویت‌های حیاتی وزارت جهاد کشاورزی، تهیۀ نقشۀ نوع محصول کشاورزی (Crop Mapping) یا تخمین سطح زیرکشت محصولات (Crop Acreage Estimation) با هدف برآورد سالیانۀ میزان تولید محصولات استراتژیک است. داشتن اطلاعات دقیق از سطح زیرکشت محصولات، اقدام‌های منطقی و مؤثرتری را در سیاست‌های مدیریتی و اجرایی کوتاه‌مدت و بلندمدت بخش کشاورزی فراهم می‌کند (Zhu et al., 2017).

با‌وجود ضرورت این مسئله و تأثیر ویژۀ آن در مدیریت کشاورزی و اقتصاد ملی، بیشتر شیوۀ سنتی همچون جمع‌آوری اطلاعات میدانی از کشاورزان و صاحبان املاک استفاده شده است. این شیوه امکان تخمین سطح زیرکشت را فراهم می‌کند؛ اما به‌دلیل تنوع زیاد اظهارنظرها، اعتماد کاملی به آن وجود ندارد؛ بنابراین نیازمند هزینه‌های انسانی و زمانی چشمگیری به‌ویژه در منطقه‌های وسیع است (Li et al., 2022). در دهه‌های اخیر، فناوری سنجش از دور (Remote Sensing) با رشد و توسعۀ سیستم‌های تصویربرداری از سطح زمین به‌عنوان یک ابزار حیاتی در‌زمینۀ مطالعه، تولید اطلاعات جامع و مدیریت یکپارچۀ کشاورزی شناخته شده است (Wu et al., 2023). این فناوری به‌دلیل فراهم‌کردن تصاویر و داده‌های به‌هنگام با تفکیک‌پذیری‌های متنوع مکانی، زمانی و طیفی نقش مهمی در بخش کشاورزی به‌ویژه در تخمین میزان سطح زیرکشت محصولات دارد (Mao et al., 2023).

تاکنون ماهواره‌های سنجش از دور متنوعی در مطالعات کشاورزی به کار گرفته شده است. در چند سال گذشته، ماهوارۀ لندست-8 به‌طور ویژه توجه پژوهشگران را به خود جلب کرده است (Lv et al., 2020; Du et al., 2022; Ghorbanpour et al., 2022; Guo et al., 2022; Wei et al., 2022; Zhang et al., 2022). این ماهواره قابلیت تهیۀ نقشه‌های پهنه‌بندی را در‌مقیاس ملی-محلی دارد. تصاویر ماهوارۀ لندست-8 خطای نوارشدگی موجود در برخی تصاویر لندست-7 را ندارد و با داشتن باندهای اضافه‌تر در کاربردهای کشاورزی مفید است. زمان تکرار تصویربرداری این ماهواره 16 روز است که به‌ دلیل هم‌پوشانی عرضی باندهای تصویربرداری این زمان در بیشتر مواقع تا 8 روز هم کاهش می‌یابد؛ بنابراین برای پایش روند رشد گیاه مناسب به نظر می رسد (Zhang et al., 2022). عمدۀ ویژگی‌های استفاده‌شده از این ماهواره در مقاله‌ها شامل اطلاعات باندهای طیفی 2 تا 5 (مرئی و مادون قرمز نزدیک) است که بیانگر رفتار انعکاسی انواع محصولات است (Wei et al., 2022). علاوه بر این، شاخص گیاهی تفاضلی نرمال‌شده (NDVI) (Normalized Difference Vegetation Index) و شاخص گیاهی بهبودیافته (EVI) (Enhanced Vegetation Index) در برخی مقاله‌ها به کار گرفته شده است (Peña-Barragán et al., 2011; Chellasamy et al., 2014; Fieuzal et al., 2020; Nguyen et al., 2020). سری زمانی این شاخص‌ها به‌ویژه NDVI می‌تواند برای بررسی و تشخیص وقایع رشدشناسی محصول (فنولوژی) همچون شروع، پایان و طول فصل رشد گیاه مفید باشد.

در دهه‌های اخیر، روش‌های یادگیری ماشین مختلفی با ساختارها و معماری‌های متنوعی برای تهیۀ نقشۀ نوع محصول کشاورزی از تصاویر ماهواره‌ای استفاده شده است. در این میان، روش‌های طبقه‌بندی نظارت‌شدۀ چندزمانه با کمک شاخص‌های پوشش‌گیاهی نتایج مؤثری را برای تفکیک محصولات کشاورزی ارائه کرده است. در برخی مطالعات از روش شبکۀ بیزین و الگوریتم بیشترین شباهت (Maximum Likelihood) استفاده شده است (Chen et al., 2020; López-Andreu et al., 2021; Lu et al., 2022). این دو روش به‌شدت وابسته به توزیع داده‌ها هستند که بیشتر در طبقه‌بندی مجموعه‌داده‌های بزرگ با محدودیت مواجه می‌شوند. در برخی از مطالعات دیگر از شبکۀ عصبی مصنوعی (ANN) (Artificial Neural Network) و ماشین بردار پشتیبان (SVM) (Support Vector Machine) بهره برده شده است (Denize et al., 2019; Ioannidou et al., 2022; Shen et al., 2022; Gao et al., 2023; Mao et al., 2023; Vilela et al., 2023). الگوریتم ANN بیشتر به‌عنوان یک طبقه‌بندی‌کنندۀ ناپایدار شناخته می‌شود (Du et al., 2012). SVM نیز اگرچه یک روش تعمیم‌پذیر و پایدار برای طبقه‌بندی داده‏ها در فضایی با ویژگی ابعاد بالاست، با چندین چالش بزرگ همچون انتخاب کرنل و پارامترهای بهینۀ آن و اثر داده‌های نویزی روی کارایی‌اش مواجه است (Khosravi et al., 2021). از روش‌های یادگیری ماشین مبتنی بر درخت از‌جمله درخت تصمیم (DT) (Decision Tree)، روش جنگل تصادفی (RF) (Random Forest) و روش جنگل دورانی (RoF) (Rotation Forest) در مطالعات طبقه‌بندی محصولات کشاورزی استفاده شده است (Khosravi et al., 2018; Denize et al., 2019; Seydi et al., 2022; Tuvdendorj et al., 2022; Yi et al., 2022; Bolaños et al., 2023; Gao et al., 2023; Mao et al., 2023; Mirzaei et al., 2023; Vilela et al., 2023). الگوریتم DT ساختار ساده و قابل فهمی دارد؛ اما ممکن است با مشکلاتی در طبقه‌بندی داده‌های بزرگ روبه‌رو شود (Du et al., 2012). درمقابل، الگوریتم RF همانند SVM کارایی زیادی در چنین شرایطی دارد. الگوریتم RF به لطف امتیازاتش نسبت به الگوریتم SVM مطلوب‌تر است. روش RF سرعت عملکردی بیشتر، انعطاف بیشتر و ساختار ساده‌تر دارد و نسبت به داده‌های نویزی مقاوم‌تر است. همچنین، برخلاف SVM دغدغۀ کمتری برای انتخاب پارامترهای بهینه دارد (Khosravi & Alavipanah, 2019).

حصول دقت بالا روش‌های یادگیری ماشین ذکرشده بیشتر در‌صورت وجود داده‌های زمینی کافی امکان‌پذیر است؛ با این حال جمع‌آوری داده‌های زمینی به‌هنگام یک فرآیند زمانبر و هزینه‌بر است؛ بنابراین این روش‌ها در شرایط محیطی پیچیده و سیستم‌های کشاورزی مختلف ممکن است کارایی مناسبی نداشته باشد. به‌تازگی، آنالیز انحراف زمانی پویا (DTW) (Dynamic Time Warping) در چندین مطالعۀ طبقه‌بندی محصولات کشاورزی استفاده شده است (Belgiu & Csillik, 2018; Belgiu et al., 2020; Rafif et al., 2021; Singh et al., 2021; Xiao et al., 2023). این روش کارایی زیاد در هنگام محدودیت دسترسی به داده‌های زمینی و تنها یک نیاز حداقلی به دانش تقویم زراعی و عملیات کشاورزی دارد. همچنین، این روش قابلیت تعمیم به سال‌های مختلف و منطقه‌های وسیع‌تر را با تنظیمات جزئی مربوط به شرایط کشاورزی و آب‌و‌هوایی سالیانه دارد (Xiao et al., 2023).

تاکنون در ایران اقدام‌های بسیار‌محدود و غیرمنسجمی برای ارائۀ یک چارچوب جامع تهیۀ نقشۀ نوع محصول یا تخمین سطح زیرکشت محصولات کشاورزی با استفاده از روش‌های یادگیری ماشین به‌ویژه روش‌های جنگل تصادفی و آنالیز انحراف زمانی پویا از تصاویر ماهواره‌ای لندست-8 انجام شده است. این نقطه‌ضعف اقدام‌های محدود اغلب به‌دلیل در‌دسترس‌نبودن به داده‌های زمینی کافی مشکلاتی را در جمع‌آوری آنها به وجود آورده است؛ بنابراین محققان در پژوهش حاضر قصد دارند تا برای پر‌کردن این خلأ براساس روش‌های یادگیری ماشین نظارت‌شده گامی در راستای ارائۀ یک چارچوب تخمین سطح زیرکشت محصولات کشاورزی یک منطقه در ایران با استفاده از سری زمانی تصاویر ماهواره‌ای لندست-8 بردارند. شهر مرودشت استان فارس به‌دلیل تنوع فراوان محصولات کشاورزی به‌عنوان منطقۀ مطالعاتی این پژوهش انتخاب شده است. ویژگی‌های استفاده‌شده در این پژوهش سری زمانی باندهای 2 تا 5 و سری زمانی NDVI استخراج‌شده از تصاویر این ماهواره است. همچنین، روش‌های طبقه‌بندی مختلف از‌جمله SVM، DT، RF، RoF با روش DTW از‌لحاظ وابستگی به نمونۀ آموزشی مقایسه شده است. ضمن اینکه، با هر روش یک نقشۀ تهیۀ نوع محصول کشاورزی تهیه می‌شود. نتایج حاصل از این مطالعه نه‌تنها به دقت و کارایی هر مدل اشاره خواهد کرد، می‌تواند به مسئولان و پژوهشگران در برنامه‌ریزی مناسب برای افزایش بهره‌وری و توسعۀ کشاورزی در ایران کمک کند.

 

معرفی منطقۀ مطالعاتی

دشت مرودشت استان فارس به‌عنوان مطالعۀ موردی این پژوهش انتخاب شده است. علت انتخاب این منطقه تنوع فراوان محصولات کشاورزی آن است که می‌تواند الگوی خوبی برای سیستم کشاورزی کل ایران باشد. شکل 1 محدودۀ سیاسی این منطقه و موقعیتش را نسبت به کشور و استان فارس نشان می‌دهد. مرودشت در 40 کیلومتری شمال شیراز و در حد فاصل طول‌های جغرافیایی 52 درجه و 4 ثانیه تا 53 درجه، 35 دقیقه و 1 ثانیۀ شرقی و عرض‌های جغرافیایی 29 درجه، 37 دقیقه و 28 ثانیه تا 30 درجه، 36 دقیقه و 52 ثانیۀ شمالی واقع شده است. مساحت این منطقه حدود 7/4 هزار کیلومتر مربع و ارتفاع متوسط آن از سطح دریا 1620 متر است.

آب‌و‌هوای این منطقه کوهستانی و معتدل است و تنوع فراوانی از مزارع کشاورزی را دارد. ضمن اینکه، نواحی کوهستانی در این منطقه به‌شدت به چشم می‌خورد. همچنین، در قسمت شمال شرقی این منطقه دریاچه‌ای قرار دارد که به نام دریاچۀ دودزن مشهور و سدی بر این دریاچه احداث شده است. شهر مرودشت به‌عنوان مرکز شهرستان مرودشت در قسمت جنوبی این منطقه قرار دارد. طبق سرشماری عمومی نفوس و مسکن سال 1395 برآورد جمعیت این شهرستان برابر با حدود 324 هزار نفر به‌عنوان دومین شهر پرجمعیت استان فارس بوده است. شغل بیشتر مردم این شهرستان کشاورزی و دامداری است.

 

شکل 1: موقعیت جغرافیایی منطقۀ مطالعاتی: دشت مرودشت، استان فارس، ایران: نمونه‌های جمع‌آوری شده از این منطقه با دوایر قرمز رنگ در این شکل مشخص شده است (منبع: نگارنده 1402)

Figure 1: Geographical location of the study area: Marvdasht city, Fars province, Iran. The samples collected from this area were marked with red circles.

 

روش‌شناسی پژوهش

در پژوهش حاضر یک چارچوب قاعده‌مبنا با کمک روش‌های یادگیری ماشین پیشرفته شامل الگوریتم‌های درختی (از‌جمله درخت تصمیم (DT)، جنگل تصادفی (RF)، جنگل دورانی (RoF)، ماشین بردار پشتیبان (SVM)، آنالیز انحراف زمانی پویا (DTW) از سری زمانی 8 روزۀ تصاویر ماهوارۀ لندست-8 و مدل ارتفاعی رقومی مرودشت استان فارس برای تهیۀ نقشۀ نوع محصول کشاورزی این منطقه) پیشنهاد می‌شود.

مطابق با شکل 2 چارچوب پیشنهادی گام‌های اساسی زیر را دارد.

ابتدا داده‌های ورودی شامل باندهای تصویری و شاخص گیاهی NDVI استخراج‌شده از ماهوارۀ لندست-8 به همراه دادۀ کمکی مدل رقومی ارتفاعی (DEM) آماده و پیش‌پردازش می‌شود. پس از آن با استفاده از قواعدی منطقه‌های غیرکشاورزی شامل منطقه‌های شهری، اجرام آبی و منطقه‌های کوهستانی در تصویر ماسک می‌شود. سپس با استفاده از الگوریتم‌های طبقه‌بندی اشاره‌شده، مزارع کشاورزی منطقۀ مطالعاتی تفکیک و در‌نهایت، نقشۀ نوع محصول کشاورزی از هر روش تهیه می‌شود.

 

شکل 2: نمای شماتیک چارچوب قاعده‌مبنای پیشنهادی برای تهیۀ‌ نقشۀ نوع محصول کشاورزی (منبع: نگارنده 1402)

Figure 2: Schematic diagram of the proposed rule-based framework for crop mapping.

 

معرفی دادههای ورودی

داده‌های ماهواره‌ای استفاده‌شده در پژوهش حاضر‌ تصاویر سری زمانی 8 روزه از سپتامبر سال 2014 میلادی تا سپتامبر سال 2015 میلادی (مهر 1393 تا مهر 1394) مربوط به سنجندۀ OLI ماهوارۀ لندست-8 اخذشده از منطقۀ مطالعاتی است (جدول 1). ماهوارۀ لندست-8 در 11 فوریۀ سال 2013 میلادی به فضا پرتاب شد که 2 سنجندۀ OLI و TIRS با مجموع 11 باند طیفی دارد. در این پژوهش تنها از سری زمانی باندهای 2 تا 5 (باند 2: آبی، باند 3: سبز، باند 4: قرمز، باند 5: مادون قرمز نزدیک) با حد تفکیک مکانی 30 متر استفاده شد. تمام این تصاویر در دیتوم سیستم ژئودتیک جهانی 1984 (WGS-84) زمین‌مرجع شده است. پیش‌پردازش‌هایی روی باندهای تصویری (تصحیحات جوّی، تبدیل درجۀ خاکستری به مقدار بالای جو برای باندهای طیفی و ماسک و تصحیح منطقه‌های ابری) انجام شد. برای ماسک ابر از روش خودکار Fmask بهره گرفته (Qiu et al., 2019) و سپس با درون‌یابی تصاویر قبل و بعد تاریخ‌های ابری، درجۀ خاکستری این منطقه‌ها تصحیح شد. همچنین، در پژوهش حاضر سری زمانی شاخص NDVI استخراج‌شده از سری زمانی باندهای قرمز و مادون قرمز نزدیک به کار گرفته شد؛ البته گفتنی است که برای تمام روش‌های طبقه‌بندی، ویژگی‌ها به دو صورت به کار گرفته شد. یکبار از سری زمانی شاخص NDVI به‌تنهایی (46 ویژگی) و بار دیگر از سری زمانی باندها و سری زمانی NDVI (230 ویژگی) استفاده شد.

جدول 1: تاریخ اخذ تصاویر لندست-8 مربوط به منطقۀ مطالعاتی مرودشت در سال زراعی 93-94

Table 1: The date of taking Landsat-8 images related to Marvdasht study area in the crop year 93-94.

ماه میلادی اخذ تصویر

سال میلادی

ماه شمسی اخذ تصویر

سال شمسی

2014

2015

1393

1394

سپتامبر

29

 

مهر

07، 15، 23

 

اکتبر

07، 15، 23، 31

 

آبان

01، 09، 17، 25

 

نوامبر

08، 16، 24

 

آذر

03، 11، 19، 27

 

دسامبر

02، 10، 18، 26

 

دی

05، 13، 21، 29

 

ژانویه

 

03، 11، 19، 27

بهمن

07، 15، 23

 

فوریه

 

04، 12، 20، 28

اسفند

01، 09، 17، 25

 

مارس

 

08، 16، 24

فروردین

 

04، 12، 20، 28

آوریل

 

01، 09، 17، 25

اردیبهشت

 

05، 13، 21، 29

مه

 

03، 11، 19، 27

خرداد

 

06، 14، 22، 30

ژوئن

 

04، 12، 20، 28

تیر

 

07، 15، 23، 31

ژوئیه

 

06، 14، 22، 30

مرداد

 

08، 16، 24

اوت

 

07، 15، 23، 31

شهریور

 

01، 09، 17، 25

سپتامبر

 

08، 16، 24

مهر

 

02

منبع: نگارنده 1402

 

دادۀ کمکی استفاده‌شده در این پژوهش مدل ارتفاعی رقومی (DEM) اخذشده از SRTM با حد تفکیک مکانی نزدیک به 30 متر مربوط به سال 2014 از منطقۀ مطالعاتی است. برای این منطقه 8 الگوریتم DEM موجود بود که ابتدا این 8 الگوریتم DEM با یکدیگر موزاییک و سپس با تصاویر ماهواره‌ای لندست-8 هم‌سیستم مختصات شدند. شکل 3 مدل ارتفاعی رقومی مرودشت را نشان می‌دهد. منطقه‌های مرتفع و کوهستانی درجۀ خاکستری روشن (سفید) و منطقه‌‌های کم‌ارتفاع که بیشتر شامل زمین‌های کشاورزی، اجرام آبی و منطقه‌های ساخته‌شده است با درجۀ خاکستری تیره (مشکی) در این شکل مشخص است.

 

شکل 3: مدل ارتفاعی رقومی (DEM) اخذشده از SRTM از دشت مرودشت (منبع: نگارنده 1402)

Figure 3: Digital Elevation Model (DEM) obtained by SRTM from Marvdasht City.

 

ماسک منطقه‌های غیرکشاورزی

ماسک منطقه‌های غیرکشاورزی شامل ماسک اجرام آبی، منطقه‌های مرتفع و منطقه‌های شهری در تصاویر می‌شود. برای شناسایی و ماسک اجرام آبی در این منطقه بدین صورت عمل شد: مقدار شاخص NDVI اجرام آبی منفی است؛ بنابراین با یک آستانه‌گذاری ساده از شاخص NDVI میانگین (کوچکتر از صفر) این منطقه‌ها در تصویر ماسک شد. شکل 4 اجرام آبی ماسک‌شده را در تصویر منطقۀ مطالعاتی به رنگ آبی نشان می‌دهد.

برای شناسایی و ماسک منطقه‌های مرتفع کوهستانی بدین صورت عمل شد: با‌توجه به DEM منطقه، ارتفاع منطقه‌های کوهستانی اختلاف شدیدی با منطقه‌های غیرمرتفع (به‌ویژه مزارع کشاورزی) دارد؛ بنابراین می‌توان تصویر DEM را به‌صورت یک تصویر باینری که هیستوگرام دو قله‌ای (Bi-Modal) دارد، تصور کرد که یک قلۀ آن، نمایانگر منطقه‌های مرتفع و کوهستانی و قلۀ دیگر، نمایانگر منطقه‌های غیرمرتفع و پست است؛ بنابراین با یک روش قطعه‌بندی کارا همچون روش مدل مخلوط گوسینی (GMM) (Guassian Mixture Model) و با درنظر گرفتن تعداد خوشه‌ها برابر 2 منطقه‌های مرتفع کوهستانی از سایر منطقه‌ها ماسک شد. شکل 4 منطقه‌های مرتفع ماسک‌شده را در تصویر منطقۀ مطالعاتی به رنگ قرمز نشان می‌دهد.

برای شناسایی و ماسک منطقه‌های ساخته‌شدۀ بشری بدین صورت عمل شد: منطقه‌های ساخته‌شدۀ بشری همچون منطقه‌های شهری برخلاف منطقه‌های طبیعی (گیاهان و مزارع کشاورزی) رفتار طیفی ایستا و به‌نسبت ثابتی در‌طول زمان (یک سال زراعی) دارند. پس می‌توان نتیجه گرفت که انحراف معیار این منطقه‌ها در‌طول زمان نسبت به مزارع کشاورزی بسیار‌متفاوت است؛ با این حال باید درنظر داشت که منطقه‌های طبیعی همچون کوهستان و تپه‌ها نیز همانند منطقه‌های ساخته‌شدۀ بشری رفتار طیفی به‌نسبت ایستایی در‌طول زمان دارند؛ بنابراین همانند ایدۀ قبلی مجدد با روش قطعه‌بندی GMM این منطقه‌ها در تصویر ماسک شد. در اینجا تعداد خوشه‌ها به تنوع منطقه‌های ساخته‌شدۀ بشری در‌مقابل منطقه‌های طبیعی بستگی دارد. شکل 4 منطقه‌های ساخته‌شدۀ بشری ماسک‌شده را در تصویر منطقۀ مطالعاتی به رنگ سبز نشان می‌دهد. منطقه‌های کوهستانی از این منطقه‌ها مجزا شدند.

 

شکل 4: ماسک منطقه‌های غیرکشاورزی در مرودشت شامل: الف) اجرام آبی (ماسک‌شده به رنگ آبی)؛ ب) منطقه‌های مرتفع (ماسک‌شده به رنگ قرمز)؛ پ) منطقه‌های ساخته‌شدۀ بشری (ماسک‌شده به رنگ سبز) (منبع: نگارنده 1402)

Figure 4: Mask of non-agricultural areas in the Marvdasht including: a) water bodies (masked in blue color); b) highland areas (masked in red) and c) man-made areas (masked in green).

 

روش‌های یادگیری ماشین

پس از ماسک منطقه‌های غیرکشاورزی، پیکسل‌های متعلق به مزارع کشاورزی با پنج الگوریتم DT، RF، RoF، SVM و DTW طبقه‌بندی می‌شود. در الگوریتم DT نمونه‌ها به‌نحوی دسته‌بندی می‌شود که از گره ریشه به سمت پایین رشد می‌کنند و در انتها به گره‌های پایانی یا برگ‌ها که همان تصمیم‌ها یا برچسب نمونه‌هاست، می‌رسند. گره ریشه و هر گره داخلی (انشعاب) یک ویژگی را نشان می‌دهد که به تعداد ارزش یا مقدار آن ویژگی، شاخه از آن به گره‌های پایین‌تر وجود دارد. برای یادگیری DT یک الگوریتم از معیار بهرۀ اطلاعاتی که مبتنی بر مفهوم بی‌نظمی است، برای رشد درختان از بالا به پایین استفاده می‌کند. پس از تشکیل کامل درخت برای جلوگیری از پیچیده‌تر‌شدن ساختار درخت از عمل هرس‌کردن درخت و کنار‌گذاشتن شاخه‌های اضافی و غیرضروری استفاده می‌شود (خسروی و همکاران، 1394). در‌واقع، الگوریتم DT در کنار رتبه‌بندی ویژگی‌ها، کار طبقه‌بندی (رسیدن به تصمیمات) را نیز انجام می‌دهد.

الگوریتم RF از تعداد زیادی DT ساخته شده است و علت نام‌گذاری آن نیز به همین مسئله برمی‌گردد. در این روش ابتدا چندین زیرمجموعۀ آموزشی از کل مجموعۀ آموزشی با استفاده از نمونه‌برداری تصادفی و با جای‌گذاری انتخاب و پس از آن در هر زیرمجموعۀ آموزشی زیرمجموعه‌ای از ویژگی‌ها با استفاده از یک نمونه‌برداری تصادفی و بدون جای‌گذاری ایجاد و سپس با هر‌یک از زیرمجموعه‌ها یک الگوریتم DT آموزش داده می‌شود. سرانجام، خروجی حاصل از DTها با یک قانون رأی‌گیری حداکثریت (MV) (Majority Voting) با یکدیگر ترکیب می‌شود. این روش کلاسی را انتخاب می‌کند که تمام یا بیشتر طبقه‌بندی‌کننده‌ها روی آن هم‌نظر باشند یا آن کلاس، بیشترین تعداد آرای به‌دست‌آمده از همۀ طبقه‌بندی‌کننده‌ها را کسب کرده باشد (Mangai et al., 2010). مهم‌ترین پارامترهای الگوریتم RF تعداد درخت‌های به‌ کار رفته (nTrees) و تعداد ویژگی‌های انتخاب‌شده در هر زیرمجموعه (mTry) است. در پژوهش حاضر پس از سعی و خطا دو پارامتر nTree و mTry به‌ترتیب برابر با 100 و مجذور تعداد ویژگی‌ها 7 و 16 در‌نظر گرفته شد.

الگوریتم RoF همانند الگوریتم RF از طبقه‌بندی‌کنندۀ DT به‌عنوان الگوریتم پایه در ساختار خود استفاده می‌کند. ابتدا مجموعۀ ‌ویژگی‌ها به چند زیرمجموعۀ ویژگی (K) که اشتراک یا غیراشتراک دارد، تقسیم می‌شود. سپس برای هر زیرمجموعۀ ویژگی یک نمونۀ خود‌راه‌انداز که شامل 60% تا 75% از تعداد نمونه‌های هر زیرمجموعه است، انتخاب می‌‌شود. در‌ادامه، یک روش استخراج ویژگی به نام تجزیه‌وتحلیل مؤلفه‌های اصلی (PCA) (Principal Component Analysis) روی هر نمونۀ خودراه‌انداز به کار برده و سپس با استفاده از ضرایب یا مؤلفه‌های PCA یک ماتریس دوران مربعی با ابعاد تعداد ویژگی‌ها ساخته می‌شود. پس از این کار هر‌یک از نمونه‌های آموزشی با ضرب در ماتریس دوران به‌روز و سپس یک مدل از الگوریتم DT با استفاده از هر نمونۀ آموزشی به‌روز شده، آموزش داده می‌شود. درنهایت، با یک روش رأی‌گیری همچون MV نتایج این m طبقه‌بندی‌کننده با یکدیگر ترکیب می‌شود (Rodriguez et al., 2006). در این پژوهش دو پارامتر K و m به‌ترتیب برابر با {7 و 16} و 100 در نظر گرفته شد.

روش SVM شامل یافتن ابرصفحه‌ای در فضای ویژگی است که حاشیۀ بین کلاس‌ها، یعنی فاصلۀ نزدیک‌ترین نقاط دادۀ آموزشی کلاس‌ها را بیشینه می‌کند؛ البته به کمک حقۀ کرنل SVM به توابع تصمیم غیرخطـی نیز قابل تعمیم است. در این حالت الگوریتم به‌جای فضای ویژگی در فضای نگاشت‌یافتۀ کرنل به‌دنبال ابرصفحۀ جداکننده است. رایج‌ترین کرنل‌های استفاده‌شده در سنجش از دور کرنل تابع چندجمله‌ای و کرنل تابع پایه‌ای شعاعی (RBF) (Radial Basis Function) است. برای کرنل چندجمله‌ای لازم است تا پارامتر درجه (d) و پارامتر گاما و برای کرنل RBF باید پارامتر گاما (γ) تنظیم شود؛ البته یک پارامتر دیگر به نام پارامتر جریمه (C) باید برای هر دو کرنل از پیش تعیین شود (مؤمنی و همکاران، 1392، ص. 176). در پژوهش حاضر از یک کرنل RBF استفاده و سپس به کمک اعتبارسنجی جانبی و در یک جست‌وجوی شبکه‌ای، پارامترهای C و γ بهینه شد. دو مقدار 10.000 و 1.000 برای پارامتر C و مقدار‌های 004/0 و 002/0 برای پارامتر γ به‌عنوان مقدار‌های بهینه انتخاب شد.

 

شکل 5: نمای شماتیک الگوریتم انحراف زمانی پویا (منبع: نگارنده 1402)

Figure 5: Schematic diagram of dynamic time warping algorithm.

 

الگوریتم DTW ابتدا برای تشخیص گفتار توسعه یافت؛ اما بعدها در آنالیز تصاویر سری زمانی نیز معرفی شد. در آنالیز سری زمانی روش DTW مشابهت بین دو دنبالۀ زمانی را که ممکن است سرعت / فرکانس متفاوت داشته باشد، اندازه می‌گیرد (شکل 2). در‌واقع، این روش با مقایسۀ مشابهت بین دو دنبالۀ زمانی و یافتن مسیر بهینۀ آنها یک معیار عدم تشابه را به دست می‌آورد (Belgiu & Csillik, 2018). در سنجش از دور الگوریتم DTW می‌تواند با اعوجاجات زمانی سر‌و‌کار داشته باشد و به لطف توانایی تراز‌کردن پروفیل‌های رادیومتریکی در یک حالت بهینه، پروفیل‌های تغییر شکل‌یافته و نمونه‌برداری نامنظم را نیز مقایسه کند.

 

جمع‌آوری داده‌های زمینی

کارشناسان سازمان فضایی ایران طی یک مأموریت نقشه‌برداری زمینی در سال‌های زراعی 1393 تا 1394 با اتکا به اطلاعات مالکان و کشاورزان منطقۀ مرودشت داده‌های زمینی لازم را از مزارع کشاورزی این منطقه جمع‌آوری کردند. دوایر قرمز رنگ در شکل 1 مکان این داده‌ها را نشان می‌دهد. مطابق با این اطلاعات در سال زراعی 94-93 محصولات عمدۀ این منطقه شامل یونجه، چغندرقند، جو، گندم، ذرت، برنج، گوجه‌فرنگی و صیفی‌جات است (جدول 2).

برای طبقه‌بندی محصولات کشاورزی با روش‌های نظارت‌شده، نمونه‌های آموزشی و آزمایشی لازم از داده‌های زمینی انتخاب می‌شود. نمونه‌های آموزشی فقط برای آموزش الگوریتم‌ها و یا به‌نوعی ساختن مدل اولیۀ طبقه‌بندی‌کننده به کار می‌رود. در‌مقابل، نمونه‌های آزمایشی برای ارزیابی دقت، صحت، اعتمادپذیری روش‌ها و نتایج حاصل استفاده می‌شود. در پژوهش حاضر 50% کل داده‌ها به‌صورت تصادفی چینه‌چینه شده در ده مرتبه به‌عنوان نمونۀ آموزشی و مابقی به‌عنوان نمونۀ آزمایشی انتخاب می‌شود. تعداد نمونه‌های آموزشی برای هر کلاس در جدول 3 آورده شده است.

جدول 2: مشخصات کلاس‌های محصولات کشاورزی منطقۀ مطالعاتی: مرودشت

Table 2: Characteristics of crop types in the study area: Marvdasht.

کلاس

مختصۀ E (متر)

مختصۀ N (متر)

محصول سال 94-93

1

693555

3299895

یونجه

2

675165

3302055

جو

3

672945

3303855

چغندر قند

4

673815

3309615

چغندرقند

5

665805

3310035

گندم

6

675315

3313905

ذرت

7

680445

3314745

صیفی‌جات

8

679185

3314955

گندم

9

680475

3319185

گندم

10

674355

3321315

چغندرقند

11

660015

3329475

گوجه‌فرنگی

12

656385

3337845

برنج

13

640725

3342045

برنج

منبع: نگارنده 1402

 

جدول 3: تعداد نمونه‌های آموزشی کلاس‌های محصولات کشاورزی منطقۀ مطالعاتی: مرودشت

Table 3: The number of training samples of crop types in the study area: Marvdasht.

کلاس

یونجه

جو

چغندرقند

گندم

ذرت

صیفی‌جات

گوجه‌فرنگی

برنج

تعداد کل نمونه‌ها

203

303

190

146

100

59

39

500

تعداد نمونه‌های آموزشی

101

151

95

73

50

29

19

250

منبع: نگارنده 1402

 

ارزیابی دقت نتایج

برای ارزیابی دقت هر روش برچسب حاصل از آن روش برای نمونه‌های آزمایشی با برچسب واقعی‌شان مقایسه و برای گزارش مقدار‌های کمّی و توصیفی دقت از کمیت‌های استخراج‌شده از ماتریس خطا، یعنی دقت کلی (OA)، ضریب کاپا (kappa) و امتیاز F (F-score) استفاده شد. این کمیت‌ها از روابط

(1)

 

(2)

 

(3)

 

قابل محاسبه است که در آن، nii I Î {1, 2, 3, …, k} تعداد نمونه‌های کلاس i-ام است که به‌‌درستی با الگوریتم شناسایی شده، ni+  تعداد نمونه‌هایی است که با الگوریتم طبقه‌بندی‌کننده به‌عنوان کلاس i شناسایی شده، n+j تعداد نمونه‌هایی است که درحقیقت به‌عنوان کلاس j در دادۀ مرجع وجود دارد و N تعداد کل نمونه‌هاست. در‌واقع، پارامتر OA نسبت مجموع نمونه‌های درست شناسایی‌شده به کل نمونه‌هاست. OA یک برآورد کلی از طبقه‌بندی فراهم کرده است؛ زیرا به‌تنهایی نمی‌تواند ارزیابی منطقی و جامعی از عملکرد، کارایی، اعتماد الگوریتم و نتایج آن را ارائه دهد. معیار Kappa برای تعیین اینکه آیا مقدار‌ها درون یک ماتریس خطا به‌طور عمده بهتر از مقدار‌های درون یک آزمایش تصادفی است یا نه، محاسبه می‌شود. معیار F-score برخلاف OA و Kappa برای هر کلاس محاسبه می‌شود که در‌واقع، میانگین هارمونیک دقت‌های تولیدکننده (PA) (Producer's Accuracy) و کاربر (UA) (User's Accuracy) آن کلاس است. این کمیت در‌واقع، یک معیاری از درصد شناسایی مطمئن نمونه‌های یک کلاس ارائه داده است؛ بنابراین ما را از تفسیر کمیت‌های PA و UA برای هر کلاس بی‌نیاز می‌کند. محققان در مطالعات پیشین طبقه‌بندی محصولات کشاورزی اظهار کردند که دقت استاندارد برای استخراج هر محصول کشاورزی برابر با F-score > 85% است (خسروی و همکاران، 1397).

 

یافته‌های پژوهش و تجزیه‌و‌تحلیل

شکل‌های 6 و 7 نقشه‌های نوع محصول کشاورزی مرودشت را در دو حالت استفادۀ تنها از سری زمانی شاخص NDVI و استفاده از ترکیب سری زمانی شاخص NDVI و سایر باندهای طیفی نشان می‌دهد. جدول‌های 4 و 5 نیز مقدار‌های دقت حاصل از این روش‌ها را ارائه می‌دهد. در این جدول‌ها اعداد زیر دقت‌های OA و Kappa بیانگر انحراف معیار آنها در ده مرتبه پیاده‌سازی و اعداد زیر دقت F-score نمایانگر تعداد پیکسل‌های شناسایی‌شدۀ هر محصول در این منطقه است.

جدول 4: مقدار‌های OA (%) و kappa حاصل از روش‌های طبقه‌بندی مزارع کشاورزی منطقۀ مطالعاتی: مرودشت اعداد زیر دقت‌ها بیانگر انحراف معیار این دقت‌ها در ده مرتبه پیاده‌سازی است

Table 4: OA (%) and kappa resulting from the classification methods in the study area: Marvdasht. The numbers below the accuracy values represent the standard deviation of these accuracies over ten implementation instances.

روش‌ها

DT

RoF

SVM

RF

DTW

ویژگی‌ها

NDVI تنها

NDVI و باندها

NDVI تنها

NDVI و باندها

NDVI تنها

NDVI و باندها

NDVI تنها

NDVI و باندها

NDVI تنها

NDVI و باندها

OA (%)

25/81

28/3

23/88

34/2

96/79

22/2

40/88

61/1

39/84

03/2

20/90

61/1

92/85

90/1

24/95

29/1

72/84

01/2

30/96

73/1

Kappa

78/0

04/0

86/0

03/0

77/0

02/0

86/0

02/0

81/0

02/0

88/0

02/0

83/0

02/0

94/0

02/0

82/0

02/0

95/0

02/0

منبع: نگارنده، 1402

جدول 5: مقدار‌های F-score (%) کلاسی حاصل از روش‌های طبقه‌بندی مزارع کشاورزی منطقۀ مطالعاتی: مرودشت. اعداد زیر مقدار‌های F-score بیانگر تعداد پیکسل‌های شناسایی‌شدۀ هر محصول است

Table 5: F-score (%) resulting from the classification methods in the study area: Marvdasht. The numbers below the F-score values represent the number of pixels identified for each crop types.

روش‌ها

DT

RoF

SVM

RF

DTW

ویژگی‌ها

NDVI تنها

NDVI و باندها

NDVI تنها

NDVI و باندها

NDVI تنها

NDVI و باندها

NDVI تنها

NDVI و باندها

NDVI تنها

NDVI و باندها

یونجه

46/91

74404

59/96

82008

79/92

138489

50/92

131708

06/92

69751

36/93

76504

49/91

74733

72/96

121797

05/94

74425

97/97

42085

جو

64/94

68651

20/97

66038

10/95

87621

59/97

49028

24/94

86924

70/96

32161

56/97

47512

89/97

147891

39/97

55649

68/98

181902

چغندرقند

60/64

1243481

66/79

591488

80/60

619542

15/79

537243

41/66

604798

24/79

844257

16/72

792102

48/90

547703

85/69

1239550

01/94

511406

گندم

71/66

97143

30/81

103534

28/66

102333

32/86

69071

59/76

99582

61/82

64865

52/78

83728

25/95

76329

07/75

86876

52/92

66798

ذرت

56/66

56994

76/75

715835

27/67

643486

77/74

426686

55/69

105893

09/83

235666

19/70

550815

72/88

112097

66/65

60524

85/90

113845

صیفی‌جات

77/43

44099

72/49

46306

-

30655

87/58

391831

-

123607

18/70

66081

37/51

53959

26/85

176203

16/44

35860

17/88

174340

گوجه‌فرنگی

-

15365

48/79

49018

-

10303

15/73

30043

-

486857

28/65

254706

48/79

38315

62/85

401913

81/73

85394

64/90

474917

برنج

88/89

160657

06/92

106567

06/88

128365

78/92

125184

18/95

­­183382

22/97

186554

50/91

119630

94/97

176861

15/91

122516

38/98

195501

منبع: نگارنده، 1402

 

در جدول 4 تنها نتایج حاصل از استفاده از شاخص NDVI برای طبقه‌بندی محصولات کشاورزی آمده است. روش‌های مختلف در این سنجش توانسته‌اند دقت کلی در بازۀ 80% تا 86% (معادل کاپا از 77/0 تا 83/0) را به دست آورند. بررسی نتایج نشان می‌دهد که روش‌های RF و DTW به‌ترتیب، بیشترین دقت کلی را کسب کردند. همچنین، این دو روش به لطف کمترین انحراف معیار در‌مقایسه با سایر روش‌ها ثبات عملکردی بیشتری داشتند.

در‌مقابل، روش RoF کمترین دقت را نسبت به سایر روش‌ها کسب کرده است؛ به‌گونه‌ای که این روش حتی در شناسایی محصولات صیفی‌جات و گوجه‌فرنگی نتواست به عملکرد مطلوب و اطمینان‌بخشی دست یابد (مقدار‌های F-score آنها نامعلوم است). علاوه بر این، روش DT با ثبات کمتری نسبت به سایر روش‌ها ظاهر شده است.

نکتۀ جالب دیگر دربارۀ روش SVM است که با‌وجود دقت کلی و ضریب کاپای به‌نسبت خوب، مشابه روش RoF در شناسایی محصولات صیفی‌جات و گوجه‌فرنگی عملکرد مناسبی ندارد. به عبارتی دیگر، این دو روش در شناسایی این دسته از محصولات با چالش کارایی و اطمینان‌پذیری مواجه شدند.

در‌مقابل، دو روش RF و DTW توانسته‌اند محصولات گوجه‌فرنگی را با دقت به‌نسبت خوبی تشخیص دهند؛ با این حال این دو روش در تشخیص صیفی‌جات نیز دقت مطلوبی کسب نکرده‌اند. این نتایج نشان می‌دهد که استفاده از شاخص NDVI برای شناسایی محصولات کشاورزی به‌تنهایی ممکن است کافی نباشد؛ بنابراین استفاده از شاخص‌های دیگر طیفی نیز لازم است.

یک نکتۀ مهم دیگر که از جدول 5 به‌واضحی پدیدار می‌شود، عدم دستیابی هیچ یک از روش‌ها به دقت استاندارد 85% در شناسایی محصولات در منطقۀ مطالعه‌شده است (جدول 5). حتی دو روش RF و DTW که مقدار‌های F-score  بالاتری در بیشتر محصولات نسبت به سایر روش‌ها داشتند، نتواستند به این دقت استاندارد برای محصولاتی همچون چغندرقند، گندم، ذرت، صیفی‌جات و گوجه‌فرنگی دست یابند. این نتایج نشان می‌دهد که برای ایجاد عملکرد مطلوب در طبقه‌بندی محصولات کشاورزی در این منطقه تنها تکیه به شاخص NDVI کافی نیست.

با الحاق سری زمانی باندهای طیفی به سری زمانی شاخص NDVI دقت کلی تمامی روش‌ها بهبود یافت و در بازۀ 88% تا 96% قرار گرفت (افزایش 6% تا 12%). بیشترین افزایش دقت به‌ترتیب متعلق به روش‌های DTW و RF بوده است که هر‌یک با 12% و 10% افزایش مواجه شدند. همچنین، این دو روش ثبات بیشتری نسبت به دیگر روش‌ها داشتند.

استفاده از باندهای طیفی به‌ویژه به روش‌های DTW، RoF و SVM کمک مضاعفی در شناسایی برخی از محصولات مانند صیفی‌جات و گوجه‌فرنگی کرد که در مرحلۀ قبل به مشکل برخورده بودند؛ با این حال روش‌هایی مانند DT و RoF در شناسایی صیفی‌جات که با داده‌های نامتوازن سر‌و‌کار دارند، به کارایی مطلوبی دست نیافتند.

نکتۀ مهم دیگر این است که با افزودن باندهای طیفی دقت استاندارد 85% برای تمام محصولات منطقۀ مرودشت با دو روش DTW و RF به ‌دست آمد. این دقت بالا می‌تواند به‌عنوان یک نشانۀ مطمئن‌کننده از کارایی بالا و پذیرفتنی نقشه‌های نوع محصول کشاورزی حاصل از این دو الگوریتم (شکل‌های 7 ت و 7 ث) در تشخیص و دسته‌بندی محصولات کشاورزی در این منطقه در سال زراعی 93-94 تلقی شود. این نتایج نه‌تنها بر اهمیت این الگوریتم‌ها در شناسایی محصولات، به سازمان‌های کشاورزی در برنامه‌ریزی و مدیریت منابع نیز کمک می‌کند.

 

شکل 6: نقشه‌های نوع محصول کشاورزی منطقۀ مطالعاتی حاصل از تنها سری زمانی شاخص NDVI با استفاده از الگوریتم‌های: الف) DT؛ ب) RoF؛ پ) SVM؛ ت) RF و ث) DTW (منبع: نگارنده، 1402)

Figure 6: Cropland maps of the study area obtained from the only time series of NDVI index using algorithms: a) DT; b) RoF; c) SVM; T) RF and C) DTW.

 

 

شکل 7: نقشه‌های نوع محصول کشاورزی منطقۀ مطالعاتی حاصل از سری زمانی باندهای 2 تا 5 لندست-8 به همراه شاخص NDVI با استفاده از الگوریتم‌های: الف) DT؛ ب) RoF؛ پ) SVM؛ ت) RF و ث) DTW (منبع: نگارنده، 1402)

Figure 7: Cropland maps of the study area obtained from the time series of bands 2 to 5 of Landsat-8 along with the NDVI index using algorithms: a) DT; b) RoF; c) SVM; T) RF and C) DTW.

در مقایسۀ نتایج حاصل از روش‌های این پژوهش با نتایج به‌دست‌آمده در پژوهش‌های گذشته (Belgiu & Csillik, 2018; Khosravi et al., 2018; Denize et al., 2019; Belgiu et al., 2020; Rafif et al., 2021; Singh et al., 2021; Seydi et al., 2022; Tuvdendorj et al., 2022; Yi et al., 2022; Bolaños et al., 2023; Gao et al., 2023; Mao et al., 2023; Mirzaei et al., 2023; Vilela et al., 2023; Xiao et al., 2023) این موضوع به وضوح مشخص بود که روش‌هایDTW و RF نه‌تنها در منطقۀ مرودشت در منطقه‌های دیگر با مشخصات جغرافیایی متفاوت نیز به دقت بالایی دست یافتند. این نتایج نشان‌دهندۀ قدرت تعمیم‌پذیری این الگوریتم‌ها به منطقه‌های مختلف و قابلیت ارائۀ نتایج دقیق در شرایط مختلف جغرافیایی است. تفسیر این مقایسه نشان می‌دهد که الگوریتم‌های استفاده‌شده در این پژوهش از‌نظر دقت و کارایی سازگاری کاملی با نتایج پژوهش‌های گذشته دارند. این امر نه‌تنها نتیجه‌گیری‌های این پژوهش را تقویت می‌کند، به اعتبار و قابلیت اعتماد بیشتر به این الگوریتم‌ها در سیاق گسترده‌تری اشاره دارد. همچنین، به ما امکان می‌دهد که با اطمینان بیشتری به نتایج به‌دست‌آمده از این پژوهش‌ها در کاربردهای عملی و برنامه‌ریزی کشاورزی در منطقه‌های مختلف اعتماد کنیم.

نتایج برآورد می‌کند که در این سال زراعی، محصولات چغندرقند و گوجه‌فرنگی هر‌یک بیش از 40 هزار هکتار سطح زیرکشت و پس از آن، جو، ذرت، صیفی‌جات و برنج نیز بیش از 15 هزار هکتار سطح زیرکشت در مرودشت داشته است. این آمار با آمارنامه‌های حاصل از جهاد کشاورزی در تطابق نسبی بود.

 

نتیجهگیری

در پژوهش حاضر نقشۀ نوع محصول کشاورزی دشت مرودشت در استان فارس در سال زراعی 93-94 با استفاده از تصاویر ماهواره‌ای لندست-8 تهیه و از سری زمانی 8 روزۀ باندهای طیفی 2 تا 5 و شاخص NDVI در تحلیل داده‌ها استفاده شد. در این منطقه محصولات زراعی متنوعی از‌جمله یونجه، جو، گندم، ذرت، چغندرقند، گوجه‌فرنگی، برنج، و صیفی‌جات تولید می‌شد. برای طبقه‌بندی این مزارع از روش‌های یادگیری ماشین کارا همچون الگوریتم‌های درخت تصمیم (DT)، جنگل تصادفی (RF)، جنگل دورانی (RoF)، ماشین بردار پشتیبان (SVM) و آنالیز انحراف زمانی پویا (DTW) به‌کار گرفته شد.

نتایج حاصل از پیاده‌سازی این الگوریتم‌ها به شرح زیر است.

  • الگوریتم‌های DTW و RF نسبت به سایر روش‌ها به‌خوبی محصولات کشاورزی این منطقه را شناسایی کردند؛
  • تنها دو الگوریتم DTW و RF توانستند با دقت استاندارد 85% تمام محصولات از‌جمله صیفی‌جات و گوجه‌فرنگی را که داده‌های نامتوازنی داشتند با کارایی بالا طبقه‌بندی کنند؛
  • این موضوع که با نتایج پژوهش‌های گذشته در سازگاری بود، نشان داد که تنها نقشه‌های حاصل از این دو الگوریتم برای سازمان‌های کشاورزی مطمئن است؛
  • الگوریتم‌های DT و RoF چندان عملکرد خوبی از خود نشان ندادند و دقت کلی آنها پایین بود. ضمن آنکه در شناسایی برخی محصولات به‌طور کلی ناتوان بودند؛
  • استفادۀ تنها از شاخص NDVI قابلیت و کارایی لازم را برای شناسایی محصولات این منطقه نداشت؛
  • حصول نقشۀ دقیق‌تر از نوع محصول کشاورزی منطقۀ مطالعاتی منوط به استفاده از ویژگی‌های اضافه‌تری همچون باندهای طیفی بود؛

محدودیت و مشکلاتی که در پیاده‌سازی روش پژوهشاین مقاله وجود داشت عبارت بود از:

  • اولین مشکل به عدم اطمینان‌پذیری کامل داده‌های زمینی تهیه‌‌شده از این منطقه مرتبط بود. این اطلاعات بیشتر بر‌اساس اظهارنظر‌های مالکان و کشاورزان منطقه جمع‌آوری شده بود که اطمینان بیشتری از دقت و صحت این اطلاعات را فراهم نمی‌کرد. انحراف معیار و میانگین بین کلاس‌ها نیز نشان از آمیختگی کلاس‌های محصولات داشت.
  • دومین مشکل و محدودیت به حجم فراوان اطلاعاتی از منطقۀ مطالعاتی بر‌می‌گشت که باوجود کارایی زیاد آن منجر به زمان‌بر‌شدن اجرای روش انحراف زمانی پویای آن شد؛

نتایج پژوهش حاضر نه‌تنها برای پژوهش‌های آینده در‌زمینۀ تهیۀ نقشۀ نوع محصول کشاورزی، برای متخصصان، سیاست‌گذاران و تصمیم‌گیران در‌حوزۀ کشاورزی نیز اهمیت دارد. توصیه می‌شود تا از نتایج این مطالعه در فرآیندهای تصمیم‌گیری مرتبط با کشاورزی، همچون برنامه‌ریزی منطقه‌ای، مدیریت آب و پیش‌بینی تولید محصولات کشاورزی استفاده شود. علاوه بر این، برای پژوهش‌های آینده بهبود دقت و قابلیت پیش‌بینی در تهیۀ نقشه نوع محصولات، توسعۀ رویکردهای تحلیل داده، استفاده از داده‌های ماهواره‌های نوری جدید لندست-9 و سنتینل-2، استفاده از داده‌های ماهواره‌های راداری رایگان مثل سنتینل-1 و ادغام این داده‌ها با یکدیگر پیشنهاد می‌شوددرنهایت، پژوهش‌های بیشتر در‌زمینۀ بهینه‌سازی الگوریتم‌های یادگیری ماشین همچون الگوریتم DTW بر‌اساس ویژگی‌های خاص منطقه‌های جغرافیایی می‌تواند در توسعۀ روش‌های کارآمدتر تأثیرگذار باشد.

منابع
خسروی، ایمان، موسوی، میرمجید، و امینی، جلال (1394). ارائۀ یک روش انتخاب ویژگی برمبنای الگوریتم ژنتیک و درخت تصمیم برای طبقه‌بندی تصاویر تمام پلاریمتریک راداری. نشریۀ علمی پژوهشی مهندسی فناوری اطلاعات مکانی، 3(2)، 75-88. 10.29252/jgit.3.2.75
مؤمنی، مهدی، خسروی، ایمان، و مستأجران، بهنوش (1392). شیءگرایی در پردازش تصاویر سنجش از دور. انتشارات دانشگاه اصفهان.
خسروی، ایمان، صفری، عبدالرضا، و همایونی، سعید (1397). سیستم‌های طبقه‌بندی‌کنندۀ چندگانۀ نوین درختی به‌منظور طبقه‌بندی زمین‌های کشاورزی از تصاویر نوری و راداری تمام‌قطبیده. نشریۀ علمی پژوهشی علوم و فنون نقشه‌برداری، 8(2)، 13-34. http://jgst.issgeac.ir/article-1-716-fa.html
 
References
Belgiu, M., & Csillik, O. (2018). Sentinel-2 cropland mapping using pixel-based and object-based time-weighted dynamic time warping analysis. Remote Sensing of Environment, 204, 509-523. https://doi.org/10.1016/j.rse.2017.10.005
Belgiu, M., Zhou, Y., Marshall, M., & Stein, A. (2020). Dynamic time warping for crops mapping. The International Archives of The Photogrammetry, Remote Sensing And Spatial Information Sciences, 43, 947-951.‏ https://doi.org/10.5194/isprs-archives-XLIII-B3-2020-947-2020
Bolaños, J., Corrales, J.C., & Campo, L.V. (2023). Feasibility of early yield prediction per coffee tree based on multispectral aerial imagery: Case of arabica coffee crops in Cauca-Colombia. Remote Sensing, 15(1), 282. https://doi.org/10.3390/rs15010282
Chellasamy, M., Zielinski, R. T., & Greve, M. H. (2014). A multievidence approach for crop discrimination using multitemporal worldview-2 imagery. IEEE Journal Of Selected Topics In Applied Earth Observations And Remote Sensing, 7(8), 3491-3501. https://doi.org/10.1109/JSTARS.2014.2349945
Chen, P. C., Chiang, Y. C., & Weng, P. Y. (2020). Imaging using unmanned aerial vehicles for agriculture land use classification. Agriculture, 10(9), 416.‏ https://doi.org/10.3390/agriculture10090416
Denize, J., Hubert-Moy, L., Betbeder, J., Corgne, S., Baudry, J., & Pottier, E. (2019). Evaluation of using sentinel-1 and-2 time-series to identify winter land use in agricultural landscapes. Remote Sensing, 11(1), 37. https://doi.org/10.3390/rs11010037
Du, M., Huang, J., Wei, P., Yang, L., Chai, D., Peng, D., Sha, J., Sun, W., & Huang, R. (2022). Dynamic mapping of paddy rice using multi-temporal landsat data based on a deep semantic segmentation model. Agronomy, 12(7), 1583.‏ https://doi.org/10.3390/agronomy12071583
Du, P., Xia, J., Zhang, W., Tan, K., Liu, Y., & Liu, S. (2012). Multiple classifier system for remote sensing image classification: A review. Sensors, 12(4), 4764-4792. https://doi.org/10.3390/s120404764
Fieuzal, R., Bustillo, V., Collado, D., & Dedieu, G. (2020). Combined use of multi-temporal Landsat-8 and sentinel-2 images for wheat yield estimates at the intra-plot spatial scale. Agronomy, 10(3), 327.‏ https://doi.org/10.3390/agronomy10030327
Gao, C., Ji, X., He, Q., Gong, Z., Sun, H., Wen, T., & Guo, W. (2023). Monitoring of wheat fusarium head blight on spectral and textural analysis of UAV multispectral imagery. Agriculture, 13(2), 293. https://doi.org/10.3390/agriculture13020293
Ghorbanpour, A.K., Kisekka, I., Afshar, A., Hessels, T., Taraghi, M., Hessari, B., Tourian, M.J., & Duan, Z. (2022). Crop water productivity mapping and benchmarking using remote sensing and google earth engine cloud computing. Remote Sensing, 14(19), 4934. https://doi.org/10.3390/rs14194934
Guo, Y., Xia, H., Zhao, X., Qiao, L., & Qin, Y. (2022). Estimate the earliest phenophase for garlic mapping using time series Landsat 8/9 images. Remote Sensing, 14(18), 4476. https://doi.org/10.3390/rs14184476
Ioannidou, M., Koukos, A., Sitokonstantinou, V., Papoutsis, I., & Kontoes, C. (2022). Assessing the added value of sentinel-1 PolSAR data for crop classification. Remote Sensing, 14(22), 5739. https://doi.org/10.3390/rs14225739
Khosravi, I., & Alavipanah, S. K. (2019). A random forest-based framework for crop mapping using temporal, spectral textural and polarimetric observations. International Journal of Remote Sensing, 40(18), 7221-7251. https://doi.org/10.1080/01431161.2019.1601285
Khosravi, I., Mousavi, M. M., & Amini, J. (2015). Presenting a feature selection method based on genetic algorithm and decision tree for classifying fully polarimetric SAR images. Engineering Journal of Geospatial Information Technology, 3(2), 75-88 10.29252/jgit.3.2.75 [In Persian].
Khosravi, I., Razoumny, Y., Hatami Afkoueieh, J., & Alavipanah, S. K. (2021). Fully polarimetric synthetic aperture radar data classification using probabilistic and non-probabilistic kernel methods. European Journal of Remote Sensing, 54(1), 310-317.‏ https://doi.org/10.1080/22797254.2021.1924081
Khosravi, I., Safari, A., & Homayouni, S. (2018). Enhanced tree-based multiple classifier systems for cropland classification from optical and full-polarimetric radar images. Journal Of Geomatics Science and Technology, 8(2), 13-34 http://jgst.issgeac.ir/article-1-716-fa.html [In Persian].
Khosravi, I., Safari, A., & Homayouni, S. (2018). MSMD: Maximum separability and minimum dependency feature selection for cropland classification from optical and radar data. International Journal Of Remote Sensing, 39(8), 2159-2176. https://doi.org/10.1080/01431161.2018.1425564
Li, F., Miao, Y., Chen, X., Sun, Z., Stueve, K., & Yuan, F. (2022). In-season prediction of corn grain yield through PlanetScope and Sentinel-2 images. Agronomy, 12(12), 3176.‏ https://doi.org/10.3390/agronomy12123176
López-Andreu, F.J., Erena, M., Dominguez-Gómez, J.A., & López-Morales, J.A. (2021). Sentinel-2 images and machine learning, as tool for monitoring of the common agricultural policy: Calasparra rice as a case study. Agronomy, 11(4), 621. https://doi.org/10.3390/agronomy11040621
Lu, M., Bi, Y., Xue, B., Hu, Q., Zhang, M., Wei, Y., Yang, P., & Wu, W. (2022). Genetic programming for high-level feature learning in crop classification. Remote Sensing, 14(16), 3982. https://doi.org/10.3390/rs14163982
Lv, Y., Zhang, C., Yun, W., Gao, L., Wang, H., Ma, J., Li, H., & Zhu, D. (2020) The delineation and grading of actual crop production units in modern smallholder areas using RS Data and Mask R-CNN. Remote Sensing, 12(7), 1074. https://doi.org/10.3390/rs12071074
Mangai, U. G., Samanta, S., Das, S., & Chowdhury, P. R. (2010). A survey of decision fusion and feature fusion strategies for pattern classification. IETE Technical Review, 27(4), 293-307. https://doi.org/10.4103/0256-4602.64604
Mao, M., Zhao, H., Tang, G., & Ren, J. (2023). In-season crop type detection by combing sentinel-1a and sentinel-2 imagery based on the CNN model. Agronomy, 13(7), 1723.‏ https://doi.org/10.3390/agronomy13071723
Mirzaei, A., Bagheri, H., & Khosravi, I. (2023). Enhancing crop classification accuracy through synthetic SAR-optical data generation using deep learning. ISPRS International Journal Of Geo-Information, 12(11), 450.‏ https://doi.org/10.3390/ijgi12110450
Momeni, M., Khosravi, A., & Mostajran, B. (2012). Object orientation in remote sensing image processing. University of Isfahan Press. [In Persian].
Nguyen, M. D., Baez-Villanueva, O. M., Bui, D. D., Nguyen, P. T., & Ribbe, L. (2020). Harmonization of Landsat and sentinel 2 for crop monitoring in drought prone areas: Case studies of Ninh Thuan (Vietnam) and Bekaa (Lebanon). Remote Sensing, 12(2), 281.‏ https://doi.org/10.3390/rs12020281
Peña-Barragán, J. M., Ngugi, M. K., Plant, R. E., & Six, J. (2011). Object-based crop identification using multiple vegetation indices, textural features and crop phenology. Remote Sensing of Environment, 115(6), 1301-1316. https://doi.org/10.1016/j.rse.2011.01.009
Qiu, S., Zhu, Z., & He, B. (2019). Fmask 4.0: Improved cloud and cloud shadow detection in Landsats 4–8 and sentinel-2 imagery. Remote Sensing Of Environment, 231, 111205. https://doi.org/10.1016/j.rse.2019.05.024
Rafif, R., Kusuma, S. S., Saringatin, S., Nanda, G. I., Wicaksono, P., & Arjasakusuma, S. (2021). Crop intensity mapping using dynamic time warping and machine learning from multi-temporal PlanetScope data. Land, 10(12), 1384.‏ https://doi.org/10.3390/land10121384
Rodriguez, J. J., Kuncheva, L. I., & Alonso, C. J. (2006). Rotation forest: A new classifier ensemble method. IEEE Transactions on Pattern Analysis And Machine Intelligence, 28(10), 1619-1630. https://doi.org/10.1109/TPAMI.2006.211
Seydi, S.T., Amani, M., & Ghorbanian, A. (2022). A dual attention convolutional neural network for crop classification using time-series Sentinel-2 imagery. Remote Sensing 2022, 14(3), 498. https://doi.org/10.3390/rs14030498
Shen, Y., Zhang, J., Yang, L., Zhou, X., Li, H., & Zhou, X. (2022). A novel operational rice mapping method based on multi-source satellite images and object-oriented classification. Agronomy, 12(12), 3010. https://doi.org/10.3390/agronomy12123010
Singh, R. K., Rizvi, J., Behera, M. D., & Biradar, C. (2021). Automated crop type mapping using time-weighted dynamic time warping-A basis to derive inputs for enhanced food and nutritional security. Current Research In Environmental Sustainability, 3, 100032.‏ https://doi.org/10.1016/j.crsust.2021.100032
Tuvdendorj, B., Zeng, H., Wu, B., Elnashar, A., Zhang, M., Tian, F., Nabil, M., Nanzad, L., Bulkhbai, A., & Natsagdorj, N. (2022). Performance and the optimal integration of sentinel-1/2 time-series features for crop classification in northern mongolia. Remote Sensing, 14(8), 1830. https://doi.org/10.3390/rs14081830
Vilela, E.F., Ferreira, W.P.M., Castro, G.D.M. D., Faria, A.L.R. D., Leite, D.H., Lima, I.A., Matos, C. D. S.M. D., Silva, R.A., & Venzon, M. (2023). New spectral index and machine learning models for detecting coffee leaf miner infestation using sentinel-2 multispectral imagery. Agriculture, 13(2), 388. https://doi.org/10.3390/agriculture13020388
Wei, J., Cui, Y., Luo, W., & Luo, Y. (2022). Mapping paddy rice distribution and cropping intensity in China from 2014 to 2019 with Landsat images effective flood signals and Google Earth engine. Remote Sensing, 14(3), 759. https://doi.org/10.3390/rs14030759
Wu, Y., Wu, Y., Wang, B., & Yang, H. (2023). A remote sensing method for crop mapping based on multiscale neighborhood feature extraction. Remote Sensing, 15(1), 47.‏ https://doi.org/10.3390/rs15010047
Xiao, X., Jiang, L., Liu, Y., & Ren, G. (2023). Limited-samples-based crop classification using a time-weighted dynamic time warping method sentinel-1 imagery and Google Earth engine. Remote Sensing, 15(4), 1112.‏ https://doi.org/10.3390/rs15041112
Yi, Z., Jia, L., Chen, Q., Jiang, M., Zhou, D., & Zeng, Y. (2022). Early-season crop identification in the Shiyang river basin using a deep learning algorithm and time-series sentinel-2 data. Remote Sensing, 14(21), 5625. https://doi.org/10.3390/rs14215625
Zhang, H., He, B., & Xing, J. (2022). Mapping paddy rice in complex landscapes with Landsat time series data and superpixel-based deep learning method. Remote Sensing, 14(15), 3721. https://doi.org/10.3390/rs14153721
Zhu, L., Radeloff, V. C., & Ives, A. R. (2017). Improving the mapping of crop types in the midwestern US by fusing Landsat and MODIS satellite data. International Journal Of Applied Earth Observation And Geoinformation, 58, 1-11. https://doi.org/10.1016/j.jag.2017.01.012