نوع مقاله : مقاله پژوهشی
نویسنده
استادیار گروه مهندسی نقشهبرداری، دانشکدۀ مهندسی عمران و حملونقل، دانشگاه اصفهان، اصفهان، ایران
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسنده [English]
Abstract
One of the key priorities of the Ministry of Agriculture Jihad is the mapping of croplands to estimate crop acreage and annual yield. In recent decades, remote sensing technology has proven to be highly effective in estimating the extent of crop cultivation through the use of timely images and synchronized data with diverse spatial, temporal, and spectral resolutions, leveraging advanced machine-learning algorithms. This study presented a framework for crop mapping in Marvdasht, Fars Province, by utilizing time series of Landsat-8 satellite images and advanced machine-learning algorithms. The employed algorithms included Decision Tree (DT), Random Forest (RF), Rotation Forest (RoF), Support Vector Machine (SVM), and Dynamic Time Warping (DTW) analysis. The results indicated that the dynamic time warping and random forest methods outperformed others, achieving significantly higher accuracy (with an overall accuracy improvement of 10-12%) in generating the agricultural land-use map of the study area. Furthermore, this research demonstrated the effectiveness of Bands 2-5 of Landsat-8 satellite in confidently identifying all crops in this region using the mentioned methods.
Keywords: Crop Mapping, Crop Acreage Estimation, Landsat-8 Satellite, Machine Learning, Random Forest (RF), Support Vector Machine (SVM), Dynamic Time Warping (DTW), Remote Sensing.
Introduction
One of the key priorities of the Ministry of Agricultural Jihad and the related organizations is to create a cropland map for estimating crop area and annual yield of strategic products. This study aimed to establish a framework based on classification algorithms using time series of Landsat-8 satellite images to estimate the crop acreage of agricultural products. The study area was the city of Marvdasht in Fars Province, which boasted a relatively diverse range of agricultural crop types. In addition to the main satellite bands, the NDVI time series was also utilized for collecting the data in this research. Various classification methods, such as Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), and Rotation Forest (RoF), were compared with the Dynamic Time Warping (DTW) method as well. Furthermore, a reliable cropland map of the study area was prepared by using each method.
Methodology
In this study, a rule-based framework utilizing well-known classifiers, such as DT, RF, RoF, SVM, and DTW methods, was proposed by using an 8-day time series of Landsat-8 satellite images and the Digital Elevation Model (DEM) of the region. The proposed framework consisted of two fundamental steps: Firstly, non-agricultural areas, including urban areas, water bodies, and mountainous regions, were masked in the region by using several rules. Subsequently, the agricultural fields were classified. To mask urban areas, the Standard Deviation (SD) of the time series of the NDVI index was employed. For identifying water bodies, a simple thresholding method was used based on the negative NDVI values. Additionally, the DEM of the region was utilized to mask highland areas. Finally, the pixels belonging to agricultural areas were classified by using the five algorithms, i.e., DT, RF, RoF, SVM, and DTW.
Research Findings
Using only the NDVI index, the methods achieved an overall accuracy between 81% and 86% (Kappa coefficient of 0.78-0.83). Notably, the RF and DTW methods exhibited the highest overall accuracy. The resulting SD also indicated the high stability of these two methods compared to the others. Conversely, the RoF method demonstrated the lowest accuracy, while the DT method proved to be less stable than all the other methods. The SVM method, exhibited similar inefficiency and low reliability in identifying summer crops and tomato products as the RoF method although it achieved relatively a good overall accuracy and kappa coefficient. In contrast, the RF and DTW methods were able to distinguish tomato products with relatively good accuracy, but they did not perform well in detecting summer crops. It appeared that regardless of the classification method, relying solely on the NDVI index was insufficient for vegetation identification.
Another important observation was that none of these methods achieved the standard accuracy of 85% for identifying products in the study area. Even the RF and DTW methods, which exhibited higher F-score values in most classes compared to the other methods, could not meet this standard accuracy for most classes, including sugar beet, wheat, corn, summer crops, and tomatoes. Therefore, it could be concluded that relying solely on the NDVI index might not be effective for classifying the agricultural croplands of this region.
When the time series of the spectral bands were used in conjunction with the NDVI index time series, the overall accuracy of all the methods improved from 88% to 96% (a 6-12% increase in accuracy). The highest increase in accuracy was 12% and 10% for the DTW and RF methods, respectively. Additionally, these two methods exhibited greater stability compared to the other methods. The inclusion of spectral bands even provided additional assistance to the DT, RoF, and SVM methods in identifying certain crops, such as summer crops and tomatoes, which had been challenging to identify in the previous stage. Another noteworthy point was that, with the addition of spectral bands, the standard accuracy of 85% was ultimately achieved for all crop types in the city of Marvdasht by the two methods of DTW and RF.
Discussion of Results & Conclusion
This article explored the creation of a cropland map for the agricultural fields of Marvdasht City in Fars Province during the 2014-15 crop year using remote sensing images. An 8-day time series of the spectral bands of 2 to 5 and the NDVI index of Landsat-8 satellite images were employed. This case study encompassed a wide variety of crops, including alfalfa, barley, wheat, corn, sugar beet, tomato, rice, and summer crops. The classification methods utilized in this study comprised Decision Tree (DT), Random Forest (RF), Rotation Forest (RoF), Support Vector Machine (SVM), and Dynamic Time Warping (DTW) algorithms. The implementation of these methods in the mentioned area led to the following conclusions: The DTW and RF methods proved to be more effective than the other methods in identifying agricultural crop types in the study area. Conversely, the DT and RoF methods exhibited subpar performance. The overall low accuracy and inability to identify certain products, such as tomatoes and summer crops, by relying solely on the NDVI index, raised doubts about the efficacy of this method in this region. On the other hand, the DTW method as a novel approach demonstrated excellent efficiency in identifying the agricultural crop types in this region. In summary, this article underscored that, relying solely on the NDVI index for creating a reliable and effective cropland map in Marvdasht was insufficient and it was imperative to incorporate additional features, such as spectral bands, to achieve high accuracy in crop mapping.
کلیدواژهها [English]
بخش کشاورزی بهعنوان یکی از ارکان بنیادی و کلان اقتصاد ملی نهتنها نقش بسزایی در تأمین مواد غذایی مردم دارد، بهعنوان یک مؤلفۀ اساسی از اقتدار و امنیت ملی کشورها بهویژه ایران شناخته میشود. مدیریت کارآمد، هدفمند و پایش دقیق این بخش تأثیر فوری و مستقیمی بر اقتصاد داخلی و نیز روابط بینالمللی کشور دارد. یکی از اولویتهای حیاتی وزارت جهاد کشاورزی، تهیۀ نقشۀ نوع محصول کشاورزی (Crop Mapping) یا تخمین سطح زیرکشت محصولات (Crop Acreage Estimation) با هدف برآورد سالیانۀ میزان تولید محصولات استراتژیک است. داشتن اطلاعات دقیق از سطح زیرکشت محصولات، اقدامهای منطقی و مؤثرتری را در سیاستهای مدیریتی و اجرایی کوتاهمدت و بلندمدت بخش کشاورزی فراهم میکند (Zhu et al., 2017).
باوجود ضرورت این مسئله و تأثیر ویژۀ آن در مدیریت کشاورزی و اقتصاد ملی، بیشتر شیوۀ سنتی همچون جمعآوری اطلاعات میدانی از کشاورزان و صاحبان املاک استفاده شده است. این شیوه امکان تخمین سطح زیرکشت را فراهم میکند؛ اما بهدلیل تنوع زیاد اظهارنظرها، اعتماد کاملی به آن وجود ندارد؛ بنابراین نیازمند هزینههای انسانی و زمانی چشمگیری بهویژه در منطقههای وسیع است (Li et al., 2022). در دهههای اخیر، فناوری سنجش از دور (Remote Sensing) با رشد و توسعۀ سیستمهای تصویربرداری از سطح زمین بهعنوان یک ابزار حیاتی درزمینۀ مطالعه، تولید اطلاعات جامع و مدیریت یکپارچۀ کشاورزی شناخته شده است (Wu et al., 2023). این فناوری بهدلیل فراهمکردن تصاویر و دادههای بههنگام با تفکیکپذیریهای متنوع مکانی، زمانی و طیفی نقش مهمی در بخش کشاورزی بهویژه در تخمین میزان سطح زیرکشت محصولات دارد (Mao et al., 2023).
تاکنون ماهوارههای سنجش از دور متنوعی در مطالعات کشاورزی به کار گرفته شده است. در چند سال گذشته، ماهوارۀ لندست-8 بهطور ویژه توجه پژوهشگران را به خود جلب کرده است (Lv et al., 2020; Du et al., 2022; Ghorbanpour et al., 2022; Guo et al., 2022; Wei et al., 2022; Zhang et al., 2022). این ماهواره قابلیت تهیۀ نقشههای پهنهبندی را درمقیاس ملی-محلی دارد. تصاویر ماهوارۀ لندست-8 خطای نوارشدگی موجود در برخی تصاویر لندست-7 را ندارد و با داشتن باندهای اضافهتر در کاربردهای کشاورزی مفید است. زمان تکرار تصویربرداری این ماهواره 16 روز است که به دلیل همپوشانی عرضی باندهای تصویربرداری این زمان در بیشتر مواقع تا 8 روز هم کاهش مییابد؛ بنابراین برای پایش روند رشد گیاه مناسب به نظر می رسد (Zhang et al., 2022). عمدۀ ویژگیهای استفادهشده از این ماهواره در مقالهها شامل اطلاعات باندهای طیفی 2 تا 5 (مرئی و مادون قرمز نزدیک) است که بیانگر رفتار انعکاسی انواع محصولات است (Wei et al., 2022). علاوه بر این، شاخص گیاهی تفاضلی نرمالشده (NDVI) (Normalized Difference Vegetation Index) و شاخص گیاهی بهبودیافته (EVI) (Enhanced Vegetation Index) در برخی مقالهها به کار گرفته شده است (Peña-Barragán et al., 2011; Chellasamy et al., 2014; Fieuzal et al., 2020; Nguyen et al., 2020). سری زمانی این شاخصها بهویژه NDVI میتواند برای بررسی و تشخیص وقایع رشدشناسی محصول (فنولوژی) همچون شروع، پایان و طول فصل رشد گیاه مفید باشد.
در دهههای اخیر، روشهای یادگیری ماشین مختلفی با ساختارها و معماریهای متنوعی برای تهیۀ نقشۀ نوع محصول کشاورزی از تصاویر ماهوارهای استفاده شده است. در این میان، روشهای طبقهبندی نظارتشدۀ چندزمانه با کمک شاخصهای پوششگیاهی نتایج مؤثری را برای تفکیک محصولات کشاورزی ارائه کرده است. در برخی مطالعات از روش شبکۀ بیزین و الگوریتم بیشترین شباهت (Maximum Likelihood) استفاده شده است (Chen et al., 2020; López-Andreu et al., 2021; Lu et al., 2022). این دو روش بهشدت وابسته به توزیع دادهها هستند که بیشتر در طبقهبندی مجموعهدادههای بزرگ با محدودیت مواجه میشوند. در برخی از مطالعات دیگر از شبکۀ عصبی مصنوعی (ANN) (Artificial Neural Network) و ماشین بردار پشتیبان (SVM) (Support Vector Machine) بهره برده شده است (Denize et al., 2019; Ioannidou et al., 2022; Shen et al., 2022; Gao et al., 2023; Mao et al., 2023; Vilela et al., 2023). الگوریتم ANN بیشتر بهعنوان یک طبقهبندیکنندۀ ناپایدار شناخته میشود (Du et al., 2012). SVM نیز اگرچه یک روش تعمیمپذیر و پایدار برای طبقهبندی دادهها در فضایی با ویژگی ابعاد بالاست، با چندین چالش بزرگ همچون انتخاب کرنل و پارامترهای بهینۀ آن و اثر دادههای نویزی روی کاراییاش مواجه است (Khosravi et al., 2021). از روشهای یادگیری ماشین مبتنی بر درخت ازجمله درخت تصمیم (DT) (Decision Tree)، روش جنگل تصادفی (RF) (Random Forest) و روش جنگل دورانی (RoF) (Rotation Forest) در مطالعات طبقهبندی محصولات کشاورزی استفاده شده است (Khosravi et al., 2018; Denize et al., 2019; Seydi et al., 2022; Tuvdendorj et al., 2022; Yi et al., 2022; Bolaños et al., 2023; Gao et al., 2023; Mao et al., 2023; Mirzaei et al., 2023; Vilela et al., 2023). الگوریتم DT ساختار ساده و قابل فهمی دارد؛ اما ممکن است با مشکلاتی در طبقهبندی دادههای بزرگ روبهرو شود (Du et al., 2012). درمقابل، الگوریتم RF همانند SVM کارایی زیادی در چنین شرایطی دارد. الگوریتم RF به لطف امتیازاتش نسبت به الگوریتم SVM مطلوبتر است. روش RF سرعت عملکردی بیشتر، انعطاف بیشتر و ساختار سادهتر دارد و نسبت به دادههای نویزی مقاومتر است. همچنین، برخلاف SVM دغدغۀ کمتری برای انتخاب پارامترهای بهینه دارد (Khosravi & Alavipanah, 2019).
حصول دقت بالا روشهای یادگیری ماشین ذکرشده بیشتر درصورت وجود دادههای زمینی کافی امکانپذیر است؛ با این حال جمعآوری دادههای زمینی بههنگام یک فرآیند زمانبر و هزینهبر است؛ بنابراین این روشها در شرایط محیطی پیچیده و سیستمهای کشاورزی مختلف ممکن است کارایی مناسبی نداشته باشد. بهتازگی، آنالیز انحراف زمانی پویا (DTW) (Dynamic Time Warping) در چندین مطالعۀ طبقهبندی محصولات کشاورزی استفاده شده است (Belgiu & Csillik, 2018; Belgiu et al., 2020; Rafif et al., 2021; Singh et al., 2021; Xiao et al., 2023). این روش کارایی زیاد در هنگام محدودیت دسترسی به دادههای زمینی و تنها یک نیاز حداقلی به دانش تقویم زراعی و عملیات کشاورزی دارد. همچنین، این روش قابلیت تعمیم به سالهای مختلف و منطقههای وسیعتر را با تنظیمات جزئی مربوط به شرایط کشاورزی و آبوهوایی سالیانه دارد (Xiao et al., 2023).
تاکنون در ایران اقدامهای بسیارمحدود و غیرمنسجمی برای ارائۀ یک چارچوب جامع تهیۀ نقشۀ نوع محصول یا تخمین سطح زیرکشت محصولات کشاورزی با استفاده از روشهای یادگیری ماشین بهویژه روشهای جنگل تصادفی و آنالیز انحراف زمانی پویا از تصاویر ماهوارهای لندست-8 انجام شده است. این نقطهضعف اقدامهای محدود اغلب بهدلیل دردسترسنبودن به دادههای زمینی کافی مشکلاتی را در جمعآوری آنها به وجود آورده است؛ بنابراین محققان در پژوهش حاضر قصد دارند تا برای پرکردن این خلأ براساس روشهای یادگیری ماشین نظارتشده گامی در راستای ارائۀ یک چارچوب تخمین سطح زیرکشت محصولات کشاورزی یک منطقه در ایران با استفاده از سری زمانی تصاویر ماهوارهای لندست-8 بردارند. شهر مرودشت استان فارس بهدلیل تنوع فراوان محصولات کشاورزی بهعنوان منطقۀ مطالعاتی این پژوهش انتخاب شده است. ویژگیهای استفادهشده در این پژوهش سری زمانی باندهای 2 تا 5 و سری زمانی NDVI استخراجشده از تصاویر این ماهواره است. همچنین، روشهای طبقهبندی مختلف ازجمله SVM، DT، RF، RoF با روش DTW ازلحاظ وابستگی به نمونۀ آموزشی مقایسه شده است. ضمن اینکه، با هر روش یک نقشۀ تهیۀ نوع محصول کشاورزی تهیه میشود. نتایج حاصل از این مطالعه نهتنها به دقت و کارایی هر مدل اشاره خواهد کرد، میتواند به مسئولان و پژوهشگران در برنامهریزی مناسب برای افزایش بهرهوری و توسعۀ کشاورزی در ایران کمک کند.
معرفی منطقۀ مطالعاتی
دشت مرودشت استان فارس بهعنوان مطالعۀ موردی این پژوهش انتخاب شده است. علت انتخاب این منطقه تنوع فراوان محصولات کشاورزی آن است که میتواند الگوی خوبی برای سیستم کشاورزی کل ایران باشد. شکل 1 محدودۀ سیاسی این منطقه و موقعیتش را نسبت به کشور و استان فارس نشان میدهد. مرودشت در 40 کیلومتری شمال شیراز و در حد فاصل طولهای جغرافیایی 52 درجه و 4 ثانیه تا 53 درجه، 35 دقیقه و 1 ثانیۀ شرقی و عرضهای جغرافیایی 29 درجه، 37 دقیقه و 28 ثانیه تا 30 درجه، 36 دقیقه و 52 ثانیۀ شمالی واقع شده است. مساحت این منطقه حدود 7/4 هزار کیلومتر مربع و ارتفاع متوسط آن از سطح دریا 1620 متر است.
آبوهوای این منطقه کوهستانی و معتدل است و تنوع فراوانی از مزارع کشاورزی را دارد. ضمن اینکه، نواحی کوهستانی در این منطقه بهشدت به چشم میخورد. همچنین، در قسمت شمال شرقی این منطقه دریاچهای قرار دارد که به نام دریاچۀ دودزن مشهور و سدی بر این دریاچه احداث شده است. شهر مرودشت بهعنوان مرکز شهرستان مرودشت در قسمت جنوبی این منطقه قرار دارد. طبق سرشماری عمومی نفوس و مسکن سال 1395 برآورد جمعیت این شهرستان برابر با حدود 324 هزار نفر بهعنوان دومین شهر پرجمعیت استان فارس بوده است. شغل بیشتر مردم این شهرستان کشاورزی و دامداری است.
شکل 1: موقعیت جغرافیایی منطقۀ مطالعاتی: دشت مرودشت، استان فارس، ایران: نمونههای جمعآوری شده از این منطقه با دوایر قرمز رنگ در این شکل مشخص شده است (منبع: نگارنده 1402)
Figure 1: Geographical location of the study area: Marvdasht city, Fars province, Iran. The samples collected from this area were marked with red circles.
روششناسی پژوهش
در پژوهش حاضر یک چارچوب قاعدهمبنا با کمک روشهای یادگیری ماشین پیشرفته شامل الگوریتمهای درختی (ازجمله درخت تصمیم (DT)، جنگل تصادفی (RF)، جنگل دورانی (RoF)، ماشین بردار پشتیبان (SVM)، آنالیز انحراف زمانی پویا (DTW) از سری زمانی 8 روزۀ تصاویر ماهوارۀ لندست-8 و مدل ارتفاعی رقومی مرودشت استان فارس برای تهیۀ نقشۀ نوع محصول کشاورزی این منطقه) پیشنهاد میشود.
مطابق با شکل 2 چارچوب پیشنهادی گامهای اساسی زیر را دارد.
ابتدا دادههای ورودی شامل باندهای تصویری و شاخص گیاهی NDVI استخراجشده از ماهوارۀ لندست-8 به همراه دادۀ کمکی مدل رقومی ارتفاعی (DEM) آماده و پیشپردازش میشود. پس از آن با استفاده از قواعدی منطقههای غیرکشاورزی شامل منطقههای شهری، اجرام آبی و منطقههای کوهستانی در تصویر ماسک میشود. سپس با استفاده از الگوریتمهای طبقهبندی اشارهشده، مزارع کشاورزی منطقۀ مطالعاتی تفکیک و درنهایت، نقشۀ نوع محصول کشاورزی از هر روش تهیه میشود.
شکل 2: نمای شماتیک چارچوب قاعدهمبنای پیشنهادی برای تهیۀ نقشۀ نوع محصول کشاورزی (منبع: نگارنده 1402)
Figure 2: Schematic diagram of the proposed rule-based framework for crop mapping.
معرفی دادههای ورودی
دادههای ماهوارهای استفادهشده در پژوهش حاضر تصاویر سری زمانی 8 روزه از سپتامبر سال 2014 میلادی تا سپتامبر سال 2015 میلادی (مهر 1393 تا مهر 1394) مربوط به سنجندۀ OLI ماهوارۀ لندست-8 اخذشده از منطقۀ مطالعاتی است (جدول 1). ماهوارۀ لندست-8 در 11 فوریۀ سال 2013 میلادی به فضا پرتاب شد که 2 سنجندۀ OLI و TIRS با مجموع 11 باند طیفی دارد. در این پژوهش تنها از سری زمانی باندهای 2 تا 5 (باند 2: آبی، باند 3: سبز، باند 4: قرمز، باند 5: مادون قرمز نزدیک) با حد تفکیک مکانی 30 متر استفاده شد. تمام این تصاویر در دیتوم سیستم ژئودتیک جهانی 1984 (WGS-84) زمینمرجع شده است. پیشپردازشهایی روی باندهای تصویری (تصحیحات جوّی، تبدیل درجۀ خاکستری به مقدار بالای جو برای باندهای طیفی و ماسک و تصحیح منطقههای ابری) انجام شد. برای ماسک ابر از روش خودکار Fmask بهره گرفته (Qiu et al., 2019) و سپس با درونیابی تصاویر قبل و بعد تاریخهای ابری، درجۀ خاکستری این منطقهها تصحیح شد. همچنین، در پژوهش حاضر سری زمانی شاخص NDVI استخراجشده از سری زمانی باندهای قرمز و مادون قرمز نزدیک به کار گرفته شد؛ البته گفتنی است که برای تمام روشهای طبقهبندی، ویژگیها به دو صورت به کار گرفته شد. یکبار از سری زمانی شاخص NDVI بهتنهایی (46 ویژگی) و بار دیگر از سری زمانی باندها و سری زمانی NDVI (230 ویژگی) استفاده شد.
جدول 1: تاریخ اخذ تصاویر لندست-8 مربوط به منطقۀ مطالعاتی مرودشت در سال زراعی 93-94
Table 1: The date of taking Landsat-8 images related to Marvdasht study area in the crop year 93-94.
ماه میلادی اخذ تصویر |
سال میلادی |
ماه شمسی اخذ تصویر |
سال شمسی |
||
2014 |
2015 |
1393 |
1394 |
||
سپتامبر |
29 |
|
مهر |
07، 15، 23 |
|
اکتبر |
07، 15، 23، 31 |
|
آبان |
01، 09، 17، 25 |
|
نوامبر |
08، 16، 24 |
|
آذر |
03، 11، 19، 27 |
|
دسامبر |
02، 10، 18، 26 |
|
دی |
05، 13، 21، 29 |
|
ژانویه |
|
03، 11، 19، 27 |
بهمن |
07، 15، 23 |
|
فوریه |
|
04، 12، 20، 28 |
اسفند |
01، 09، 17، 25 |
|
مارس |
|
08، 16، 24 |
فروردین |
|
04، 12، 20، 28 |
آوریل |
|
01، 09، 17، 25 |
اردیبهشت |
|
05، 13، 21، 29 |
مه |
|
03، 11، 19، 27 |
خرداد |
|
06، 14، 22، 30 |
ژوئن |
|
04، 12، 20، 28 |
تیر |
|
07، 15، 23، 31 |
ژوئیه |
|
06، 14، 22، 30 |
مرداد |
|
08، 16، 24 |
اوت |
|
07، 15، 23، 31 |
شهریور |
|
01، 09، 17، 25 |
سپتامبر |
|
08، 16، 24 |
مهر |
|
02 |
منبع: نگارنده 1402
دادۀ کمکی استفادهشده در این پژوهش مدل ارتفاعی رقومی (DEM) اخذشده از SRTM با حد تفکیک مکانی نزدیک به 30 متر مربوط به سال 2014 از منطقۀ مطالعاتی است. برای این منطقه 8 الگوریتم DEM موجود بود که ابتدا این 8 الگوریتم DEM با یکدیگر موزاییک و سپس با تصاویر ماهوارهای لندست-8 همسیستم مختصات شدند. شکل 3 مدل ارتفاعی رقومی مرودشت را نشان میدهد. منطقههای مرتفع و کوهستانی درجۀ خاکستری روشن (سفید) و منطقههای کمارتفاع که بیشتر شامل زمینهای کشاورزی، اجرام آبی و منطقههای ساختهشده است با درجۀ خاکستری تیره (مشکی) در این شکل مشخص است.
شکل 3: مدل ارتفاعی رقومی (DEM) اخذشده از SRTM از دشت مرودشت (منبع: نگارنده 1402)
Figure 3: Digital Elevation Model (DEM) obtained by SRTM from Marvdasht City.
ماسک منطقههای غیرکشاورزی
ماسک منطقههای غیرکشاورزی شامل ماسک اجرام آبی، منطقههای مرتفع و منطقههای شهری در تصاویر میشود. برای شناسایی و ماسک اجرام آبی در این منطقه بدین صورت عمل شد: مقدار شاخص NDVI اجرام آبی منفی است؛ بنابراین با یک آستانهگذاری ساده از شاخص NDVI میانگین (کوچکتر از صفر) این منطقهها در تصویر ماسک شد. شکل 4 اجرام آبی ماسکشده را در تصویر منطقۀ مطالعاتی به رنگ آبی نشان میدهد.
برای شناسایی و ماسک منطقههای مرتفع کوهستانی بدین صورت عمل شد: باتوجه به DEM منطقه، ارتفاع منطقههای کوهستانی اختلاف شدیدی با منطقههای غیرمرتفع (بهویژه مزارع کشاورزی) دارد؛ بنابراین میتوان تصویر DEM را بهصورت یک تصویر باینری که هیستوگرام دو قلهای (Bi-Modal) دارد، تصور کرد که یک قلۀ آن، نمایانگر منطقههای مرتفع و کوهستانی و قلۀ دیگر، نمایانگر منطقههای غیرمرتفع و پست است؛ بنابراین با یک روش قطعهبندی کارا همچون روش مدل مخلوط گوسینی (GMM) (Guassian Mixture Model) و با درنظر گرفتن تعداد خوشهها برابر 2 منطقههای مرتفع کوهستانی از سایر منطقهها ماسک شد. شکل 4 منطقههای مرتفع ماسکشده را در تصویر منطقۀ مطالعاتی به رنگ قرمز نشان میدهد.
برای شناسایی و ماسک منطقههای ساختهشدۀ بشری بدین صورت عمل شد: منطقههای ساختهشدۀ بشری همچون منطقههای شهری برخلاف منطقههای طبیعی (گیاهان و مزارع کشاورزی) رفتار طیفی ایستا و بهنسبت ثابتی درطول زمان (یک سال زراعی) دارند. پس میتوان نتیجه گرفت که انحراف معیار این منطقهها درطول زمان نسبت به مزارع کشاورزی بسیارمتفاوت است؛ با این حال باید درنظر داشت که منطقههای طبیعی همچون کوهستان و تپهها نیز همانند منطقههای ساختهشدۀ بشری رفتار طیفی بهنسبت ایستایی درطول زمان دارند؛ بنابراین همانند ایدۀ قبلی مجدد با روش قطعهبندی GMM این منطقهها در تصویر ماسک شد. در اینجا تعداد خوشهها به تنوع منطقههای ساختهشدۀ بشری درمقابل منطقههای طبیعی بستگی دارد. شکل 4 منطقههای ساختهشدۀ بشری ماسکشده را در تصویر منطقۀ مطالعاتی به رنگ سبز نشان میدهد. منطقههای کوهستانی از این منطقهها مجزا شدند.
شکل 4: ماسک منطقههای غیرکشاورزی در مرودشت شامل: الف) اجرام آبی (ماسکشده به رنگ آبی)؛ ب) منطقههای مرتفع (ماسکشده به رنگ قرمز)؛ پ) منطقههای ساختهشدۀ بشری (ماسکشده به رنگ سبز) (منبع: نگارنده 1402)
Figure 4: Mask of non-agricultural areas in the Marvdasht including: a) water bodies (masked in blue color); b) highland areas (masked in red) and c) man-made areas (masked in green).
روشهای یادگیری ماشین
پس از ماسک منطقههای غیرکشاورزی، پیکسلهای متعلق به مزارع کشاورزی با پنج الگوریتم DT، RF، RoF، SVM و DTW طبقهبندی میشود. در الگوریتم DT نمونهها بهنحوی دستهبندی میشود که از گره ریشه به سمت پایین رشد میکنند و در انتها به گرههای پایانی یا برگها که همان تصمیمها یا برچسب نمونههاست، میرسند. گره ریشه و هر گره داخلی (انشعاب) یک ویژگی را نشان میدهد که به تعداد ارزش یا مقدار آن ویژگی، شاخه از آن به گرههای پایینتر وجود دارد. برای یادگیری DT یک الگوریتم از معیار بهرۀ اطلاعاتی که مبتنی بر مفهوم بینظمی است، برای رشد درختان از بالا به پایین استفاده میکند. پس از تشکیل کامل درخت برای جلوگیری از پیچیدهترشدن ساختار درخت از عمل هرسکردن درخت و کنارگذاشتن شاخههای اضافی و غیرضروری استفاده میشود (خسروی و همکاران، 1394). درواقع، الگوریتم DT در کنار رتبهبندی ویژگیها، کار طبقهبندی (رسیدن به تصمیمات) را نیز انجام میدهد.
الگوریتم RF از تعداد زیادی DT ساخته شده است و علت نامگذاری آن نیز به همین مسئله برمیگردد. در این روش ابتدا چندین زیرمجموعۀ آموزشی از کل مجموعۀ آموزشی با استفاده از نمونهبرداری تصادفی و با جایگذاری انتخاب و پس از آن در هر زیرمجموعۀ آموزشی زیرمجموعهای از ویژگیها با استفاده از یک نمونهبرداری تصادفی و بدون جایگذاری ایجاد و سپس با هریک از زیرمجموعهها یک الگوریتم DT آموزش داده میشود. سرانجام، خروجی حاصل از DTها با یک قانون رأیگیری حداکثریت (MV) (Majority Voting) با یکدیگر ترکیب میشود. این روش کلاسی را انتخاب میکند که تمام یا بیشتر طبقهبندیکنندهها روی آن همنظر باشند یا آن کلاس، بیشترین تعداد آرای بهدستآمده از همۀ طبقهبندیکنندهها را کسب کرده باشد (Mangai et al., 2010). مهمترین پارامترهای الگوریتم RF تعداد درختهای به کار رفته (nTrees) و تعداد ویژگیهای انتخابشده در هر زیرمجموعه (mTry) است. در پژوهش حاضر پس از سعی و خطا دو پارامتر nTree و mTry بهترتیب برابر با 100 و مجذور تعداد ویژگیها 7 و 16 درنظر گرفته شد.
الگوریتم RoF همانند الگوریتم RF از طبقهبندیکنندۀ DT بهعنوان الگوریتم پایه در ساختار خود استفاده میکند. ابتدا مجموعۀ ویژگیها به چند زیرمجموعۀ ویژگی (K) که اشتراک یا غیراشتراک دارد، تقسیم میشود. سپس برای هر زیرمجموعۀ ویژگی یک نمونۀ خودراهانداز که شامل 60% تا 75% از تعداد نمونههای هر زیرمجموعه است، انتخاب میشود. درادامه، یک روش استخراج ویژگی به نام تجزیهوتحلیل مؤلفههای اصلی (PCA) (Principal Component Analysis) روی هر نمونۀ خودراهانداز به کار برده و سپس با استفاده از ضرایب یا مؤلفههای PCA یک ماتریس دوران مربعی با ابعاد تعداد ویژگیها ساخته میشود. پس از این کار هریک از نمونههای آموزشی با ضرب در ماتریس دوران بهروز و سپس یک مدل از الگوریتم DT با استفاده از هر نمونۀ آموزشی بهروز شده، آموزش داده میشود. درنهایت، با یک روش رأیگیری همچون MV نتایج این m طبقهبندیکننده با یکدیگر ترکیب میشود (Rodriguez et al., 2006). در این پژوهش دو پارامتر K و m بهترتیب برابر با {7 و 16} و 100 در نظر گرفته شد.
روش SVM شامل یافتن ابرصفحهای در فضای ویژگی است که حاشیۀ بین کلاسها، یعنی فاصلۀ نزدیکترین نقاط دادۀ آموزشی کلاسها را بیشینه میکند؛ البته به کمک حقۀ کرنل SVM به توابع تصمیم غیرخطـی نیز قابل تعمیم است. در این حالت الگوریتم بهجای فضای ویژگی در فضای نگاشتیافتۀ کرنل بهدنبال ابرصفحۀ جداکننده است. رایجترین کرنلهای استفادهشده در سنجش از دور کرنل تابع چندجملهای و کرنل تابع پایهای شعاعی (RBF) (Radial Basis Function) است. برای کرنل چندجملهای لازم است تا پارامتر درجه (d) و پارامتر گاما و برای کرنل RBF باید پارامتر گاما (γ) تنظیم شود؛ البته یک پارامتر دیگر به نام پارامتر جریمه (C) باید برای هر دو کرنل از پیش تعیین شود (مؤمنی و همکاران، 1392، ص. 176). در پژوهش حاضر از یک کرنل RBF استفاده و سپس به کمک اعتبارسنجی جانبی و در یک جستوجوی شبکهای، پارامترهای C و γ بهینه شد. دو مقدار 10.000 و 1.000 برای پارامتر C و مقدارهای 004/0 و 002/0 برای پارامتر γ بهعنوان مقدارهای بهینه انتخاب شد.
شکل 5: نمای شماتیک الگوریتم انحراف زمانی پویا (منبع: نگارنده 1402)
Figure 5: Schematic diagram of dynamic time warping algorithm.
الگوریتم DTW ابتدا برای تشخیص گفتار توسعه یافت؛ اما بعدها در آنالیز تصاویر سری زمانی نیز معرفی شد. در آنالیز سری زمانی روش DTW مشابهت بین دو دنبالۀ زمانی را که ممکن است سرعت / فرکانس متفاوت داشته باشد، اندازه میگیرد (شکل 2). درواقع، این روش با مقایسۀ مشابهت بین دو دنبالۀ زمانی و یافتن مسیر بهینۀ آنها یک معیار عدم تشابه را به دست میآورد (Belgiu & Csillik, 2018). در سنجش از دور الگوریتم DTW میتواند با اعوجاجات زمانی سروکار داشته باشد و به لطف توانایی ترازکردن پروفیلهای رادیومتریکی در یک حالت بهینه، پروفیلهای تغییر شکلیافته و نمونهبرداری نامنظم را نیز مقایسه کند.
جمعآوری دادههای زمینی
کارشناسان سازمان فضایی ایران طی یک مأموریت نقشهبرداری زمینی در سالهای زراعی 1393 تا 1394 با اتکا به اطلاعات مالکان و کشاورزان منطقۀ مرودشت دادههای زمینی لازم را از مزارع کشاورزی این منطقه جمعآوری کردند. دوایر قرمز رنگ در شکل 1 مکان این دادهها را نشان میدهد. مطابق با این اطلاعات در سال زراعی 94-93 محصولات عمدۀ این منطقه شامل یونجه، چغندرقند، جو، گندم، ذرت، برنج، گوجهفرنگی و صیفیجات است (جدول 2).
برای طبقهبندی محصولات کشاورزی با روشهای نظارتشده، نمونههای آموزشی و آزمایشی لازم از دادههای زمینی انتخاب میشود. نمونههای آموزشی فقط برای آموزش الگوریتمها و یا بهنوعی ساختن مدل اولیۀ طبقهبندیکننده به کار میرود. درمقابل، نمونههای آزمایشی برای ارزیابی دقت، صحت، اعتمادپذیری روشها و نتایج حاصل استفاده میشود. در پژوهش حاضر 50% کل دادهها بهصورت تصادفی چینهچینه شده در ده مرتبه بهعنوان نمونۀ آموزشی و مابقی بهعنوان نمونۀ آزمایشی انتخاب میشود. تعداد نمونههای آموزشی برای هر کلاس در جدول 3 آورده شده است.
جدول 2: مشخصات کلاسهای محصولات کشاورزی منطقۀ مطالعاتی: مرودشت
Table 2: Characteristics of crop types in the study area: Marvdasht.
کلاس |
مختصۀ E (متر) |
مختصۀ N (متر) |
محصول سال 94-93 |
1 |
693555 |
3299895 |
یونجه |
2 |
675165 |
3302055 |
جو |
3 |
672945 |
3303855 |
چغندر قند |
4 |
673815 |
3309615 |
چغندرقند |
5 |
665805 |
3310035 |
گندم |
6 |
675315 |
3313905 |
ذرت |
7 |
680445 |
3314745 |
صیفیجات |
8 |
679185 |
3314955 |
گندم |
9 |
680475 |
3319185 |
گندم |
10 |
674355 |
3321315 |
چغندرقند |
11 |
660015 |
3329475 |
گوجهفرنگی |
12 |
656385 |
3337845 |
برنج |
13 |
640725 |
3342045 |
برنج |
منبع: نگارنده 1402
جدول 3: تعداد نمونههای آموزشی کلاسهای محصولات کشاورزی منطقۀ مطالعاتی: مرودشت
Table 3: The number of training samples of crop types in the study area: Marvdasht.
کلاس |
یونجه |
جو |
چغندرقند |
گندم |
ذرت |
صیفیجات |
گوجهفرنگی |
برنج |
تعداد کل نمونهها |
203 |
303 |
190 |
146 |
100 |
59 |
39 |
500 |
تعداد نمونههای آموزشی |
101 |
151 |
95 |
73 |
50 |
29 |
19 |
250 |
منبع: نگارنده 1402
ارزیابی دقت نتایج
برای ارزیابی دقت هر روش برچسب حاصل از آن روش برای نمونههای آزمایشی با برچسب واقعیشان مقایسه و برای گزارش مقدارهای کمّی و توصیفی دقت از کمیتهای استخراجشده از ماتریس خطا، یعنی دقت کلی (OA)، ضریب کاپا (kappa) و امتیاز F (F-score) استفاده شد. این کمیتها از روابط
(1) |
|
(2) |
|
(3) |
|
قابل محاسبه است که در آن، nii I Î {1, 2, 3, …, k} تعداد نمونههای کلاس i-ام است که بهدرستی با الگوریتم شناسایی شده، ni+ تعداد نمونههایی است که با الگوریتم طبقهبندیکننده بهعنوان کلاس i شناسایی شده، n+j تعداد نمونههایی است که درحقیقت بهعنوان کلاس j در دادۀ مرجع وجود دارد و N تعداد کل نمونههاست. درواقع، پارامتر OA نسبت مجموع نمونههای درست شناساییشده به کل نمونههاست. OA یک برآورد کلی از طبقهبندی فراهم کرده است؛ زیرا بهتنهایی نمیتواند ارزیابی منطقی و جامعی از عملکرد، کارایی، اعتماد الگوریتم و نتایج آن را ارائه دهد. معیار Kappa برای تعیین اینکه آیا مقدارها درون یک ماتریس خطا بهطور عمده بهتر از مقدارهای درون یک آزمایش تصادفی است یا نه، محاسبه میشود. معیار F-score برخلاف OA و Kappa برای هر کلاس محاسبه میشود که درواقع، میانگین هارمونیک دقتهای تولیدکننده (PA) (Producer's Accuracy) و کاربر (UA) (User's Accuracy) آن کلاس است. این کمیت درواقع، یک معیاری از درصد شناسایی مطمئن نمونههای یک کلاس ارائه داده است؛ بنابراین ما را از تفسیر کمیتهای PA و UA برای هر کلاس بینیاز میکند. محققان در مطالعات پیشین طبقهبندی محصولات کشاورزی اظهار کردند که دقت استاندارد برای استخراج هر محصول کشاورزی برابر با F-score > 85% است (خسروی و همکاران، 1397).
یافتههای پژوهش و تجزیهوتحلیل
شکلهای 6 و 7 نقشههای نوع محصول کشاورزی مرودشت را در دو حالت استفادۀ تنها از سری زمانی شاخص NDVI و استفاده از ترکیب سری زمانی شاخص NDVI و سایر باندهای طیفی نشان میدهد. جدولهای 4 و 5 نیز مقدارهای دقت حاصل از این روشها را ارائه میدهد. در این جدولها اعداد زیر دقتهای OA و Kappa بیانگر انحراف معیار آنها در ده مرتبه پیادهسازی و اعداد زیر دقت F-score نمایانگر تعداد پیکسلهای شناساییشدۀ هر محصول در این منطقه است.
جدول 4: مقدارهای OA (%) و kappa حاصل از روشهای طبقهبندی مزارع کشاورزی منطقۀ مطالعاتی: مرودشت اعداد زیر دقتها بیانگر انحراف معیار این دقتها در ده مرتبه پیادهسازی است
Table 4: OA (%) and kappa resulting from the classification methods in the study area: Marvdasht. The numbers below the accuracy values represent the standard deviation of these accuracies over ten implementation instances.
روشها |
DT |
RoF |
SVM |
RF |
DTW |
|||||
ویژگیها |
NDVI تنها |
NDVI و باندها |
NDVI تنها |
NDVI و باندها |
NDVI تنها |
NDVI و باندها |
NDVI تنها |
NDVI و باندها |
NDVI تنها |
NDVI و باندها |
OA (%) |
25/81 28/3 |
23/88 34/2 |
96/79 22/2 |
40/88 61/1 |
39/84 03/2 |
20/90 61/1 |
92/85 90/1 |
24/95 29/1 |
72/84 01/2 |
30/96 73/1 |
Kappa |
78/0 04/0 |
86/0 03/0 |
77/0 02/0 |
86/0 02/0 |
81/0 02/0 |
88/0 02/0 |
83/0 02/0 |
94/0 02/0 |
82/0 02/0 |
95/0 02/0 |
منبع: نگارنده، 1402
جدول 5: مقدارهای F-score (%) کلاسی حاصل از روشهای طبقهبندی مزارع کشاورزی منطقۀ مطالعاتی: مرودشت. اعداد زیر مقدارهای F-score بیانگر تعداد پیکسلهای شناساییشدۀ هر محصول است
Table 5: F-score (%) resulting from the classification methods in the study area: Marvdasht. The numbers below the F-score values represent the number of pixels identified for each crop types.
روشها |
DT |
RoF |
SVM |
RF |
DTW |
|||||
ویژگیها |
NDVI تنها |
NDVI و باندها |
NDVI تنها |
NDVI و باندها |
NDVI تنها |
NDVI و باندها |
NDVI تنها |
NDVI و باندها |
NDVI تنها |
NDVI و باندها |
یونجه |
46/91 74404 |
59/96 82008 |
79/92 138489 |
50/92 131708 |
06/92 69751 |
36/93 76504 |
49/91 74733 |
72/96 121797 |
05/94 74425 |
97/97 42085 |
جو |
64/94 68651 |
20/97 66038 |
10/95 87621 |
59/97 49028 |
24/94 86924 |
70/96 32161 |
56/97 47512 |
89/97 147891 |
39/97 55649 |
68/98 181902 |
چغندرقند |
60/64 1243481 |
66/79 591488 |
80/60 619542 |
15/79 537243 |
41/66 604798 |
24/79 844257 |
16/72 792102 |
48/90 547703 |
85/69 1239550 |
01/94 511406 |
گندم |
71/66 97143 |
30/81 103534 |
28/66 102333 |
32/86 69071 |
59/76 99582 |
61/82 64865 |
52/78 83728 |
25/95 76329 |
07/75 86876 |
52/92 66798 |
ذرت |
56/66 56994 |
76/75 715835 |
27/67 643486 |
77/74 426686 |
55/69 105893 |
09/83 235666 |
19/70 550815 |
72/88 112097 |
66/65 60524 |
85/90 113845 |
صیفیجات |
77/43 44099 |
72/49 46306 |
- 30655 |
87/58 391831 |
- 123607 |
18/70 66081 |
37/51 53959 |
26/85 176203 |
16/44 35860 |
17/88 174340 |
گوجهفرنگی |
- 15365 |
48/79 49018 |
- 10303 |
15/73 30043 |
- 486857 |
28/65 254706 |
48/79 38315 |
62/85 401913 |
81/73 85394 |
64/90 474917 |
برنج |
88/89 160657 |
06/92 106567 |
06/88 128365 |
78/92 125184 |
18/95 183382 |
22/97 186554 |
50/91 119630 |
94/97 176861 |
15/91 122516 |
38/98 195501 |
منبع: نگارنده، 1402
در جدول 4 تنها نتایج حاصل از استفاده از شاخص NDVI برای طبقهبندی محصولات کشاورزی آمده است. روشهای مختلف در این سنجش توانستهاند دقت کلی در بازۀ 80% تا 86% (معادل کاپا از 77/0 تا 83/0) را به دست آورند. بررسی نتایج نشان میدهد که روشهای RF و DTW بهترتیب، بیشترین دقت کلی را کسب کردند. همچنین، این دو روش به لطف کمترین انحراف معیار درمقایسه با سایر روشها ثبات عملکردی بیشتری داشتند.
درمقابل، روش RoF کمترین دقت را نسبت به سایر روشها کسب کرده است؛ بهگونهای که این روش حتی در شناسایی محصولات صیفیجات و گوجهفرنگی نتواست به عملکرد مطلوب و اطمینانبخشی دست یابد (مقدارهای F-score آنها نامعلوم است). علاوه بر این، روش DT با ثبات کمتری نسبت به سایر روشها ظاهر شده است.
نکتۀ جالب دیگر دربارۀ روش SVM است که باوجود دقت کلی و ضریب کاپای بهنسبت خوب، مشابه روش RoF در شناسایی محصولات صیفیجات و گوجهفرنگی عملکرد مناسبی ندارد. به عبارتی دیگر، این دو روش در شناسایی این دسته از محصولات با چالش کارایی و اطمینانپذیری مواجه شدند.
درمقابل، دو روش RF و DTW توانستهاند محصولات گوجهفرنگی را با دقت بهنسبت خوبی تشخیص دهند؛ با این حال این دو روش در تشخیص صیفیجات نیز دقت مطلوبی کسب نکردهاند. این نتایج نشان میدهد که استفاده از شاخص NDVI برای شناسایی محصولات کشاورزی بهتنهایی ممکن است کافی نباشد؛ بنابراین استفاده از شاخصهای دیگر طیفی نیز لازم است.
یک نکتۀ مهم دیگر که از جدول 5 بهواضحی پدیدار میشود، عدم دستیابی هیچ یک از روشها به دقت استاندارد 85% در شناسایی محصولات در منطقۀ مطالعهشده است (جدول 5). حتی دو روش RF و DTW که مقدارهای F-score بالاتری در بیشتر محصولات نسبت به سایر روشها داشتند، نتواستند به این دقت استاندارد برای محصولاتی همچون چغندرقند، گندم، ذرت، صیفیجات و گوجهفرنگی دست یابند. این نتایج نشان میدهد که برای ایجاد عملکرد مطلوب در طبقهبندی محصولات کشاورزی در این منطقه تنها تکیه به شاخص NDVI کافی نیست.
با الحاق سری زمانی باندهای طیفی به سری زمانی شاخص NDVI دقت کلی تمامی روشها بهبود یافت و در بازۀ 88% تا 96% قرار گرفت (افزایش 6% تا 12%). بیشترین افزایش دقت بهترتیب متعلق به روشهای DTW و RF بوده است که هریک با 12% و 10% افزایش مواجه شدند. همچنین، این دو روش ثبات بیشتری نسبت به دیگر روشها داشتند.
استفاده از باندهای طیفی بهویژه به روشهای DTW، RoF و SVM کمک مضاعفی در شناسایی برخی از محصولات مانند صیفیجات و گوجهفرنگی کرد که در مرحلۀ قبل به مشکل برخورده بودند؛ با این حال روشهایی مانند DT و RoF در شناسایی صیفیجات که با دادههای نامتوازن سروکار دارند، به کارایی مطلوبی دست نیافتند.
نکتۀ مهم دیگر این است که با افزودن باندهای طیفی دقت استاندارد 85% برای تمام محصولات منطقۀ مرودشت با دو روش DTW و RF به دست آمد. این دقت بالا میتواند بهعنوان یک نشانۀ مطمئنکننده از کارایی بالا و پذیرفتنی نقشههای نوع محصول کشاورزی حاصل از این دو الگوریتم (شکلهای 7 ت و 7 ث) در تشخیص و دستهبندی محصولات کشاورزی در این منطقه در سال زراعی 93-94 تلقی شود. این نتایج نهتنها بر اهمیت این الگوریتمها در شناسایی محصولات، به سازمانهای کشاورزی در برنامهریزی و مدیریت منابع نیز کمک میکند.
شکل 6: نقشههای نوع محصول کشاورزی منطقۀ مطالعاتی حاصل از تنها سری زمانی شاخص NDVI با استفاده از الگوریتمهای: الف) DT؛ ب) RoF؛ پ) SVM؛ ت) RF و ث) DTW (منبع: نگارنده، 1402)
Figure 6: Cropland maps of the study area obtained from the only time series of NDVI index using algorithms: a) DT; b) RoF; c) SVM; T) RF and C) DTW.
شکل 7: نقشههای نوع محصول کشاورزی منطقۀ مطالعاتی حاصل از سری زمانی باندهای 2 تا 5 لندست-8 به همراه شاخص NDVI با استفاده از الگوریتمهای: الف) DT؛ ب) RoF؛ پ) SVM؛ ت) RF و ث) DTW (منبع: نگارنده، 1402)
Figure 7: Cropland maps of the study area obtained from the time series of bands 2 to 5 of Landsat-8 along with the NDVI index using algorithms: a) DT; b) RoF; c) SVM; T) RF and C) DTW.
در مقایسۀ نتایج حاصل از روشهای این پژوهش با نتایج بهدستآمده در پژوهشهای گذشته (Belgiu & Csillik, 2018; Khosravi et al., 2018; Denize et al., 2019; Belgiu et al., 2020; Rafif et al., 2021; Singh et al., 2021; Seydi et al., 2022; Tuvdendorj et al., 2022; Yi et al., 2022; Bolaños et al., 2023; Gao et al., 2023; Mao et al., 2023; Mirzaei et al., 2023; Vilela et al., 2023; Xiao et al., 2023) این موضوع به وضوح مشخص بود که روشهایDTW و RF نهتنها در منطقۀ مرودشت در منطقههای دیگر با مشخصات جغرافیایی متفاوت نیز به دقت بالایی دست یافتند. این نتایج نشاندهندۀ قدرت تعمیمپذیری این الگوریتمها به منطقههای مختلف و قابلیت ارائۀ نتایج دقیق در شرایط مختلف جغرافیایی است. تفسیر این مقایسه نشان میدهد که الگوریتمهای استفادهشده در این پژوهش ازنظر دقت و کارایی سازگاری کاملی با نتایج پژوهشهای گذشته دارند. این امر نهتنها نتیجهگیریهای این پژوهش را تقویت میکند، به اعتبار و قابلیت اعتماد بیشتر به این الگوریتمها در سیاق گستردهتری اشاره دارد. همچنین، به ما امکان میدهد که با اطمینان بیشتری به نتایج بهدستآمده از این پژوهشها در کاربردهای عملی و برنامهریزی کشاورزی در منطقههای مختلف اعتماد کنیم.
نتایج برآورد میکند که در این سال زراعی، محصولات چغندرقند و گوجهفرنگی هریک بیش از 40 هزار هکتار سطح زیرکشت و پس از آن، جو، ذرت، صیفیجات و برنج نیز بیش از 15 هزار هکتار سطح زیرکشت در مرودشت داشته است. این آمار با آمارنامههای حاصل از جهاد کشاورزی در تطابق نسبی بود.
نتیجهگیری
در پژوهش حاضر نقشۀ نوع محصول کشاورزی دشت مرودشت در استان فارس در سال زراعی 93-94 با استفاده از تصاویر ماهوارهای لندست-8 تهیه و از سری زمانی 8 روزۀ باندهای طیفی 2 تا 5 و شاخص NDVI در تحلیل دادهها استفاده شد. در این منطقه محصولات زراعی متنوعی ازجمله یونجه، جو، گندم، ذرت، چغندرقند، گوجهفرنگی، برنج، و صیفیجات تولید میشد. برای طبقهبندی این مزارع از روشهای یادگیری ماشین کارا همچون الگوریتمهای درخت تصمیم (DT)، جنگل تصادفی (RF)، جنگل دورانی (RoF)، ماشین بردار پشتیبان (SVM) و آنالیز انحراف زمانی پویا (DTW) بهکار گرفته شد.
نتایج حاصل از پیادهسازی این الگوریتمها به شرح زیر است.
محدودیت و مشکلاتی که در پیادهسازی روش پژوهشاین مقاله وجود داشت عبارت بود از:
نتایج پژوهش حاضر نهتنها برای پژوهشهای آینده درزمینۀ تهیۀ نقشۀ نوع محصول کشاورزی، برای متخصصان، سیاستگذاران و تصمیمگیران درحوزۀ کشاورزی نیز اهمیت دارد. توصیه میشود تا از نتایج این مطالعه در فرآیندهای تصمیمگیری مرتبط با کشاورزی، همچون برنامهریزی منطقهای، مدیریت آب و پیشبینی تولید محصولات کشاورزی استفاده شود. علاوه بر این، برای پژوهشهای آینده بهبود دقت و قابلیت پیشبینی در تهیۀ نقشه نوع محصولات، توسعۀ رویکردهای تحلیل داده، استفاده از دادههای ماهوارههای نوری جدید لندست-9 و سنتینل-2، استفاده از دادههای ماهوارههای راداری رایگان مثل سنتینل-1 و ادغام این دادهها با یکدیگر پیشنهاد میشوددرنهایت، پژوهشهای بیشتر درزمینۀ بهینهسازی الگوریتمهای یادگیری ماشین همچون الگوریتم DTW براساس ویژگیهای خاص منطقههای جغرافیایی میتواند در توسعۀ روشهای کارآمدتر تأثیرگذار باشد.