pixel-based classification algorithms
در نشریات گروه آبخیزداری، بیابان، محیط زیست، مرتع-
مقدمه
سنجش از راه دور به ابزاری ارزشمند جهت تهیه داده های یکپارچه مکانی در مورد پوشش و کاربری زمین در مقیاس های زمانی و مکانی تبدیل شده است. یکی از چالش های اصلی در نقشه برداری چند-زمانه پوشش و کاربری زمین، در دسترس بودن و یکپارچگی داده های آموزشی برای الگوریتم های طبقه بندی نظارت شده است. جمع آوری نمونه های آموزشی برای هر کلاس پوشش و کاربری زمین در طول دوره های زمانی مختلف می تواند زمان بر و از لحاظ میدانی به ویژه در محیط های در حال تغییر سریع، چالش برانگیز باشد. این مسئله همچنین با امکان تغییرات طیفی و فنولوژیکی در ویژگی های پوشش زمین در طول زمان تشدید می شود و از این حیث می تواند قابلیت انتقال نمونه های آموزشی را کاهش دهد. مفهوم «مهاجرت یا انتقال» نمونه های آموزشی از یک سال مرجع به سال های هدف (مقصد) به عنوان راهی برای غلبه بر محدودیت داده های آموزشی مورد بررسی قرار گرفته است. در این میان، استفاده از سامانه گوگل ارت انجین (GEE) نقشه برداری چندزمانه پوشش و کاربری زمین را تسهیل کرده است. توانایی GEE در ادغام منابع داده مختلف، از جمله تصاویر Sentinel-2 و طیف گسترده ای از شاخص های طیفی، به محققان امکان توسعه کاربست طبقه بندی پوشش و کاربری زمین قوی و مقیاس پذیر را داده است. رصد تغییرات در استفاده و پوشش زمین در طول زمان برای درک و مدیریت محیط زیست حیاتی است. با این حال، هنگامی که محدودیت داده های آموزشی برای دوره های زمانی مختلف وجود داشته باشد، می تواند چالش برانگیز باشد. پژوهش حاضر رویکردی نوآورانه برای طبقه بندی تصاویر ماهواره ای Sentinel-2 در سال های مختلف با استفاده از مجموعه نمونه های آموزشی مرجع است.
مواد و روش هادر پژوهش حاضر، کاربست نوآورانه ای با استفاده از نمونه های آموزشی متغیر از یک سال مرجع (تصاویر Sentinal-2 سال 2019)، همراه با باندهای تصاویر Sentinel-2 و شاخص های طیفی، برای طبقه بندی پوشش و کاربری زمین در منطقه مانگرو خوران به عنوان منطقه ای پویا و مهم اکولوژیکی مورد بررسی قرار گرفت. در این راستا، کاربرد الگوریتم های یادگیری ماشین در چارچوب سامانه GEE برای دستیابی به دقت طبقه بندی بالا و پایش تغییرات پوشش زمین در طول زمان بررسی شد. در این پژوهش، تصاویر ماهواره ای Sentinel-2 پوشش دهنده منطقه مورد مطالعه برای سال های هدف 2022 و 2024 و سال مرجع 2019 در GEE فراخوانی شدند. سپس جمع آوری داده های حقیقت زمینی شامل موقعیت و طبقه بندی انواع مختلف پوشش زمین برای سال مرجع با استفاده از نقشه کاربری اراضی سازمان فضایی اروپا جمع آوری شد. در ادامه، داده های حقیقت زمینی با کیفیت بالا و نمونه های تصویری متناظر آن ها از سال مرجع (2019) به عنوان نمونه های آموزشی به تصاویر سال هدف با الگوریتم فاصله زاویه طیفی (SAD) منتقل شدند. همچنین الگوریتم های طبقه بندی RF، GBT و CART برای طبقه بندی تصاویر سال هدف با استفاده از نمونه های آموزشی متغیر به کار گرفته شدند. تصاویر طبقه بندی شده با استفاده از معیارهای مختلف صحت، مانند دقت کلی، ضریب کاپا، دقت تولیدکننده و دقت کاربر ارزیابی و خطای گماشته شده و حذف شده ارزیابی شدند. در نهایت اهمیت باندهای طیفی مختلف Sentinel-2 و شاخص های طیفی در فرآیند طبقه بندی تجزیه و تحلیل شد تا مناسب ترین ویژگی ها برای تفکیک پدیده های مختلف منطقه مورد مطالعه شناسایی شوند.
نتایج و بحث:
نتایج پژوهش حاضر نشان داد از میان الگوریتم های طبقه بندی، بیشترین میزان دقت برای صحت کلی و کاپا تصاویر طبقه بندی شده سال 2024 و 2022، مربوط به طبقه بندی جنگل تصادفی به ترتیب با دقت 9104/0 و 8742/0، 8955/0 و 8570/0 بوده است. همچنین نتایج نشان داد مساحت جنگل های حرا در طول دوره بررسی از 74/7530 هکتار به 51/6546 تنزل داشته است، چیزی در حدود 23/984 هکتار کاهش و به عبارتی 164 هکتار کاهش سطح جنگل های حرا به ازای هر سال. مساحت پهنه های مسکونی و عرصه های ساخت و ساز از 5252/72 هکتار در سال 2019 به 4815/96 در سال 2024 رسیده است که رشد شتابان این کاربری در دو سال آخر دیده می شود. نتیجه اشتراکات و جمع بندی روش های مختلف طبقه بندی در سنوات مختلف و اهمیت نسبی باندها و شاخص ها نشان داد که شاخص های EMVI و mNDWI بدلیل فراگیری پدیده های جنگل های مانگرو و نیز پهنه های آبی در محدوده مورد مطالعه غالبیت بیشتری از خود نشان داده اند. لذا در ترکیبات باندی جهت تفکیک پدیده های مختلف استفاده از باندهای سبز، قرمز، مادون قرمز نزدیک و از میان شاخص ها، شاخص مانگرو و نیز شاخص بهینه پهنه های آبی برای محدوده مطالعاتی مناسب ترین تشخیص داده شدند و برای عرصه های مشابه در جنوب ایران و محدوده های مانگرو پیشنهاد می شوند. در پژوهش حاضر با انتقال نقاط حقیقت زمینی سال منبع به تصاویر متناظر آن ها به عنوان نمونه های آموزشی در تصاویر سال هدف، از یک کاربست ساده و موثر برای طبقه بندی تصاویر ماهواره ای در پلتفرم GEE استفاده شد که قابلیت تسری به سایر مناطق را دارد.
نتیجه گیریبه طور کلی، پژوهش حاضر پتانسیل استفاده از نمونه های آموزشی متغیر و الگوریتم های پیشرفته یادگیری ماشین مانند جنگل تصادفی، درخت گرادیان تقویت شده و درخت رگرسیون و طبقه بندی و کاربرد شاخص های طیفی به عنوان داده های کمکی را برای طبقه بندی دقیق تصاویر ماهواره ای چند-زمانه نشان می دهد. توسعه ابزارهای مکانی، از جمله پلتفرم آنلاین GEE ، برای مدیریت به روز کاربری های زمین، از جمله مناطق تالابی و مانگرو، ضروری است. در پزوهش حاضر، نمونه های آموزشی با کیفیت بالا از سال مرجع به سال هدف (مهاجرت نمونه های آموزشی از زمان مشخص به سایر زمان ها) منتقل شدند و در انتها دقت طبقه بندی بالایی با استفاده از الگوریتم طبقه بندی جنگل تصادفی نسبت به سایر روش ها مانند رگرسیون تقویت شده یا درختان رگرسیون و طبقه بندی به دست آمد. این روش راه حل بالقوه ای در مطالعات چند-زمانه کاربری زمین و کمبود یا ناکافی بودن نمونه های آموزشی در سیستم GEE است. در این راستا پیشنهاد می شود که در مطالعات آینده، از ترکیبی از روش های فاصله اقلیدسی (ED)، فاصله زاویه طیفی (SAD) و خوشه بندی K-means برای تولید نمونه های آموزشی متغیر استفاده شود و نتایج طبقه بندی تصویر با استفاده از این روش ها مقایسه و تحلیل شود. این رویکرد راه حل امیدوارکننده ای برای تولید نقشه های روزآمد کاربری/ پوشش زمین، حتی در محیط های چالش برانگیز با داده های آموزشی محدود، ارائه می دهد. نتایج به دست آمده از این مطالعه می تواند جهت دهی مطالعات آتی را برای پایش پوشش اراضی، مدیریت و حفاظت موثر از منابع طبیعی ارزشمند، مانند جنگل های مانگرو را در سایر مناطق، هدایت کند.
کلید واژگان: الگوریتم های طبقه بندی پیکسل پایه، اهمیت نسبی، فاصله زاویه طیفی، کاربری اراضی، مانگرو، نمونه های آموزشی متغیرIranian Journal of Watershed Management Science and Engineering, Volume:18 Issue: 67, 2025, PP 1 -15IntroductionRemote sensing has become a valuable tool for acquiring integrated spatial data regarding land cover and land use across various temporal and spatial scales. One of the primary challenges in multi-temporal land cover and land use mapping is the availability and integrity of training data for supervised classification algorithms. Collecting training samples for each class of land cover and land use over different time periods can be time-consuming and, particularly in rapidly changing environments, fieldwork can be challenging. This issue is further exacerbated by the potential spectral and phenological changes in land cover features over time, which can diminish the transferability of training samples. The concept of "migration" or "transfer" of training samples from a reference year to target years has been explored as a means to overcome the limitations of training data. In this context, the use of Google Earth Engine (GEE) has facilitated multi-temporal land cover and land use mapping. GEE's ability to integrate diverse data sources, including Sentinel-2 imagery and a wide range of spectral indices, enables researchers to develop robust and scalable applications for land cover and land use classification. Monitoring changes in land use and cover over time is crucial for understanding and managing the environment. However, when there are limitations in training data for different time periods, this can pose significant challenges. This study presents an innovative approach to classify Sentinel-2 satellite images from different years using a set of reference training samples.
Materials and MethodsIn this study, an innovative application was explored using migrated training samples from a reference year (Sentinel-2 imagery from 2019), along with bands from Sentinel-2 images and spectral indices, to classify land cover and land use in the dynamic and ecologically significant mangrove region (Khoran Protected Area). The use of machine learning algorithms within the Google Earth Engine (GEE) framework was examined to achieve high classification accuracy and monitor land cover changes over time. Satellite images from Sentinel-2 covering the study area for the target years 2022 and 2024, as well as the reference year 2019, were retrieved in GEE. Ground truth data, including the location and classification of various land cover types for the reference year, were collected using the European Space Agency's land use maps. Subsequently, high-quality ground truth data and their corresponding image samples from the reference year (2019) were transferred to the target year images using the Spectral Angle Distance (SAD) algorithm. Classification algorithms such as Random Forest (RF), Gradient Boosting Trees (GBT), and Classification and Regression Trees (CART) were employed to classify the target year images using the variable training samples. The classified images were evaluated using various accuracy metrics, including overall accuracy, Kappa coefficient, producer accuracy, user accuracy, as well as commission and omission errors. Finally, the importance of different spectral bands from Sentinel-2 and spectral indices in the classification process was analyzed to identify the most suitable features for distinguishing various phenomena in the study area.
Results and DiscussionThe results of this study indicated that among the classification algorithms, the highest accuracy for overall accuracy and Kappa coefficient in the classified images for 2024 and 2022 was achieved using the Random Forest classification, with accuracies of 0.9104 and 0.8742, and Kappa values of 0.8955 and 0.8570, respectively. Additionally, the findings revealed that the area of mangrove forests decreased from 7530.74 hectares to 6546.51 hectares during the study period, representing a reduction of approximately 984.23 hectares, or about 164 hectares per year.The area of residential and construction zones increased from 72.52 hectares in 2019 to 96.48 hectares in 2024, indicating rapid growth in these land uses over the last two years. The synthesis and summary of various classification methods across different years highlighted the relative importance of bands and indices. Specifically, the EMVI and mNDWI indices demonstrated greater dominance due to their effectiveness in capturing the phenomena of mangrove forests and aquatic areas within the study region. Consequently, for the band combinations aimed at distinguishing various phenomena, the use of green, red, and near-infrared bands, along with the mangrove index and optimized water body index, were identified as the most suitable for the study area. These findings are recommended for similar areas in southern Iran and other mangrove regions. This research employed a simple and effective application by transferring ground truth points from the reference year to their corresponding images as training samples for the target year images, utilizing the Google Earth Engine platform. This approach holds the potential for extension to other regions.
ConclusionIn summary, this study demonstrates the potential of using migrated training samples and advanced machine learning algorithms such as Random Forest, Gradient Boosted Trees, and Classification and Regression Trees, along with spectral indices as auxiliary data, for the accurate classification of multi-temporal satellite imagery. The development of spatial tools, including the online Google Earth Engine (GEE) platform, is essential for the up-to-date management of land uses, particularly in wetland and mangrove areas. In this research, high-quality training samples were successfully migrated from the reference year to the target year, resulting in high classification accuracy using the Random Forest classification algorithm compared to other methods such as boosted regression or regression and classification trees. This method offers a viable solution in multi-temporal land use studies, especially in cases of insufficient or inadequate training samples within the GEE system. For future studies, it is recommended to employ a combination of Euclidean Distance (ED), Spectral Angle Distance (SAD), and K-means clustering for generating variable training samples, and to compare and analyze the classification results obtained through these methods. This approach presents a promising solution for producing up-to-date land use/land cover maps, even in challenging environments with limited training data. The findings of this study can guide future research aimed at monitoring land cover, managing, and effectively protecting valuable natural resources, such as mangrove forests, in other regions.
Keywords: Pixel-Based Classification Algorithms, Relative Importance, Spectral Angle Distance, Land Use, Mangrove, Migrated Training Samples
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.