random forest algorithm
در نشریات گروه منابع طبیعی-
نشریه تحقیقات منابع طبیعی تجدید شونده، سال چهاردهم شماره 2 (پیاپی 40، پاییز و زمستان 1402)، صص 87 -100
وقوع رخداد زمین لغزش در مناطق کوهستانی ممکن است به زیرساخت ها از جمله جاده ها آسیب جدی وارد کند، همچنین ممکن است به مرگ ومیر انسان ها منجر شود. هدف از انجام این مطالعه، پیش بینی مکانی خطر زمین لغزش با استفاده از الگوریتم های پیشرفته داده کاوی در شهرستان سروآباد (استان...) است. در این مطالعه، پتانسیل یابی خطر زمین لغزش با استفاده از دو الگوریتم پیشرفته داده کاوی شامل جنگل تصادفی (RF) و درخت تصمیم (DT) انجام شد. ابتدا، فایل نقطه ای 166 زمین لغزش رخ داده در شهرستان سروآباد به عنوان نقشه موجودی زمین لغزش در نظر گرفته شد. به منظور تهیه مدل و اعتبار سنجی آن، نقاط زمین لغزش به دو بخش داده های آموزشی (70 درصد) و داده های اعتبارسنجی (30 درصد) تقسیم می شوند. در مجموع 16 پارامتر شامل شیب، جهت جغرافیایی، ارتفاع از سطح دریا، فاصله از آبراهه، فاصله از جاده، تراکم رودخانه، فاصله از گسل، تراکم گسل، تراکم جاده، بارندگی، کاربری و پوشش اراضی، شاخص NDVI، لیتولوژی، زمین لرزه، شاخص توان آبراهه (SPI) و شاخص رطوبت توپوگرافی (TWI) به منظور پهنه بندی خطر زمین لغزش استفاده شدند. در نهایت، عملکرد مدل ها با استفاده از منحنی مشخصه عملکرد سیستم (ROC) مورد بررسی قرار گرفت. نتایج تحلیل منحنی ویژگی عملگر نسبی نشان داد که مدل های درخت تصمیم و جنگل تصادفی به ترتیب دارای مقدار AUC برابر 942/0 و 951/0 می باشند؛ بنابراین مدل جنگل تصادفی نسبت به درخت تصمیم دارای بالاترین مقدار AUC بوده و بهترین مدل برای پیش بینی خطر زمین لغزش در آینده در منطقه مورد مطالعه می باشد. نقشه های پتانسیل وقوع زمین لغزش، ابزارهای کارآمدی بوده؛ به طوری که می توان آن ها را برای مدیریت زیست محیطی، برنامه ریزی کاربری زمین و توسعه زیرساخت ها مورد استفاده قرار داد.
کلید واژگان: مخاطرات طبیعی، الگوریتم جنگل تصادفی، الگوریتم درخت تصمیم، استان کردستانThe occurrence of landslides in mountainous areas may cause serious damage to road infrastructure, and may also lead to human deaths. Therefore, the purpose of this study is to landslide susceptibility mapping using advanced machine learning algorithms in Sarovabad city. In this study, landslide susceptibility was determined using two advanced data mining algorithms including random forest (RF) and decision tree (DT). First, the point file of 166 landslides occurred in Sarovabad city was considered as the landslide inventory map. The landslide points are divided into training data (70%) and validation data (30%). A total of 16 parameters including slope, aspect, elevation, river proximity, road proximity, river density, fault proximity, fault density, road density, precipitation, land use, NDVI, lithology, earthquake, stream power index (SPI) and topographic wetness index (TWI) were used in order to landslide susceptibility mapping. Finally, the performance of the models was evaluated using the ROC curve. The results of the ROC showed that the decision tree and random forest models have AUC values of 0.942 and 0.951, respectively. Therefore, the random forest model has the highest AUC value compared to the decision tree and was the best model for predicting the risk of landslides in the future in the study area. Landslide potential maps are efficient tools; so that they can be used for environmental management, land use planning and infrastructure development.
Keywords: Decision tree algorithm, Kurdistan province, Landslide, Natural hazards, Random forest algorithm -
رشد جمعیت همراه با توسعه صنعت و کشاورزی، افزایش مصرف آب را به دنبال داشته است. محدودیت منابع آب های سطحی، باعث برداشت بیش ازحد از سفره های آب زیرزمینی گردیده و پیامدهای جبران ناپذیری را بر منابع آب و محیط زیست کشور وارد کرده است؛ از جمله پدیده فرونشست، که اغلب دشت های کشور را فراگرفته است. هدف این پژوهش، شناسایی عوامل موثر و مناطق در معرض ریسک فرونشست در روستای فدافن کاشمر است. جهت پهنه بندی ریسک، طی سال 1398،عوامل سنگ شناسی، کاربری اراضی، خاک شناسی، میزان برداشت از آبخوان، فاصله از آبراهه، گسل، چاه های بهره برداری، چشمه و قنات ها و نیز عوامل ژیومورفولوژی شامل شیب، جهت و ارتفاع بررسی و هر یک از عوامل، تبدیل به یک لایه اطلاعاتی شد و با الگوریتم جنگل تصادفی در نرم افزار R، مدل سازی و ارزیابی انجام گردید. سپس جهت تعیین نواحی مستعد فرونشست، نقشه های پهنه بندی ریسک در پنج کلاس با دو روش ارزش اطلاعاتی و تراکم سطح در محیط ArcGIS استخراج شدند. نتایج نشان داد در روش های تراکم سطح و ارزش اطلاعات به ترتیب 01/97 و 04/91 درصد فرونشست ها درکلاس خطر خیلی زیاد و زیاد قرار گرفته است. بنابراین هر دو روش در پهنه بندی مناطق در معرض ریسک، موفق عمل کرده اند و عوامل برداشت از آبخوان و کاربری اراضی بیشترین اهمیت در وقوع فرونشست را دارند. همچنین براساس منحنی ROC، الگوریتم جنگل تصادفی با دقت بسیار بالا (93 درصد)، نتایج خوبی در اولویت بندی و اهمیت عوامل موثر در فرونشست ارایه کرده است و بخش جنوبی منطقه با کاربری مرتع، بیشترین ریسک و زراعت آبی در منطقه، کمترین ریسک در توسعه مکانی فرونشست ها را دارد.در نتیجه مدیریت تغذیه آبخوان با پخش سیلاب ها و کاهش استحصال آب در جنوب منطقه می تواند در کاهش ریسک وقوع و توسعه فرونشست ها موثر و کاربردی باشد.
کلید واژگان: آبخوان، الگوریتم جنگل تصادفی، حساسیت به فرونشست، سیستم اطلاعات جغرافیایی، مدل سازیPopulation growth, along with the development of industry and agriculture, has led to an increase in water consumption. Limited surface water resources have led to over-harvesting of groundwater aquifers and has had irreparable consequences for the country's water resources and environment, including the subsidence phenomenon, which has covered most of the country's plains. The present research aims to identify the effective factors and areas at risk of subsidence in Fadafan village of Kashmar. For risk zoning, during 2019, the lithology, land use, Petrology, aquifer Extraction rate, Distance from the stream, Fault, exploitation wells, springs and aqueducts factors as well as geomorphological factors including slope, direction and height studied and each factor turned into an information layer, then modeling and evaluation were performed using random forest algorithm in R software. Then, to determine the areas prone to subsidence, risk zoning maps in five classes were extracted using two methods of information value and area density in ArcGIS environment. The results showed that in the methods of area density and information value, 97.01 and 91.04% of subsidence were in the very- high and high-risk class, respectively. Therefore, both methods have been successful in risk zoning. Also, the aquifer extraction and land use factors are most important in subsidence. Also based on the ROC curve, random forest algorithm with very high accuracy (93%) has provided good results in prioritizing and the importance of effective factors in subsidence. The southern part of the region with rangeland use, has the highest and irrigated agriculture in the region has the lowest risk in the spatial development of land subsidence.As a result, aquifer recharge management by spreading floods and reducing water extraction in the southern part of the region can be effective and practical in reducing the risk of occurrence and development of subsidence.
Keywords: aquifer, Random Forest Algorithm, Geographic information system, Modeling, Susceptibility to subsidence -
یکی از الزامات برای رسیدن به کارایی و حداکثر بهره وری، پایش و بررسی مداوم محصولات باغی و کشاورزی است. اما روش های سنتی پایش باغ ها بسیار وقت گیر، پرکار و پرهزینه است. هواپیماهای بدون سرنشین (پهپادها) با استفاده از تصویربرداری رنگی واقعی (قرمز/ سبز/آبی) ، ممکن است یک گزینه اقتصادی مناسب برای تشخیص تنش و بیماری ها باشند. این تحقیق با دو هدف متفاوت، توانایی داده های پهپاد در 1) آشکارسازی درختان و 2) ارزیابی سلامت مرکبات انجام گرفته است. به همین منظور تصویربرداری و برداشت زمینی درختان در تیر ماه 1398 انجام شد. پس از پردازش تصاویر و تولید مدل ارتفاع تاج در پنج اندازه پیکسل مختلف، آشکارسازی درختان پرتقال با استفاده از الگوریتم رشد ناحیه ای انجام شد. مدل ارتفاع تاج با اندازه پیکسل 50 سانتی متر، بالاترین مقدار صحت کلی (63/0) را ارائه داد. در گام بعدی، اورتوموزاییک جنگل مورد مطالعه با انداره پیکسل دو و نیم سانتی متر با استفاده از الگوریتم ساختار حرکت مبنا تولید شد. سپس باندها و شاخص های پوشش گیاهی به دست آمده از اورتوموزاییک و فضای رنگی به عنوان داده ورودی در الگوریتم طبقه بندی جنگل تصادفی مورد استفاده قرار گرفت. نتایج طبقه بندی تشخیص درختان دارای تنش را با صحت کلی 69 درصد نشان داد که کارآیی پهپادها را برای آگاهی دادن به ذینفعان نشان می دهد.کلید واژگان: پهپاد، فضای رنگی، استرس، الگوریتم جنگل تصادفی، الگوریتم رشد ناحیه ایOne of the requirements for achieving efficiency and maximum productivity is continuous monitoring and identifying of horticultural and agricultural products. Traditional plant monitoring and evaluation methods are time-consuming, labor-intensive, and costly. Unmanned aerial vehicles (UAVs) using real color imaging (red/green/blue) is a game-changer in horticultural and agriculture and an economically viable option for recognizing stress and disease. In this paper, the ability of UAV images was evaluated for identifying citrus trees and determining their health using a simple method. For this purpose, In June 2019, the study area was photographed and surveyed. The region growing algorithm was tested for a series of CHMs generated from point clouds, across a range of spatial resolutions. The highest overall accuracy for the individual tree crown delineation was achieved for a spatial resolution of 50 cm (F-score =0.63). In the next step, the orthomosaic was generated with a pixel size of 2.5 cm was generated by structure from motion algorithm. Then vegetation indices and bands obtained from orthomosaic and CIE L* a* b* color space were used as input data in a random forest classification algorithm. We classified the trees into 2 classes: health trees and unhealthy trees; then the random forest algorithm was applied using R software. The classification accuracy for identified trees was performed using 10-fold cross-validation. The classification resulted in overall accuracies of 69%; that display the effectiveness of UAVs to inform stakeholders.Keywords: UAV, Color Space, Stress, Random Forest Algorithm, Region-Growing Algorithm
-
بررسی قابلیت تصاویر ماهواره ای Sentinel-2A در بستر Google Earth Engine برای تهیه نقشه پوشش زمیننشریه تحقیقات منابع طبیعی تجدید شونده، سال یازدهم شماره 2 (پیاپی 34، پاییز و زمستان 1399)، صص 89 -99نقشه پوشش زمین، پراکنش مکانی چشم اندازهای مختلف کشاورزی، منابع طبیعی، آب و منابع انسان ساخت را نشان می دهد و به عنوان یک ابزار مهم برای مدیریت و کاهش ریسک در مسایل چالش برانگیز مانند خشکسالی و اثرات آن، امنیت غذایی، کنترل سیل و برنامه ریزی شهری ارزشمند است. به منظور غلبه بر محدودیت های کار میدانی در تهیه نقشه پوشش زمین، استفاده از تصاویر ماهواره ای به دلیل دارا بودن داده های وسیع، چندطیفی و به روز مناسب به نظر می رسد. در منطقه مورد مطالعه، وجود پدیده های ناهمگن مکانی نیز طبقه بندی پدیده ها را با مشکل مواجه می سازد. هدف اصلی این پژوهش، تهیه نقشه پوشش زمین با وضوح بالا با کاربرد تصاویر Sentinel-2A در بستر Google Earth Engine است. در این رابطه، سه الگوریتم طبقه بندی جنگل تصادفی، ماشین بردار پشتیبان و درخت تصمیم مورد ارزیابی و مقایسه قرار گرفت. شاخص های متعدد با استفاده از روش های تبدیل و نسبت گیری طیفی تهیه شد. صحت نقشه های حاصل از طبقه بندی در مقایسه با نقشه های مرجع زمینی ارزیابی شد. در رابطه با ارزیابی تک باندها، بهترین صحت کلی برابر 49 درصد با کاربرد شاخص CVI به دست آمد. بهترین صحت کلی و ضریب کاپا به ترتیب برابر 86 درصد و 0/82 توسط الگوریتم جنگل تصادفی حاصل شد. بنابراین ضمن تاکید بر مزایای GEE شامل دسترسی آسان به داده ها و قابلیت پردازش و مقایسه سریع آنها، می توان ادعا نمود که تصاویر Sentinel-2A برای تهیه نقشه پوشش زمین از لحاظ هزینه، زمان و دقت، کارآیی بالایی دارد و این نقشه می تواند برای مدیریت و برنامه ریزی منابع مختلف طبیعی و انسان ساخت در راستای توسعه پایدار بسیار مفید واقع گردد.کلید واژگان: الگوریتم جنگل تصادفی، سنجش ازدور، شاخص های گیاهی، ضریب کاپاInvestigation on land cover mapping using Sentinel-2A images in the Google Earth Engine PlatformLand cover map show the spatial distribution of different landscapes such as agricultue, natural resources, water and man-made area. It is a valuable tool to managing and reducing risk in challenging issues such as drought and its effects, food security, flood control, and urban planning. In order to overcome the limitations of field work in the mapping of land cover, the use of satellite images due to the wide, multispectral and update data seems to be suitable. In the study area, the spatially heterogeneous landscapes also makes it difficult to classify features. Therefore, the main purpose of the study is accurate and high resolution land cover mapping using Sentinel-2A images in the Google Earth Engine platform. In this regard, three classification algorithms including RF, SVM and CART were evaluated and compared. Various indices were prepared using ratioing and transformation methods. The accuracy of the classifications was evaluated in comparison with ground reference data. Individual bands evaluation showed that the best overall accuracy (49%) was obtained using the CVI index.The best overall accuracy and kappa coefficient of 86% and 0.82 were obtained by RF algorithm. Therefore, while pointing to the advantages of the GEE including easily accessible data and the ability to process and quickly compare of data, it can be claimed that Sentinel-2A images for land cover mapping in terms of cost, time and accuracy, have high efficiency and the map can be very useful for the management and decision making in different natural and man-made resources for the successful implementation of sustainable development.Keywords: Kappa coefficient, Random Forest Algorithm, Remote sensing, vegetation indices
-
نشریه سنجش از دور و سامانه اطلاعات جغرافیایی در منابع طبیعی، سال دهم شماره 3 (پاییز 1398)، صص 93 -105وقوع پدیده فرونشست زمین و خطرات احتمالی آن در حوزه آبریز دشت تسوج استان آذربایجان شرقی به علت بروز بحران آب و دوره خشک سالی موجود در منطقه طی سالیان اخیر افزایش چشمگیری داشته است. به منظور برنامه ریزی برای کاهش خطرات ناشی از فرونشست زمین، شناسایی مناطق پرخطر و مستعد وقوع این پدیده ضروری است. در این مطالعه به مدل سازی خطر وقوع فرونشست زمین در بستر الگوریتم جنگل تصادفی با بهره گیری از نقاط فرونشست های ثبت شده و یازده متغیر محیطی موثر بر وقوع فرونشست (ارتفاع، شیب، جهت، شاخص رطوبت توپوگرافی، فاصله از آبراهه، تراکم زهکشی، فاصله از گسل، سنگ شناسی، کاربری اراضی، سطح آب زیرزمینی و افت سطح آب زیرزمینی) پرداخته شده است. قابلیت پیش بینی و صحت نتایج مدل با استفاده از منحنی تشخیص عملکرد نسبی (ROC) و مساحت سطح زیر این منحنی (AUC) مورد ارزیابی قرارگرفته است. ارزیابی نتایج مدل نشان دهنده دقت بسیار مناسب مدل 0.86 است. بر اساس نتایج حاصل از مدل با روش میانگین کاهشی دقت، متغیر های سطح آب زیرزمینی، فاصله از گسل و افت سطح آب زیرزمینی تاثیر بیشتری بر پتانسیل وقوع فرونشست در منطقه موردمطالعه داشته اند. همچنین مطابق نتایج حاصل به ترتیب 18 و 11 درصد از مساحت منطقه موردمطالعه در کلاس پرخطر و بسیار پرخطر ازنظر وقوع فرونشست قرارگرفته که حاکی از شرایط خطرناک منطقه است. استفاده از نتایج حاصل از این تحقیق توسط مدیران و برنامه ریزان نقش موثری در کاهش خطرات ناشی از فرونشست زمین خواهد داشت، همچنین ارائه و اجرای راهکار های عملیاتی را تسهیل می کند.کلید واژگان: فرونشست زمین، سطح آب زیرزمینی، الگوریتم جنگل تصادفی، دشت تسوجLand subsidence occurrence in the Tasuj plane might become more frequent and hazardous in the near future due to its relationship with the water crisis and drought periods. In order to mitigate the damage caused by land subsidence, it is necessary to determine the susceptible or prone areas. The purpose of this study is to produce land subsidence susceptibility map based on the random forest approach to land subsidence occurrence data and eleven environmental variables that have significant influence on land subsidence occurrences (altitude, slope, aspect, distance to drainage line, drainage density, distance from the fault, topographic wetness index, land cover, lithology, groundwater level and decline in groundwater level) were used as inputs of the random forest model. The random forest approach was applied to produce the land subsidence susceptibility map. The performance of the model was assessed using the receiver operating characteristics (ROC) curve and the area under the curve (AUC). The model results indicate the accuracy of 0.86. Based on the result of the mean decrease accuracy method, the most important conditioning factors were groundwater level, distance from the fault, and a decline in groundwater level, respectively. According to the result, about 18% and 11% of the study area was located within high to very high susceptibility classes. The result of this study can be used by stakeholders and local authorities to mitigate related hazards of land subsidence occurrences in the study area.Keywords: Land subsidence, Groundwater level, Random forest algorithm, Tasuj plane
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.