classification algorithm
در نشریات گروه کشاورزی-
یکی از فاکتورهای مهم در مطالعات منابع طبیعی و محیط زیست شناخت کاربری ها و تعیین سطح گسترش آنها در منطقه است. داده های ماهواره ای یکی از سریعترین و کم هزینه ترین روش های تهیه نقشه کاربری اراضی است. پژوهش حاضر، با هدف تعیین بهترین الگوریتم طبقه بندی تصاویر ماهواره ای TM شهریور ماه سال 1390، از بین 6 روش طبقه بندی نظارت شده شامل حداکثر احتمال1، متوازی السطوح2، حداقل فاصله از میانگین3، مستطیل های موازی4، ماشین بردار پشتیبان5 و کدهای دو تایی6 به منظور استخراج نقشه کاربری اراضی حوزه آبخیززنوز چای انجام گرفت. برای کاربری های مرتع، بایر و رها شده و باغات بطور جداگانه 30 نمونه تعلیمی و برای کاربری بدلند 45 نمونه تعلیمی با استفاده از نقاط کنترل زمینی تهیه شد. نتایج به دست آمده با استفاده از معیار صحت کلی، ضریب کاپا، صحت تولیدکننده و صحت کاربر برای تصویر ماهواره ای طبقه بندی شده منطقه، مورد ارزیابی قرار گرفتند. بررسی صحت طبقه بندی تصویر TM، نشان داد که الگوریتم حداکثر احتمال صحت کلی (73/84 درصد) و ضریب کاپای 0/65، از کارایی بالاتری نسبت به دیگر روش هادر طبقه بندی تصویر در چهار کلاس کاربری اراضی برخوردار است. نتایج به دست آمده نشان داد که استفاده از روش حداکثر احتمال به منظور تهیه نقشه کاربری اراضی نسبت به روش های دیگر قابلیت بیشتری دارد. از نتایج پژوهش حاضر می توان برای تهیه نقشه کاربری اراضی با دقت بالاتر با استفاده از روش حداکثر احتمال در کارهای ارزیابی محیط زیست و منابع طبیعی در مناطق با شرایط مشابه استفاده نمود.
کلید واژگان: الگوریتم طبقه بندی، حوزه آبخیززنوز چای، سنجنده TM، کاربری اراضیLand use identification and determination of their spreading level in the region is one of important factors in the natural resources and environmental studies. Preparing land use map from satellite data is one of the fastest and most cost-effective methods. This study’s aim is to determine the best algorithm for TM satellite images classification between 6 supervised classification methods including maximum likelihood, mahalanovis distance, minimum distance, parallel pipe, support vector machines and binary codes to extract land use map of Zenouz Chai watershed.For grassland, wasteland and abandoned and agricultural land use, 30 training samples and for badland land use 45 training samples were prepared separately using ground control points. Results were assessed for satellite image classified using by overall accuracy index, kappa coefficient, producer accuracy and user accuracy. Investigation of TM image classification accuracies showed that the maximum likelihood algorithm with overall accuracy coefficient (84/73 %) and kappa coefficient 65/0, have the higher efficiency for image classification into four land use classes. The results showed that maximum likelihood method has more capabilities than other methods for land use map preparing. Therefore, the results of this study can be used to provide land use maps with higher accuracy using maximum likelihood method to assessing the environment and natural resources works in the areas with the same situations.
Keywords: Classification algorithm, Land use, TMsensor, Zenouz Chai watershed -
گسل از فرآیندهای اصلی زمین ریختی است که با پدیده هایی هم چون زمین لرزه ارتباط دارد. لذا آگاهی از اثر عوامل محیطی در بروز گسل و شناخت مناطق پرخطر اهمیت زیادی دارد که این اهداف در پژوهش حاضر بررسی شده اند. عرصه پژوهش حوضه قره قوم است که پس از تعیین گسل های آن، متغیرهای ارتفاع، شیب، جهت، اقلیم، کاربری، ژیومورفولوژی، سنگ شناسی، فرسایش، بارش، پهنه های سیلابی، خاک شناسی، شاخص های قدرت جریان، ناهمواری زمین و فاصله از جاده، آبراهه، تاقدیس و ناودیس آن استخراج گردید. سپس الگوریتم های داده کاوی شامل درخت تصمیم، جنگل تصادفی، تجمیعی بوستینگ، ماشین بردارپشتیبان، رگرسیون لوجیستیک و شبکه عصبی در نرم افزار R جهت شناسایی ارزش متغیرها و روش های آماری دومتغیره شامل ارزش اطلاعات و تراکم سطح برای شناسایی ارزش کلاس های هر متغیر در وقوع گسل برازش شد. ارزیابی دقت طبقه بندی الگوریتم ها با منحنی ROC نشان داد الگوریتم های جنگل تصادفی و ماشین بردارپشتیبان به ترتیب با سطح زیر منحنی 88 و 86 درصد بهترین عملکرد را در طبقه بندی وقوع گسل بر مبنای متغیرهای ورودی دارند. در نهایت با ضرایب جینی در الگوریتم جنگل تصادفی، نقشه های پهنه بندی به دست آمده از ترکیب این الگوریتم با روش های آماری دومتغیره،تهیه و اعتبارسنجی شد. طبق این الگوریتم، به ترتیب متغیرهای ارتفاع، خاک شناسی و شاخص ناهمواری زمین مهم ترین پارامترها در وقوع گسل شناخته شدند. طبق ارزیابی نقشه های پهنه بندی ، در روش ارزش اطلاعات و تراکم سطح به ترتیب حدود 52 و 35 درصد گسل ها در کلاس خطر خیلی زیاد واقع شدند. لذا روش ارزش اطلاعات در تعیین پهنه های حساس به وقوع گسل دقت بیش تری داشت. با توجه به نتایج، روش های داده کاوی به عنوان ابزاری مفید در مدیریت ریسک گسل معرفی گردید. همچنین لزوم توجه به متغیرهای محیطی به ویژه توپوگرافی در مراحل مدیریت و تغییر کاربری حوضه ضرورت می یابد.کلید واژگان: ارزش اطلاعات، الگوریتم طبقه بندی، تراکم سطح، منحنی ROCFault is one of the main processes in tectonics which has relationship with phenomena such as earthquake. Therefore, awareness of the effect of environmental factors on fault occurrence and recognition of high risk areas is very important, that these goals in the present study have been investigated. The research area is Qara-Qum where after determining its faults, altitude, slope, direction, climate, land use, geomorphology, geology, erosion, precipitation, flood zones, pedology, stream power, topographic ruggedness index, distance from road, waterway, anticline and syncline were extracted. Then, data mining algorithms including of decision tree, random forest, cumulative, backing machine, logistic regression and neural network in R software are used to identify the value of variables and bivariate statistical methods including of information value and area density for identification of the values for each variable class fitted in fault occurrence. The accuracy of classification algorithms with ROC curve showed that based on input variables, random forest and support vector machine algorithms with 88% and 86% area under a curve had the best performance in classifying fault occurrence, respectively. Finally, according to the Gini coefficients in random forest algorithm, the zoning maps obtained by combining this algorithm were prepared and validated by bivariate statistical methods. According to this algorithm, the height, pedology and topographic ruggedness index variables, identified as the most important parameters in the fault occurrence respectively. Based on the zoning maps evaluation, information value and area density methods, around 52 and 35 percent of faults placed in very high risk class respectively. Therefore, the information value method was more accurate in identifying fault-sensitive zones. According to the results, data mining methods were introduced as a useful tool in fault risk management. It is also necessary to pay attention to environmental variables, especially topography, during the basin management and land use change stages.Keywords: Density Area, Information Value, ROC curve, Classification Algorithm
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.