بهبود طبقه بندی داده های نامتعادل خاک با استفاده از الگوریتم های یادگیری ماشین در بخشی از اراضی استان زنجان
علی رغم استفاده گسترده از روش های نقشه برداری رقومی خاک در مطالعات خاکشناسی، محدودیت های مربوط به عدم تعادل کلاس های خاک مانع عملکرد موفقیت آمیز بسیاری از الگوریتم های یادگیری ماشین در این روش ها شده است. از اینرو هدف از این پژوهش بهبود عملکرد مدل سازی داده های نامتعادل خاک با استفاده از روش پیش درمانی نمونه گیری مجدد در سه مدل پیش بینی شامل جنگل تصادفی، درخت تصمیم توسعه یافته و رگرسیون لجستیک چندجمله ای در بخشی از اراضی استان زنجان است. برای این منظور موقعیت 148 خاک رخ مشاهداتی بر اساس الگوی شبکه بندی منظم با فاصله 500 متر حفر و بر اساس استانداردهای سیستم جامع رده بندی خاک تشریح و طبقه بندی گردید. متغیرهای محیطی شامل اطلاعات نقشه های ژیومورفولوژی و زمین شناسی، مدل رقومی ارتفاع و داده های حاصل از تصاویر ماهواره ای لندست 8 بودند که بر اساس نظر کارشناسی و رویکرد تحلیل مولفه اصلی تعدادی از متغیرهای محیطی به عنوان موثرترین متغیرهای محیطی و ورودی مدل انتخاب گردید. مدل سازی با استفاده از داده های نامتعادل، منجر به از دست دادن کلاس های با مشاهده های کم تعداد برای هر سه مدل بود. در این شرایط مدل رگرسیون لجستیک چندجمله ای بالاترین دقت (66%) و ضریب کاپا (0/41) را نسبت به دو مدل دیگر نشان داد. پس از نمونه برداری مجدد داده ها در قالب فرآیند متعادل سازی، مدل درخت تصمیم توسعه یافته با حفظ کلاس های کم تعداد با صحت کلی 75% و ضریب کاپا 0/64 در پیش بینی مکانی زیرگروه های خاک، برآورد قابل قبولی ارایه داد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.