مقایسه عملکرد مدل های داده کاوی در پیش بینی بارش باران با استفاده از رویکرد دسته بندی (مطالعه موردی: ایستگاه هواشناسی سینوپتیک فرودگاه همدان)

پیام:
نوع مقاله:
مطالعه موردی (دارای رتبه معتبر)
چکیده:
زمینه و هدف

بارندگی یکی از پدیده های پیچیده طبیعی و از مهم ترین اجزای چرخه آب بوده و در سنجش خصوصیات اقلیمی هر منطقه نقش بسیار مهمی ایفا می کند. شناخت میزان و روند تغییرات بارش به عنوان یکی از عناصر مهم هواشناسی، از یک سو جهت داشتن مدیریت اثربخش و برنامه ریزی دقیق تر برای بخش های کشاورزی، اقتصادی و اجتماعی و از سوی دیگر برای مطالعاتی مانند رواناب ها، خشک سالی ها، وضعیت آب های زیرزمینی و سیلاب ها ضروری است. همچنین پیش بینی بارش در مناطق شهری تاثیر بسیار زیادی بر کنترل ترافیک، جریان فاضلاب ها و فعالیت های ساخت وساز دارد.

روش پژوهش: 

هدف این مطالعه مقایسه دقت مدل های کلاس بندی درخت تصمیم (چاید (CHAID)، درخت تصمیم C5، نیو بیزین (NB)، کوئست (Quest) و جنگل تصادفی)، k نزدیک ترین همسایگی (KNN)، ماشین بردار پشتیبان (SVM) و شبکه عصبی مصنوعی (ANN) جهت پیش بینی وقوع بارش باران با استفاده از داده های یک دوره 50 ساله در ایستگاه سینوپتیک فرودگاه همدان است. در این مطالعه از 80 درصد داده ها جهت آموزش و از 20 درصد داده ها جهت صحت سنجی مدل ها استفاده شده و نتایج حاصل از اجرای مدل ها با استفاده از معیارهای ماتریس درهم ریختگی (اغتشاش)، منحنی ROC و شاخص AUC مقایسه شدند. برای ساخت متغیر کلاس بندی داده های بارش و عدم بارش، با توجه به داده های بارش، روزهای سال در دو کلاس روزهای وقوع بارش (y) و روزهای عدم وقوع بارش (n) دسته بندی شدند. در این تحقیق پیش پردازش داده ها با استفاده از پیش پردازش خودکار داده ها (ADP) انجام شده و آنگاه کاهش ابعاد متغیرها از روش PCA استفاده شد.

یافته ها

در این مطالعه با توجه به روش PCA ابعاد متغیرها به 5 بعد کاهش یافت. همچنین از داده های موجود تقریبا 80 درصد، روزها بدون بارش و 20 درصد روزها با بارش هستند. نتایج تحقیق نشان داد که مدل KNN با معیار صحت 9/91 برای داده های آموزشی و مدل SVM، 13/89 درصد برای داده های آزمون بهترین عملکرد را بین مدل های داده کاوی داشتند. شاخص AUC مدل KNN برابر 97/0 در داده های آموزشی و در داده های آزمون مقدار 94/0 برای الگوریتم SVM به دست آمد. همچنین با توجه به منحنی عملکرد سیستم (ROC) برای داده های بارش همدان مدل KNN نسبت به سایر مدل ها عملکرد بهتری را دارا می باشد. توجه به شاخص حساسیت در ماتریس اغتشاش، مدل های KNN و SVM در پیش بینی عدم وقوع بارش برای داده های آموزش بهتر عمل کردند. با توجه به شاخص خاصیت در پیش بینی وقوع بارش مدل های RT و KNN نتایج بهتری داشتند.

نتایج

نتایج تحقیق نشان داد که در داده های آموزش مقدار معیار صحت برای مدل های RT، C5، ANN، SVM، BN،KNN ، CHAID و QUEST به ترتیب 82/86، 78/89، 55/89، 96/89، 06/88، 9/91، 29/88 و 46/87 بدست آمده اند. همچنین این معیار در داده های آزمون برای این مدل ها به ترتیب 2/83، 9/87، 12/88، 13/89، 12/87، 19/88، 93/86 و 76/86 به دست آمد. مقدار شاخص AUC در داده های آموزش برای مدل های RT، C5، ANN، SVM، BN،KNN ، CHAID و QUEST به ترتیب 94/0، 92/0، 94/0، 94/0، 93/0، 97/0، 93/0 و 89/0 به دست آمد. همچنین این معیار در داده های آزمون برای این مدل ها به ترتیب 89/0، 89/0، 93/0، 94/0، 92/0، 90/0، 92/0 و 88/0 برآورد شد. همان طور که مشاهده شد، با توجه به معیارهای صحت و شاخص AUC در داده های آموزش مدل KNN و با توجه به داده های آزمون مدل SVM کارا تر در پیش بینی بارش باران بودند.

زبان:
فارسی
صفحات:
113 تا 126
لینک کوتاه:
magiran.com/p2716731 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!