ترکیب تکنیک های انتخاب نمونه و داده افزایی برای حل مسئله طبقه بندی مجموعه داده های نامتوازن

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:

در عصر کلان داده ها، تکنیک های تجزیه و تحلیل خودکار مانند داده کاوی به طور گسترده ای برای تصمیم گیری به کار گرفته شده و بسیار موثر واقع شده اند. از جمله تکنیک های داده کاوی می توان به طبقه بندی اشاره کرد که یک روش رایج برای تصمیم گیری و پیش بینی است. الگوریتم های طبقه بندی به طور معمول بر روی مجموعه داده های متوازن به خوبی عمل می کنند. با وجود این، یکی از مشکلاتی که الگوریتم های طبقه بندی با آن مواجه هستند، پیش بینی صحیح برچسب نمونه های جدید بر اساس یادگیری بر روی مجموعه داده های نامتوازن است. در این نوع از مجموعه داده ها، توزیع ناهمگونی که داده ها در کلاس های مختلف دارند باعث نادیده گرفته شدن نمونه های کلاس با تعداد نمونه کمتر در یادگیری طبقه بند می شوند؛ در حالی که این کلاس در برخی مسائل پیش بینی دارای اهمیت بیشتری است. به منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل سازی مجموعه داده های نامتوازن ارائه می شود که با متعادل نمودن تعداد نمونه های کلاس های مختلف در مجموعه داده ای نامتوازن، پیش بینی صحیح برچسب کلاس نمونه های جدید توسط الگوریتم یادگیری ماشین را بهبود می بخشد. بر اساس ارزیابی های صورت گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه بندی مجموعه داده های نامتوازن به نام های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش های دیگر دارد.

زبان:
فارسی
صفحات:
273 تا 283
لینک کوتاه:
magiran.com/p2713952 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!