استفاده از خوشه بندی و رویکردی ترکیبی برای پرکردن مقادیر جا افتاده عددی

نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
تخمین مقادیر جاافتاده یک گام مهم در پیش پردازش داده ها است. در این مقاله یک رویکرد دومرحله ای برای پرکردن مقادیر جاافتاده عددی ارائه شده است. در مرحله اول داده ها خوشه بندی می شوند و در مرحله دوم داده های جاافتاده درون هر خوشه با استفاده از یک روش ترکیبی از k نزدیک ترین همسایه وزن دار و رگرسیون خطی تخمین زده می شوند. از معیار همبستگی بین صفات در هر خوشه برای تعیین روش پرکردن داده های جاافتاده استفاده می شود. کیفیت پرکردن مقادیر جاافتاده با استفاده از معیار میانگین مربعات خطا سنجیده می شود. تاثیر پارامترهای مختلف بر میزان خطای داده های تخمین زده شده بررسی می گردد. عملکرد روش ارائه شده برای تخمین داده های جاافتاده بر روی پنج مجموعه داده نیز بررسی می شود. در نهایت عملکرد روش ارائه شده با چهار روش پرکردن با مقدار میانگین، روش تخمین با شبکه عصبی پرسپترون چندلایه (MLP)، روش پرکردن با خوشه بندی c-means فازی و روش k خوشه و نزدیک ترین همسایه مبتنی بر دسته (CKNNI) مقایسه می شود. نتایج به دست آمده نشان داده که خطای تخمین مقادیر جاافتاده در روش ارائه شده کمتر از خطا در دیگر روش های مقایسه شده است.
زبان:
فارسی
در صفحه:
233
لینک کوتاه:
magiran.com/p1798965 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!