بررسی مشکلات الگوریتم خوشه بندی DBSCAN و مروری بر بهبودهای ارائه شده برای آن

پیام:
چکیده:
خوشه بندی یک از تکنیک های مهم کشف دانش در پایگاه داده است. الگوریتم های خوشه بندی مبتنی بر چگالی یکی از روش های اصلی برای خوشه بندی در داده کاوی هستند. عدم محدودیت به شکل خوشه ها، ساده و قابل فهم بودن ازجمله مزایای این الگوریتم ها است. DBSCAN الگوریتم پایه روش های خوشه بندی مبتنی بر چگالی است. این الگوریتم قابلیت کشف خوشه های با اندازه و اشکال متفاوت را از حجم زیادی از داده ها دارد و در مقابل نویز نیز مقاوم است. علی رغم وجود این مزایا، این الگوریتم دارای مشکلاتی نظیر: سخت بودن تعیین مقدار دقیق پارامترهای ورودی، عدم تشخیص خوشه های با چگالی متفاوت و عدم تشخیص صحیح خوشه ها در هنگام نزدیک بودن خوشه ها به هم، نیز است. از سال 1996 که DBSCAN ارائه شده است، تا به امروز الگوریتم های بسیار زیادی در جهت بهبود DBSCAN ارائه شده اند. در این مقاله ابتدا، مشکلات الگوریتم DBSCAN بررسی می شوند. سپس به مرور و بررسی الگوریتم هایی که در جهت بهبود مشکلات الگوریتم DBSCAN ارائه شده اند، می پردازیم تا با نقاط ضعف و قوت این الگوریتم ها و میزان موفقیت این الگوریتم ها در بهبود الگوریتم DBSCAN آشنا شویم. همچنین، با توجه به مطالعات انجام شده، ما اقدام به پیاده سازی برخی از این الگوریتم ها نموده ایم و آن ها را بر روی مجموعه داده های استاندارد، بر اساس معیارهای ارزیابی خوشه بندی تست کرده ایم تا بهتر بتوانیم در مورد این الگوریتم ها قضاوت کنیم.
نوع مقاله:
مقاله پژوهشی/اصیل
زبان:
فارسی
صفحات:
2 -37
لینک کوتاه:
magiran.com/p1821076 
روش‌های دسترسی به متن این مطلب
اشتراک شخصی
در سایت عضو شوید و هزینه اشتراک یک‌ساله سایت به مبلغ 300,000ريال را پرداخت کنید. همزمان با برقراری دوره اشتراک بسته دانلود 100 مطلب نیز برای شما فعال خواهد شد!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی همه کاربران به متن مطالب خریداری نمایند!