ارائه الگوریتم ترکیبی پالایشی-پوششی انتخاب ویژگی و کاربرد آن در کاهش بعد داده های بیان ژن
امروزه بالا رفتن حجم داده ها و تعداد ویژگی ها در مجموعه داده، باعث کاهش دقت الگوریتم یادگیری و پیچیدگی محاسباتی شده است. . روش های کاهش بعد، نوعی از روش انتخاب مشخصه هستند که به دو صورت پالایشی و پوششی انجام می شود. دقت روش های پوششی نسبت به روش های پالایشی بالاتر است اما در مقابل، روش های پالایشی سریع تر عمل می کنند و پیچیدگی های محاسباتی کمتری دارند. با در نظر گرفتن مزایا و معایب الگوریتم های پالایشی و پوششی، در این پژوهش یک روش ترکیبی جدید ارائه شده است. در این روش، ابتدا کل مشخصه های موجود در مجموعه داده در نظر گرفته می شوند سپس با ترکیب الگوریتم های پالایشی انتخاب مشخصه و ارزش گذاری نتایج آن به روش پوششی، زیرمجموعه ای بهینه از مشخصه ها انتخاب می شوند. با توجه به اینکه بسیاری از بیماری ها و مسائل زیست سیستمی نظیر سرطان، به کمک بررسی داده ی ریزآرایه قابل شناسایی و تشخیص هستند و با توجه به اینکه تعداد مشخصه ها در این مجموعه داده ها بسیار بالا است؛ روش ارائه شده در این پژوهش برروی داده ی ریزآرایه مربوط به سه نوع سرطان مورد ارزیابی قرار گرفته است.این روش، در مقایسه با روش های مشابه، به دقت بالایی در دسته بندی و شناسایی عوامل موثر در سرطان به خصوص سرطان خون دست یافته است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.