انتخاب ویژگی مبتنی بر تئوری اطلاعات برای انتخاب ژن های موثر در تشخیص نوع سرطان با استفاده از داده های ریزآرایه

نویسنده:

ولی درهمی* ، سید ابوالفضل طباطبایی ، راضیه شیخ پور ، محمدرضا پژوهان

پیام:

نوع مقاله:

مقاله پژوهشی/اصیل (دارای رتبه معتبر)

چکیده:

انتخاب ویژگی یکی از فرایندهای پیش پردازش داده ها در مباحث مربوط به یادگیری ماشین و داده کاوی محسوب می شود که در برخی زمینه ها نظیر کار با داده های ریزآرایه در بیوانفورماتیک که با مشکل ابعاد بالای داده ها در مقابل تعداد کم نمونه ها مواجه است، از اهمیت ویژه ای برخوردار است. انتخاب ویژگی های (ژن های) موثر در تشخیص بیماری از داده های ریزآرایه نقش مهمی در تشخیص زودهنگام بیماری و راه های مواجهه با آن ایفا می کند. در روش های انتخاب ویژگی مبتنی بر تئوری اطلاعات که طیف گسترده ای از روش های انتخاب ویژگی را شامل می شوند، از مفهوم آنتروپی برای تعریف معیارهای مرتبط بودن، افزونگی و مکمل بودن ویژگی ها، استفاده می شود. در این مقاله از مفهوم پیوستگی خالص به جای آنتروپی (پراکندگی) برای پیشنهاد یک معیار جدید مرتبط بودن استفاده شده است. در معیار پیشنهادی، برای کنترل و کاهش افزونگی، ارتباط یک ویژگی با تک تک کلاس ها به طور جداگانه بررسی شده است در حالی که در اکثر روش های فیلتر، ارزش یک ویژگی بر اساس ارتباط آن با کل کلاس ها سنجیده می شود. این راهکار باعث می شود که ویژگی های (ژن های) موثر در هر کلاس به تفکیک شناسایی شوند، در حالی که امکان شناسایی ویژگی های (ژن های) مشترک نیز فراهم است. مشکل دیگری که در برخی روش ها وجود دارد، مسئله گسسته سازی داده ها است. در روش ارائه شده، با استفاده از یک تبدیل مبتنی بر یک ریختی ضمن استفاده از مزایای گسسته سازی از درگیر شدن با پیچیدگی های آن اجتناب شده است. برای مقایسه روش ارائه شده با تعدادی از روش های مرتبط ، از هفت مجموعه داده ریزآرایه مربوط به انواع سرطان به همراه سه دسته بند پرکاربرد بیزین ساده، -kنزدیک ترین همسایه و ماشین بردار پشتیبان استفاده شده است. نتایج تجربی، کارایی روش ارائه شده را بر اساس دو پارامتر دقت دسته بندی و تعداد ژن های انتخابی نشان می دهد.

کلیدواژگان:

انتخاب ویژگی ، ژن های موثر ، تشخیص سرطان ، داده های ریزآرایه ، یادگیری ماشین ، دسته بندی

زبان:

فارسی

انتشار در:

فصلنامه مهندسی پزشکی زیستی، سال سیزدهم شماره 4 (زمستان 1398)

صفحات:

351 تا 362

لینک کوتاه:

magiran.com/p2066644

دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:

اشتراک شخصی

با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!

اشتراک سازمانی

به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!

اطلاعات بیشتر

توجه!

حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.

دسترسی سراسری کاربران دانشگاه پیام نور!

اعضای هیئت علمی و دانشجویان دانشگاه پیام نور در سراسر کشور، در صورت ثبت نام با ایمیل دانشگاهی، تا پایان فروردین ماه 1403 به مقالات سایت دسترسی خواهند داشت!

In order to view content subscription is required

Personal subscription

Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.

Organization subscription

Please contact us to subscribe your university or library for unlimited access!

More information

علمی مصوب

فصلنامه مهندسی پزشکی زیستی

Iranian Journal of Biomedical Engineering

فصلنامه فنی مهندسی

آخرین شماره | آرشیو

ISSN: 2008-5869

صاحب امتیاز:

انجمن مهندسی پزشکی ایران

مدیر مسئول:

دکتر سید محمدرضا هاشمی گلپایگانی

سردبیر:

دکتر ناصر فتورایی

تلفن نشریه: ۰۲۱-۶۴۵۴۲۴۹۹

اطلاعات بیشتر نشریه

درباره نشریه پیام به نشریه سایت اختصاصی نشریه پذیرش الکترونیکی مقاله

به جمع مشترکان مگیران بپیوندید!

انتخاب ویژگی مبتنی بر تئوری اطلاعات برای انتخاب ژن های موثر در تشخیص نوع سرطان با استفاده از داده های ریزآرایه

ولی درهمی* ، سید ابوالفضل طباطبایی ، راضیه شیخ پور ، محمدرضا پژوهان

انتخاب ویژگی ، ژن های موثر ، تشخیص سرطان ، داده های ریزآرایه ، یادگیری ماشین ، دسته بندی

فصلنامه مهندسی پزشکی زیستی

Iranian Journal of Biomedical Engineering