ارائه یک روش خوشه بندی گراف-محور جهت شناسایی جمعیت های سلولی در داده های توالی یابی RNA سلول-منفرد
استفاده از فناوری «توالی یابی RNA سلول-منفرد» باعث شناخت بهتر ساختارهای سلولی شده و داده های با وضوح بسیار بالایی از بیان ژن های مختلف هر سلول را در یک زمان واحد ارایه می دهد. یکی از زمینه های پرکاربرد در این حوزه، خوشه بندی داده ها بر اساس ژن های بیان شده است که بعضا منتج به شناسایی جمعیت های سلولی جدید می گردد. عملکرد روش های پیشنهادی عمدتا به شکل جمعیت ها و ابعاد داده ها بستگی دارد؛ لذا توسعه یک روش که بتواند فارغ از این موانع به شناسایی جمعیت های سلولی بپردازد، بسیار مهم است.
در روش پیشنهادی که یک روش کتابخانه ای بود، ابتدا تعداد جمعیت های سلولی تخمین زده شد. این تخمین از آن جهت اهمیت دارد که در دنیای واقعی، اطلاعات اولیه مثل تعداد و نوع جمعیت های سلولی در دسترس نیست. سپس با استفاده از یک کرنل گاوسی مبتنی بر گراف، ضمن کاهش ابعاد مسیله، اقدام به شناسایی جمعیت های سلولی با روش خوشه بندی kmeans++ شد.
نتایج پیاده سازی نشان داد که روش پیشنهادی می تواند نسبت به سایر روش های یادگیری ماشین ارایه شده در این زمینه، بهبود قابل قبولی را حاصل کند. به عنوان مثال برای معیار ARI، مقادیر 100، 93/47 و 84/69 به ترتیب برای مجموعه داده های سلول-منفرد Kolod، Buettner و Usoskin حاصل شد.
روش پیشنهادی بدون هیچ اطلاعات اولیه در مورد تعداد و نوع جمعیت های سلولی و فارغ از ابعاد بالای مسیله، می تواند اقدام به خوشه بندی و در نتیجه شناسایی جمعیت های سلولی با دقت و کیفیت بالایی نماید.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.