چارچوبی مبتنی بر خط لوله برای پیش بینی زود هنگام بیماری دیابت
دیابت یک بیماری مزمن است و میزان مرگ و میر آن در حال افزایش است. متخصصان سلامت به دنبال راهکارهای نوآورانه برای تشخیص و درمان زودهنگام آن هستند. پیشرفت های یادگیری ماشینی تشخیص بیماری را بهبود داده است. با این حال، به دلیل کمبود داده های برچسب گذاری شده، مقادیر ناقص و نامتعادل بودن داده ها، ایجاد یک پیش بین بهینه برای تشخیص بیماری به یک چالش بزرگ تبدیل شده است. هدف این مطالعه ارایه یک چارچوب طبقه بندی مبتنی بر خط لوله برای تشخصیص دیابت در دو مجموعه داده هندی (دو کلاس: بیمار و سالم) و عراقی (سه کلاس: بیمار، سالم و در شرف ابتلا به دیابت) است.
بخش مهم این چارچوب پیش پردازش است. مدل های مختلف یادگیری ماشین مبتنی بر رویکرد One-Vs-One برای حالت سه کلاسه، در چارچوب پیشنهادی پیاده سازی شده اند. به دلیل نامتعادل بودن مجموعه داده، علاوه بر معیار ارزیابی دقت طبقه بندی، مساحت زیر منحنی مشخصه عملکرد گیرنده نیز استفاده می شود. با هدف افزایش مساحت زیر منحنی مشخصه عملکرد گیرنده و دقت طبقه بند، فراپارامترهای هریک از مدل ها با روش های بهینه سازی جستجوی شبکه ای و بیزین بهینه سازی می شوند برای ساختن مدلی قدرتمند با زمان کم آموزش و آزمایش از روش های مختلف انتخاب ویژگی استفاده می شود.
از طریق شبیه سازی، چارچوب پیشنهادی برای تشخیص بیماری دیابت در دو مجموعه داده هندی و عراقی مورد آزمایش قرار گرفت. نتایج نشان داد که با استفاده از AdaBoost در مجموعه داده هندی (94/11AUC=، 89/98ACC=) و با استفاده از جنگل تصادفی در مجموعه داده عراقی (98/62AUC=، 98/66ACC=)، دقت و عملکرد مطلوبی به دست آمد.
از نظر معیارهای ACC، دقت، صحت، یادآور و F1-Score، چارچوب پیشنهادی مبتنی بر خط لوله عملکرد بهینه ای دارد و می تواند در سامانه های پزشکی به عنوان یک برنامه کاربردی مورد استفاده قرار گیرد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.