تشخیص بیماری دیابت نوع 2 با استفاده از درخت تصمیم C4.5
یکی از شایع ترین بیماری ها در دنیای امروز بیماری دیابت است و سالانه شیوع دیابت در سطح جهان حدود درصد افزایش می یابد. استفاده از تکنیک های داده کاوی برای ایجاد مدل های پیشگویی کننده، جهت شناسایی افراد در معرض خطر برای کاهش عوارض ناشی از بیماری بسیار کمک کننده است. در این پژوهش با استفاده از درخت تصمیم C4. 5 به روش های پیشگیری و تشخیص این بیماری پرداخته شد.
در این پژوهش کاربردی- توصیفی از داده های استاندارد UCI و مجموعه داده pima-indians-diabetes استفاده شد. این پایگاه داده شامل 768 رکورد با 8 فیلد می باشد. تجزیه و تحلیل به کمک نرم افزار Weka 3. 6 با به کارگیری روش CRISP3 انجام شد. در بخش مدل سازی درخت تصمیم C4. 5 با به کارگیری متغیرهای ورودی و تعیین متغیر هدف ایجاد شد. همچنین جهت ارزیابی مدل از شاخص های حساسیت، ویژگی، دقت، ارزش اخباری مثبت و منفی استفاده شد.
با توجه به مدل استفاده شده مشخص شد که به ترتیب متغیرهای میزان بالای قند خون دوساعته، تعداد دفعات بالای حاملگی، سن بالا، فشارخون دیاستولیک بالا، سابقه خانوادگی و شاخص توده بدنی (BMI) بالا، بیشترین تاثیر را در ابتلا به بیماری دیابت نوع 2 دارا هستند. نرخ دسته بندی برابر با 73/8% و دقت الگوریتم C4. 5 برابر با 79 % به دست آمد.
در مقایسه با نتایج مطالعات انجام شده در حوزه داده کاوی بیماری دیابت، دقت به دست آمده الگوریتم پیشنهادی قابل قبول است. بیشترین عوامل تاثیرگذار بر بیماری دیابت شناسایی شدند. همچنین قوانینی استخراج شد که می تواند به عنوان الگویی در جهت پیشگویی احتمال ابتلا افراد به بیماری دیابت استفاده شود.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.