c5.0 algorithm
در نشریات گروه پزشکی-
Introduction
The central venous catheter (CVC) has been shown to increase mortality in hemodialysis (HD) patients compared with the arteriovenous fistula (AVF). However, no study has examined the mortality of HD patients based on the time of conversion from the CVC to AVF. In this study, we investigated the association between patients’ survival and length of time of using each access.
MethodsThe C5.0 algorithm was used to find rules about the relationship between duration of the different access usage and survival. The cox model was applied to assess the association of the obtained duration categories and mortality.
ResultsFrom 2367 adult patients who received maintenance HD from 2012 to 2014, 705 patients were eligible for the study. Using an AVF for more than 8 months and a CVC for less than 4.2 months had the highest one-year survival rate (91.8% and 87.4%). The hazard ratio (HR) for mortality of less than 2.8 months of AVF usage compared to the longest usage was 6.90 (95% CI: 4.60 - 10.30) before adjustment and 5.03 (95% CI: 3.20 - 8.00) after adjustment for all confounders. For the CVC, the ratio was 8.8 (95% CI: 6.00 - 13.00) when comparing more than 9.2 months of usage with the lowest usage duration before an adjustment and 6.00 (95% CI: 3.80 - 9.41) after adjustment.
ConclusionOur results presented that regardless of the type of initial vascular access, limiting the length of the time using CVC as well as switching to AVF could significantly improve the survival of HD patients
Keywords: arteriovenous fistula, central venous catheters, renal dialysis, survival analysis, C5.0 algorithm, proportional hazard mode -
مقدمه
بروز دیابت در ده سال اخیر در سطح جهان دو برابر شده است. حدود 200 میلیون نفر به این بیماری مبتلا هستند و سالانه شیوع دیابت در جهان حدود شش درصد افزایش می یابد. بیش از دو میلیون نفر در ایران به این بیماری مبتلا هستند. در این تحقیق به بررسی ارتباط بین عوارض مشاهده شده در بیماران دیابتی نوع دو و برخی ویژگی های آن ها از قبیل میزان قند خون، فشار خون، سن و سابقه خانوادگی بیماران می پردازیم. هدف این مطالعه، پیش بینی عوارض بیماران بر اساس علائم مشاهده شده در آن ها است.
روش کارداده های مورد نیاز برای این تحقیق از پرونده های سال 1388 مرکز دیابت استان گلستان جمع آوری شده است. تعداد پرونده های اولیه بیماران 856 رکورد بود. در این مقاله مدل جدیدی بر اساس متدولوژی استاندارد CRISP ارائه شده است. در بخش مدل سازی از دو روش شناخته شده در داده کاوی به نام های درخت تصمیم C5.0 و شبکه عصبی استفاده شده است. برای تحلیل داده ها از نرم افزار Celementine 12.0 استفاده شده است.
یافته هادر این تحقیق برای اولین بار احتمال بروز عوارض میکروواسکولار، ماکروواسکولار و یا هر دو نوع عارضه در بیماران و ویژگی های تاثیرگذار بر آن ها مورد بررسی قرار گرفته است. با استفاده از داده کاوی و روش های آن تعیین شده است که متغیر های فشار خون بالا، سن و سابقه خانوادگی در عوارض مشاهده شده بیشترین تاثیر را داشته اند. به کمک درخت تصمیم ایجاد شده، قوانینی استخراج شده اند که می تواند به عنوان الگویی برای پیش بینی وضعیت بیماران و احتمال بروز عوارض در آن ها استفاده شود. صحت مدل ایجاد شده بر روی داده های مورد استفاده در درخت تصمیم C5.0، 89.74 درصد و در شبکه عصبی مصنوعی 51.28 درصد می باشد.
نتیجه گیریبا توجه به روش های استفاده شده، بالاترین دقت با استفاده از الگوریتم C5.0 به دست آمده است. بیشترین عوامل تاثیرگذار بر بروز عوارض شناسایی شدند. با توجه به قوانین ایجاد شده برای یک نمونه جدید با ویژگی های مشخص، می توان پیش بینی کرد بیمار احتمالا دچار چه نوع عارضه ای خواهد شد.
کلید واژگان: دیابت نوع دو، عوارض دیابت، داده کاوی، الگوریتم C 5، 0، شبکه عصبیIntroductionIn the last 10 years The incidence of diabetes has doubled worldwide with annual increasing rate of about 6%. More than 2 million people in Iran are now affected by this disease. The present research deals with the relation between the observed complications of type 2 diabetic patients and some related features like Blood Glucose Level، Blood Pressure، Age، and Family History. The main purpose was to predict the patients’ complications based on the observed signs.
MethodsThe research data were gathered from 856 patient records related to the 2009’s cases in the Diabetes Center of Golestan province. A new model based on the standard methodology CRISP was developed. In the modeling section، two well-known data mining techniques called C5. 0 decision tree and Neural Network were used. Celementine 12. 0 software was implemented For data analysis.
ResultsThe results of data mining showed that the variables of high blood pressure، age، and family history had the most impact on the observed complications. Based on the created decision tree، some rules have been extracted which can be used as a pattern to predict the probability of occurring these complications in the patients. The accuracy of the C5. 0 model on the data was shown to be 89. 74% and on the Artificial Neural Network was 51. 28%.
ConclusionAs the highest accuracy was shown to be achieved using C5. 0 algorithm، according to the created rules، it can be predicted which complication (s) any diabetic patient with new specified features may probably suffer from.
Keywords: type 2 diabetic, diabetic complications, Data mining, C5.0 Algorithm, Artificial neural network
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.