پیش بینی تاخیر قطارهای مسافری با استفاده از تکنیک های داده کاوی
هدف از این مقاله، پیش بینی تاخیرات قطارهای مسافری در راه آهن جمهوری اسلامی ایران با استفاده از تکنیک های داده کاوی است. پیش بینی تاخیرات می تواند برای تعیین زمان های حایل در جداول زمانی قطارهای مسافری مورد استفاده قرار گیرد. داده های مورد استفاده در این مطالعه شامل پایگاه داده تاخیر قطارهای مسافری از سال 92 تا 97 است که دربردارنده 380.748 رکورد می باشد. متغیرهای مستقل جهت پیش بینی شامل سال، ماه، روز ماه، روز هفته ، ساعت حرکت، محورهای حرکت، نوع قطار، نوع سالن، مبدا و مقصد قطار و همچنین نام مالک قطار هستند. مدلسازی پیش بینی به دو صورت عددی و طبقه ای انجام شده است. جهت پیش بینی طبقه ای، داده های تاخیر با استفاده از روش خوشه بندی دو مرحله ای گسسته سازی شده اند. از دو روش شبکه عصبی و C5.0 جهت پیش بینی طبقه ای و سه روش رگرسیون، CHAID و شبکه عصبی برای پیش بینی عددی استفاده شده است. برای ارزیابی نتایج پیش بینی، مدل ساخته شده ابتدا بر اساس داده های سال های 92 تا 95 آموزش می بیند، سپس به پیش بینی تاخیر برای سال 96 می پردازد. نتایج نشان می دهد که در پیش بینی عددی، روش شبکه عصبی و در پیش بینی به صورت طبقه ای، روش C5.0 از دقت بالاتری نسبت به سایر روش ها برخوردار هستند، لذا از این دو تکنیک برای پیش بینی تاخیر قطارهای سال 97 استفاده شده است. همچنین جهت ارزیابی تکرارپذیری نتایج، تاخیرات پیش بینی شده سال 97 با سال 96 مقایسه گردیده اند. در انتها، پیش بینی عددی به صورت گروه بندی بر روی رکورد های پایگاه داده نیز انجام شده است. نتایج نشان می دهد که دقت پیش بینی به صورت گروه بندی، بالاتر است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.