مرور نظام مند کیفیت داده در فرایندکاوی

پیام:
نوع مقاله:
مقاله مروری (دارای رتبه معتبر)
چکیده:
هدف

فرایندکاوی ارتباط میان دو زمینه داده کاوی و یادگیری ماشین، با رویکردهای مدیریت فرایند کسب وکار را فراهم می سازد. یک فرایند کسب وکار ترتیبی از فعالیت های مستقل و به هم مرتبط است، که در هنگام انجام هر کدام از فعالیت های پیش بینی شده، از یک یا چند منبع (شامل زمان، افراد، هزینه و...) برای تبدیل ورودی ها (داده، مواد و...) به خروجی های مورد نیاز استفاده می کند. با استفاده از روش های فرایندکاوی می توان رفتار حقیقی سازمان ها شامل عملکرد افراد، بخش ها و منابع را بررسی نمود. نتایج حاصل از فرایندکاوی که به صورت معمول شامل مدل های فرایند کسب وکار است را می توان با مستندات و الزامات سازمان ها مقایسه کرد. بدین سان امکان بررسی، نظارت و بهبود فرایندها امکان پذیر خواهد شد. مبنای عمل روش های فرایندکاوی براساس نگاره های رویداد ذخیره شده در سامانه های اطلاعاتی است. استفاده از فرایندکاوی بدون وجود داده های ورودی باکیفیت، به یافته هایی باورپذیر در مورد فرایندهای کسب وکار یک سازمان منجر نخواهد شد. از این رو در سال های گذشته ارزیابی و افزایش کیفیت داده های ورودی به روش های فرایندکاوی، مورد توجه پژوهشگران قرار گرفته است. در این راستا، هدف پژوهش حاضر شناخت و گروه بندی مهم ترین مشکلات کیفیت داده و بازشناخت رویکردهای ارایه شده برای حل این چالش در فرایندکاوی است.

روش

روش مورد استفاده در این پژوهش از نوع مرور نظام مند بوده که با هدف واکاوی همه شواهد معتبر، برای پاسخگویی به سوالات پژوهش مورد استفاده قرار گرفته است. در این مطالعه به بررسی و کاوش 102 مطالعه دانشگاهی در بین سال های 2007 تا 2021 میلادی پرداخته شده است که شامل پژوهش های انتشار یافته در همایش ها، مجلات و همچنین تعدادی پایان نامه می باشند. بدین منظور از یک روش پژوهش نظا م مند سه بخشی استفاده شده است. در بخش اول که شامل تعریف پژوهش بوده، ابتدا زمینه پژوهش تعریف شده و سپس اهداف و پرسش های پژوهش مشخص شده اند. در گام نهایی این بخش، دامنه پژوهش تعیین گردیده است. در بخش دوم، روش شناسی پژوهش معین شده و معیارهایی برای وارد کردن مطالعات یافت شده به فرایند بررسی نهایی، مشخص شده اند. سپس این مطالعات از لحاظ ارجاعات مورد بررسی قرار گرفته و در پایان دسته بندی شده اند. در بخش سوم که به ارزیابی پژوهش های جمع آوری شده اختصاص یافته است، پژوهش های نهایی مطالعه شده و سپس بر مبنای کاوش آن ها، یافته ها و نتایج حاصل تعیین گردیده اند. با بررسی جامع پژوهش های گردآوری شده، داده ها و شواهد مهم استخراج گردیده و جداول و نمودارهای مورد نیاز نیز رسم شده اند.

یافته ها

براساس بررسی پژوهش های انجام شده، توجه به چالش های کیفیت داده در فرایندکاوی در سال های اخیر افزایش یافته است. بیشترین حجم از مطالعات در سال های 2019 و 2020 میلادی منتشر شده اند. همچنین مشخص شد که بیشتر مقالات به ترتیب در سه پایگاه علمی Springer، IEEE و Elsevier انتشار یافته اند. 51 درصد از مطالعات مورد بررسی در همایش ها و کنفرانس های معتبر ارایه شده اند. 36 درصد از پژوهش ها در مجلات معتبر علمی انتشار یافته و 13 درصد از مطالعات از طریق پایان نامه ها و گزارشات دانشگاهی انعکاس یافته اند. برآیندهای حاصل از مطالعه مقالات منتخب نشان داد که 20 مشکل کیفیت داده که می توانند در داده های ورودی پدید آیند، در ادبیات مورد کنکاش قرار گرفته اند. این چالش ها در پنج سطح مسیر فرایند، رویداد، مورد، فعالیت و برچسب زمانی طبقه بندی شده و چهار رویکرد بنیادین که برای ارزیابی و حل چالش های کیفیت داده در فرایندکاوی به کار گرفته شده اند، مشخص گردیدند که شامل: چارچوب های ارزیابی کیفیت داده، پیش پردازش، کشف ناهنجاری، و ترمیم می باشند. یافته ها نشان می دهد که روش های پیش پردازش که هدف آن ها حذف رفتارهای آشفته و کم تکرار از داده های ورودی است، بیشتر از دیگر رویکردها مورد توجه واقع شده اند. همچنین در سال های اخیر کشف ناهنجاری و بازسازی رویدادهای گمشده به جستاری جذاب در زمینه فرایندکاوی تبدیل شده اند. یکی دیگر از نتایج مهم، بررسی مطالعات مربوط به زمینه کیفیت داده در فرایندکاوی، استفاده از حجم وسیعی از رویکردها و روش ها برای حل چالش های کیفیت داده است. بررسی ها نشان داد که استفاده از شبکه های پتری، نقش پر رنگی در همه پژوهش های منتخب به عنوان یک رهیافت ریاضی مد نظر پژوهشگران داشته است.

نتیجه گیری

داده های مورد نیاز روش های فرایندکاوی می تواند از مکان های مختلفی به دست آید. یکی از مزایای بزرگ فرایندکاوی این است که مختص به یک نوع سامانه خاص نیست. هر سامانه مبتنی بر گردش کار، فروش بلیط، مدیریت منابع ، پایگاه و انبارهای داده، سامانه های قدیمی و حتی داده هایی که به صورت دستی جمع آوری شده اند، تا زمانی که با استفاده از ویژگی های شناسه مورد، فعالیت و برچسب زمانی قابل تفکیک باشند، قابل تجزیه و تحلیل هستند. اما در مسایل دنیای واقعی، بیشتر داده ها برای اهداف فرایندکاوی جمع آوری نشده اند یا مناسب استفاده برای تحلیل های فرایندکاوی نیستند. به خصوص داده هایی که به صورت دستی ثبت شده اند یا داده هایی که در بین سامانه های جزیره ای مختلف پراکنده شده اند، می توانند حاوی خطا باشند. با وجود تلاش های مناسب برای بهبود کیفیت داده های ورودی در فرایندکاوی، همچنان توسعه چارچوب ها و روش های کارآمد با هدف شناسایی، ارزیابی و حل چالش های کیفیت داده در فرایندهای کسب وکار واقعی که بیشتر اوقات از حجم و پیچیدگی بالایی برخوردارند، پیشنهاد می گردد. نتایج این پژوهش می تواند به عنوان دورنمایی جدید برای پژوهشگران و متخصصان علم داده و تحلیل گران کسب وکار مورد استفاده قرار گیرد.

زبان:
فارسی
صفحات:
103 تا 160
لینک کوتاه:
magiran.com/p2672875 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!