whale optimization algorithm
در نشریات گروه پدافند غیرعامل-
امروزه در عصر دیجیتال، از آنجا که مسایل امنیتی و حملات سایبری، حریم اطلاعات ایمن و حیاتی سازمان ها یا افراد را مختل می کنند، بسیار جدی و لازم توجه به شمار می روند. بنابراین، تشخیص به موقع این آسیب ها از طرف نفوذگران ضروری است، به طوری که سنگ بنای امنیت تحت عنوان سیستم تشخیص نفوذ (IDS)، حریم خصوصی داده های کاربر را حفظ نماید. از طرف دیگر، همراه با پیشرفت سریع روش های یادگیری ماشین (ML) و یادگیری عمیق (DL) در دنیای داده، یکی از کاربردهای مهم آن ها در زمینه IDS با استفاده از الگوریتم های طبقه بندی پیشرفته است که در سال های اخیر موضوع تحقیقات متعددی جهت افزایش دقت و قابلیت اطمینان بوده است. در نتیجه، این مقاله یک مدل ترکیبی IDS را ارایه می کند که به ادغام انتخاب ویژگی، طبقه بندی و بهینه سازی هایپرپارامترها پرداخته است. ابتدا، ویژگی های انبوه اولیه به طور جداگانه به روش های اطلاعات متقابل اصلاح شده (MMI)، الگوریتم ژنتیک (GA)، و آزمون F تحلیل واریانس وارد می شوند و پس از آن، اشتراک گیری از خروجی آن ها به عنوان ویژگی های نهایی موثر و کاهش یافته صورت می پذیرد. در ادامه، یک طبقه بند ترکیبی CNN و LSTM (CNN-LSTM) به کار گرفته می شود که هایپرپارامترهای آن به جای روش سعی و خطای زمان بر دستی، توسط یک الگوریتم بهینه سازی به نام گرگ خاکستری - نهنگ با جابه جایی تصادفی (RS-GWO-WOA) تعیین خواهد شد. نهایتا، به منظور تجزیه وتحلیل طرح پیشنهادی، مقایسه ای با سایر روش ها از نظر صحت، دقت، یادآوری، امتیاز F1 و مدت زمان در مجموعه داده NSL-KDD انجام شده است که برتری رویکرد توسعه یافته را تایید می نماید.
کلید واژگان: سیستم تشخیص، نفوذ انتخاب ویژگی، بهینه سازی هایپرپارامترها، اطلاعات متقابل، الگوریتم ژنتیک، آزمون F تحلیل واریانس، الگوریتم بهینه سازی گرگ خاکستری، الگوریتم بهینه سازی نهنگIn today's digital era, security issues and cyber attacks have become a serious and attention-needed concern as they hamper secured and vital information relating to organizations or individuals. Accordingly, timely detection of these vulnerabilities made by intruders is essential, wherein the cornerstone of security ensures the user's data privacy as an intrusion detection system (IDS). On the other hand, with the rapid development of machine learning (ML) and deep learning (DL) methods in the data world, one of their significant applications is dedicated to IDS using state-of-the-art classification algorithms, which has been the subject of numerous research to enhance accuracy and reliability in recent years. As a consequence, this paper presents a hybrid model integrating feature selection, classification, and hyper-parameters optimization. First, the initial massive features are subjected separately to the modified mutual information (MMI), genetic algorithm (GA), and Anova F-value approaches, followed by extracting the common outputs as optimal and reduced final features. Subsequently, a compound CNN and LSTM classifier (CNN-LSTM) is employed, where its hyper-parameters will be determined through a random switch grey wolf-whale optimization algorithm (RS-GWO-WOA) instead of a time-consuming trial and error manual process. Ultimately, to analyze the suggested scheme, a comparison with other strategies in terms of accuracy, precision, recall, F1 score, and periods of time on the NSL-KDD dataset has been accomplished, confirming the superiority of the developed approach.
Keywords: Intrusion Detection System, Feature Selection, Hyper-parameter Optimization, Mutual Information, Genetic Algorithm, Anova F-value, Grey Wolf Optimization Algorithm, Whale Optimization Algorithm -
روش های پیش بینی خطای نرم افزار برای پیش بینی ماژول های مستعد خطا در مراحل اولیه ی توسعه ی نرم افزار استفاده می شوند. امروزه فنون یادگیری ماشین پرکاربردترین فنون مورد استفاده در زمینه ی پیش بینی خطاهای نرم افزار محسوب می شوند. ابعاد بالای داده یکی از مشکلاتی است که عملکرد الگوریتم های یادگیری ماشین را تحت تاثیر قرار می دهد. ابعاد بالای داده به معنای وجود ویژگی های غیر مفید یا افزونه است که احتمالا الگوریتم یادگیری را گمراه کرده و در نتیجه دقت آن را کاهش می دهد. دقت پایین پیش بینی خطای نرم افزار باعث شناسایی دیرهنگام بعضی ماژول های خطادار می شود و در نتیجه تلاش و هزینه ی برطرف کردن خطاها را به صورت غیرعادی بالا می برد. بنابراین حل مشکل ابعاد بالای داده برای افزایش دقت پیش بینی خطای نرم افزار ضروری است. برای کاهش ابعاد داده، محققین از الگوریتم های انتخاب ویژگی استفاده می کنند. الگوریتم های انتخاب ویژگی به دو دسته ی الگوریتم های مبتنی بر فیلتر و الگوریتم های مبتنی بر پوشش تقسیم می شوند. الگوریتم های مبتنی بر پوشش منجر به مدل های پیش بینی با دقت بالاتری می شوند. در این الگوریتم ها می توان از روش های مختلفی برای جستجوی راه حل ها استفاده نمود که بهترین نوع آن جستجوی فراابتکاری است. هر کدام از الگوریتم های فراابتکاری نقاط قوت و ضعفی دارند که محققین برای برطرف کردن این نقاط ضعف از ترکیب این الگوریتم ها استفاده می کنند. در این تحقیق برای بهبود نقاط ضعف هر کدام از الگوریتم های فراابتکاری، از ترکیب سه الگوریتم ژنتیک، کلونی مورچگان و بهینه سازی وال برای انتخاب ویژگی مبتنی بر پوشش استفاده می شود. بدیهی است به کارگیری روش های پیش بینی زودهنگام خطاهای نرم افزار قبل از آزمون واقعی آن، یکی از فنون موثر پدافند غیرعامل در کاهش هزینه های توسعه سامانه های نرم افزاری محسوب می شود. برای ارزیابی روش پیشنهادی، 19 پروژه ی نرم افزاری مورد بررسی و آزمایش قرار گرفته و نتایج با دیگر روش ها مقایسه شده است. نتایج ارزیابی نشان می دهد که روش پیشنهادی از عملکرد بهتری نسبت به سایر روش ها برخوردار است.
کلید واژگان: پیش بینی خطای نرم افزار، انتخاب ویژگی، الگوریتم فراابتکاری، الگوریتم ژنتیک، الگوریتم بهینه سازی وال، الگوریتم کلونی مورچگانSoftware fault prediction methods are used to predict fault-prone modules in the early stages of software development. Machine learning techniques are the most common techniques used in software fault prediction. Data dimensionality is one of the problems that affect the performance of machine learning algorithms. Data dimensionality means the existence of irrelevant or redundant features that may mislead the learning algorithm hence decrease its accuracy. Low accuracy of software fault prediction causes late detection of some faulty modules and as a result increases the effort and cost of fixing faults abnormally. Therefore, solving data dimensionality problem is necessary to increase the accuracy of software fault prediction. Researchers use feature selection algorithms for dimensionality reduction. Feature selection algorithms are divided into two types of filter-based feature selection and wrapper-based feature selection algorithms. Wrapper-based algorithms lead to higher accuracy prediction models. In these algorithms we can use different methods to search for the best solutions that best of them is metaheuristic search. Each of the metaheuristic algorithms has some strengths and weaknesses that researchers use combination of these algorithms to address these weaknesses. In this research, to address the weaknesses of each metaheuristic algorithm, a combination of genetic, ant colony and whale optimization algorithm is used as wrapper feature selection. Obviously, the application of early software faults prediction methods before the actual test is one of the effective passive defense techniques in reducing software systems development costs. 19 software projects are used to evaluate proposed method. Comparison of the results with other methods shows that the proposed method outperforms other methods.
Keywords: software fault prediction, feature selection, Metaheuristic Algorithm, genetic algorithm, Whale optimization algorithm, Ant Colony Optimization
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.