جستجوی مقالات مرتبط با کلیدواژه
تکرار جستجوی کلیدواژه random forest algorithm در نشریات گروه فنی و مهندسی
random forest algorithm
در نشریات گروه پدافند غیرعامل
تکرار جستجوی کلیدواژه random forest algorithm در مقالات مجلات علمی
-
در سال های اخیر، مسئله حفظ امنیت خانه های هوشمند که در آن، تعداد زیادی از وسایل برای برقراری ارتباط از اتصالات اینترنت استفاده می کنند به یکی از دغدغه های اصلی در حوزه امنیت شبکه تبدیل شده است. اگرچه تاکنون پژوهش های زیادی در جهت برقراری امنیت خانه های هوشمند انجام شده است، اما باتوجه به گستردگی موضوع موردبحث، اغلب این کارها در مواردی از جمله دقت و سرعت عمل، کار آیی لازم را ندارند. در روش پیشنهادی پس از انجام برخی عملیات پیش پردازش روی مجموعه داده، به کمک تحلیل مولفه اصلی (PCA)، زیرمجموعه ای از ویژگی های مجموعه داده که به عنوان موثرترین ویژگی ها در تشخیص نفوذ به شمار می - آیند برای آماده سازی داده ها جهت دسته بندی انتخاب شده اند که این عمل منجر به افزایش دقت و سرعت عمل دسته بندی می شود. همچنین در مرحله دسته بندی از الگوریتم جنگل تصادفی که یک الگوریتم قدرتمند مبتنی بر یادگیری ماشین است بر روی یک مجموعه داده بسیار جدید اینترنت اشیا، به نام IoTID20 استفاده شده است. رویکرد پیشنهادی عملکرد بالایی برای تشخیص نفوذ بادقت %99.73 و %98.46 برای دسته بندی حملات دودویی و چند کلاسه نشان داده است. مقایسه ی نتایج روش پیشنهادی با سایر کارهای انجام شده، نشان دهنده ی برتری روش پیشنهادی در تشخیص حملات چند کلاسه است.کلید واژگان: خانه هوشمند، تشخیص نفوذ، تحلیل مولفه اصلی، الگوریتم جنگل تصادفی، مجموعه داده Iotid20In recent years, the problem of maintaining the security of smart homes, where a large number of devices use Internet connections to communicate, has become one of the main concerns in the field of network security. Although a lot of research has been done to establish the security of smart homes, but considering the scope of the topic under discussion, most of these works do not have the necessary efficiency in terms of accuracy and speed of operation. In the proposed method, after performing some pre-processing operations on the dataset, with the help of Principal Component Analysis (PCA), a subset of the features of the dataset are selected to prepare the data for classification, which are the most effective features in intrusion detection. It is considered that this action leads to an increase in the accuracy and speed of the classification action. Also, in the classification stage, the random forest algorithm, which is a powerful algorithm based on machine learning, has been used on a very new dataset of the Internet of Things, called IoTID20. The proposed approach has shown high performance for intrusion detection with an accuracy of 99.73% and 98.46% for the classification of binary and multi-class attacks. Comparing the results of the proposed method with other works, it shows the superiority of the proposed method in detecting multi-class attacks.Keywords: Smart Home, Intrusion Detection, Principal Component Analysis (PCA), Random Forest Algorithm, Iotid20 Dataset
-
رشد روزافزون بدافزارها، از تهدیدات مهم حوزه سایبری است و تشخیص آن ها را همواره با چالش هایی همراه کرده است. فایل های اجرایی بداندیش ویندوزی از طریق دستکاری ویژگی های موجود در سرآیند آن ها و مبهم سازی رفتار خود، فعالیت های مخرب را در سطح سیستم عامل هدف و یا هر برنامه کاربردی دیگر انجام می دهند. تشخیص نمونه های مشکوک بداندیش از میان حجم انبوهی از نمونه های ورودی و همچنین کشف بدافزارهای جدید و ناشناخته از موضوعاتی است که همواره مورد تحقیق پژوهشگران است. در این پژوهش، روشی ترکیبی برای تعیین میزان بداندیش بودن فایل های اجرایی مشکوک پیشنهاد شده است. روش پیشنهادی کاشف، شامل دو ماژول ایستا، برای استخراج ویژگی های سرآیند فایل اجرایی، و دو ماژول رفتاری برای استخراج ویژگی هایی برای تولید امضا و مدل رفتاری بداندیش براساس روش های یادگیری ماشین است. هدف این پژوهش مشکوک یابی فایل های قابل اجرای ویندوزی از میان حجم انبوهی از فایل ها و تعیین میزان بداندیش بودن آن ها است. این روش، بدافزارها را بر اساس میزان احتمال بداندیش بودن اختصاص داده شده به هر فایل تشخیص می دهد. آزمایش ها، درصد بداندیشی شش نوع بدافزار را برای تشخیص گر مبتنی بر سرآیند فایل اجرایی، در بازه 62.7 تا 70 درصد، برای تشخیص گر مبتنی بر یارا، در بازه بین 70.8 تا 78.2درصد، برای تشخیص گر مبتنی بر امضای رفتاری، 98 درصد و برای تشخیص گر مبتنی بر یادگیری ماشین با استفاده از الگوریتم یادگیری جنگل تصادفی 99 درصد نشان می دهد. همچنین نتایج آزمایش ها نشان داد که کاشف با تشخیص 94 درصدی بدافزارهای محافظت شده، بهبود دو درصدی در مقایسه با نتایج 10 محصول مشابه دارد. و با تشخیص 98 درصدی بدافزارهای محافظت نشده، بهبود پنج درصدی در مقایسه با نتایج 10 محصول مشابه دارد.کلید واژگان: بدافزار، فایل اجرایی، تشخیص بدافزار، امضای رفتاری، الگوریتم جنگل تصادفیThe growing number of malware is one of the major threats in the field of cyber and its detection has always been associated with challenges. Windows-based malicious executable files perform malicious activity at the target operating system level or any other application by manipulating features in their header and obscuring their behavior. Detecting suspicious specimens from a large volume of input samples as well as discovering new and unknown malware is one of the topics that is always researched by researchers. In this study, a combined method has been proposed to determine the level of maliciousness of suspicious executable files. Kashif's proposed method consists of two static modules for extracting executable file header properties, and two behavioral modules for extracting signature-generating properties and a thoughtful behavioral model based on machine learning methods. The purpose of this study is to identify suspicious Windows executable files from the large volume of files and determine their maliciousness level. This method detects malware based on the maliciousness probability of being assigned to each file. Experiments showed a malignancy percentage of six types of malware for PE header detector module, in the range of 62.7 to 70%, Yara-based detector module, in the range of 70.8 to 78.2%, Behavioral signature-based detector module, 98% and ML-based detector module by using Random forest learning algorithm has been 99% accuracy. The experimental results also showed that Kashef detected 94% of the protected malware with a 2% improvement compared to the results of 10 similar products. And with 98% detection of unprotected malware, there is a 5% improvement compared to the results of 10 similar products.Keywords: Malware, Executable file, Malware Detection, Behavioral signature, Random Forest Algorithm
-
همگام با گسترش شبکه های کامپیوتری، حملات و نفوذها به این شبکه ها نیز افزایش یافته است. برای داشتن امنیت کامل در یک سامانه کامپیوتری، علاوه بر فایروال ها و دیگر تجهیزات جلوگیری از نفوذ، سامانه های دیگری به نام سامانه های تشخیص نفوذ (IDS) مورد نیاز هستند. هدف از یک سامانه تشخیص نفوذ نظارت بر فعالیت های غیرعادی و افتراق بین رفتارهای طبیعی و غیرطبیعی (نفوذ) در یک سامانه میزبان و یا در یک شبکه است. یک سامانه تشخیص نفوذ را زمانی می توان کارا دانست که نرخ تشخیص نفوذ بالا و به صورت هم زمان نرخ هشدار اشتباه کمی را دارا باشد. در این مقاله روشی جدید جهت طبقه بندی مجموعه داده KDD-Cup-99 معرفی شده است که از ترکیب الگوریتم جنگل تصادفی و الگوریتم ژنتیک حاصل شده است و هدف آن افزایش سرعت فاز یادگیری و آزمون و همچنین دقت روش جنگل تصادفی است. از جنگل تصادفی به دلیل ساختار ساده و کارایی بالای آن در بسیاری از محصولات مبتنی بر یادگیری ماشین استفاده می شود. ولی مانند دیگر الگوریتم های مبتنی بر درخت تصمیم، وجود تعداد زیادی متغیر غیرعددی (نوعی) می تواند برای دقت و سرعت برنامه مشکل ایجاد کند. در مسئله تشخیص نفوذ دقیقا ما با چنین سناریویی مواجه هستیم. نوآوری این مقاله، حل این معضل با استفاده از الگوریتم ژنتیک است. در این مقاله با تعریف کردن معیاری با نام بهره اطلاعات، تعداد ویژگی ها کاهش یافته است.کلید واژگان: تشخیص نفوذ مبتنی بر الگوی رفتاری، داده کاوی، الگوریتم ژنتیک، الگوریتم جنگل تصادفیAs computer networks grow, so attacks and intrusions to these networks are increased. In order to have a fully secure computer network, one needs ‘intrusion detection systems’ (IDS) on top of firewalls. The goal of using an IDS is to supervise the abnormal activities and differentiate between normal and abnormal activities in a host system or in a network. An efficient IDS has high detection rate while keeping a low false alarm rate. In this paper, a new approach to classify KDD-Cup-99 data set using a combination of random forest method and genetic algorithm is presented. The purpose is to increase the speed of learning and test phases while improving the accuracy. Random forest is an ensemble learning method based on decision trees. Due to its relatively simple structure and good performance, it is used in many supervised learning applications. However, like all tree based machine learning algorithms, having too many categorical features, can be a problem both for the speed and accuracy. This is exactly the case with the problem in hand, i.e. intrusion detection; many of the features are in the form of categorical data. For example, in R language, the maximum number of definable categorical features for random forest is 53. The contribution of this work is resolving this issue with the aid of Genetic Algorithm (GA). In this research information gain as a measure of importance is defined and the number of features is reduced based on genetic algorithm.Keywords: Signature-Based Intrusion Detection, Data Mining, genetic algorithm, Random Forest Algorithm
نکته
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.