random forest algorithm
در نشریات گروه برق-
توسعه جاذب های فراسطحی راه حل بالقوه ای برای دستیابی به وزن کم، ضخامت نازک، نرخ جذب مطلوب و ویژگی های قابل قبول جذب امواج تراهرتز ، ارائه می دهد. به منظور بهینه سازی خواص جذب فراسطح ها، معمولا از طیف جذب به عنوان یک معیار ارزیابی مهم استفاده میشود که می تواند بسیاری از ویژگی های مهم مانند مقدار جذب در فرکانس های مختلف را نشان دهد. اما، تحلیل طیف های جذب، به تعداد زیادی پارامترهای ساختاری وابسته است که منابع و زمان زیادی را مصرف می کند، زیرا جذب موج الکترومغناطیسی شامل فرآیندهای تطبیق امپدانس مختلط و تحریک میدان الکتریکی است. برای پرداختن به این موضوع، این تحقیق یک رویکرد یادگیری ماشین مبتنی بر الگوریتم جنگل تصادفی را برای پیش بینی نرخ جذب بر اساس پارامترهای ساختاری پیشنهاد می کند و نیاز به شبیه سازی عددی و زمان تجزیه و تحلیل طیف را کاهش می دهد. با مدل جنگل تصادفی، نرخ جذب با امتیاز R2 بیش از 99/0پیش بینی می شود. علاوه بر این، طرح جاذب پیشنهادی دارای مزایای نازک بودن، غیرحساس بودن به پلاریزاسیون و با زاویه برخورد نسبتا پایدار به واسطه تقارن ساختار است. این مطالعه یک رویکرد عملی و موثر برای طراحی سیستم های پیچیده مرتبط با انتشار موج الکترومغناطیسی جاذب، بازتاب و انتقال ارائه می کند.کلید واژگان: جاذب، طراحی فراسطح، تراهرتز، یادگیری ماشین، الگوریتم جنگل تصادفیThe development of metasurface absorbers offers a potential solution to achieve low weight, thin thickness, favorable absorption rate, and acceptable terahertz absorption characteristics. In order to optimize the absorption properties of metasurfaces, the absorption spectrum is usually used as an important evaluation criterion, which can show many important characteristics such as the rate of absorption at different frequencies. However, the analysis of absorption spectra related to a large number of variable structural parameters is required when designing the structure, which consumes a lot of resources and time, because electromagnetic wave absorption involves the processes of complex impedance matching and electric field excitation. To address this issue, this study proposes a machine learning approach based on a random forest algorithm to predict absorption rates based on structural parameters, reducing the need for numerical simulation and spectrum analysis time. With the random forest model, the absorption rate is predicted with the R2 score of more than 0.99. In addition, the proposed absorber design has the advantages of being thin, insensitive to polarization and with a relatively stable incident angle, due to the symmetry of the structure. This study presents a practical and effective approach for the design of complex systems related to absorbing, reflecting and transmitting electromagnetic wave propagation.Keywords: Absorber, Metasurface Design, Terahertz, Machine Learning, Random Forest Algorithm
-
در این پژوهش رویکردی نوین برای بخش بندی تصویر بر اساس الگوریتم ژنتیک و جنگل تصادفی معرفی می گردد. در بخش بندی تصویر سعی می شود اجزاء مختلف تصویر از یکدیگر جدا شوند. در این فرایند به تمامی پیکسل های داخل تصویر برچسبی داده می شود؛ به نحوی که پیکسل های با برچسب یکسان ویژگی های مشترکی را داشته باشند. در روش پیشنهادی این ویژگی ها با استفاده از فیلترهای تصویری به دست آورده می شود. با ترکیب این ویژگی ها و با الگوریتم جنگل تصادفی به عنوان طبقه بند بخش بندی تصاویر انجام می شود. فیلترهای تصویری استفاده شده دارای تعدادی ابرپارامتر می باشند که تنظیم صحیح این ابرپارامترها بر کارایی الگوریتم موثر است. در این مقاله انتخاب این ابرپارامترها توسط الگوریتم ژنتیک انجام می شود. ابر پارامترهای فیلترهای گابور به عنوان ژن های کروموزوم الگوریتم ژنتیک در نظر گرفته می شود. تابع برازندگی f1-score حاصل از اجرای الگوریتم جنگل تصادفی برای بخش بندی تصویر تعریف می شود. یافتن مقادیر مناسب ابر پارامترهای فیلترهای گابور و افزایش f1-score در بخش بندی تصویر نسبت به سایر روش های مورد بررسی از دستاوردهای این پژوهش است.
کلید واژگان: بخش بندی تصویر، الگوریتم ژنتیک، الگوریتم جنگل تصادفیIn this research, a new approach for image segmentation based on genetic algorithm and random forest is presented. Image segmentation can be done using supervised learning. In this learning, there are a number of images from data set with their labels. In image segmentation, different parts of the image separate from each other. In this process, all the pixels in the image are given a label, so that the pixels with the same label have common characteristics with each other. To provide a model that can perform image segmentation, it is necessary to extract features from input images and perform segmentation using a suitable classifier and these features. Image feature extraction is done using image filters. In this research, a hybrid combination of 4 Gabor filter banks and Sobel, Prewitt, Canny edge, Scharr, Gaussian, median, and Roberts filters are used for effective feature extraction. One of the most important of these filters, which also has a degree of freedom, is the Gabor filter. This filter has a number of hyperparameters that change the efficiency of the classifier by changing these hyperparameters. In this research, an attempt has been made to adjust these hyperparameters using genetic algorithm. The fitness function proposed in this research is f1-score. random forest classifier is utilized for image segmentation and classification. The results of the experiments show that the hyperparameters found by the genetic algorithm have been able to perform a satisfactory segmentation on data set.
Keywords: Image Segmentation, Genetic Algorithm, Random Forest Algorithm -
علی رغم تمام تلاش متخصصان امنیتی برای کشف حملات تزریق SQL، اما بر اساس گزارش OWASP، کماکان حمله تزریق SQL به عنوان مهم ترین و زیان بارترین حمله سایبری توسط مهاجمین مورد استفاده قرار می گیرد. به منظور تشخیص حملات از دو روش مبتنی بر امضاء و مبتنی بر رفتار استفاده می شود. روش های مبتنی بر امضاء برای حملات شناخته شده کاربرد دارند و روش های مبتنی بر رفتار برای تشخیص حملات ناشناخته مناسب هستند. از آنجایی که حملات به روش های مختلفی پیاده سازی می شوند سیستم های تشخیص نفوذ مبتنی بر رفتار، کاربرد بیشتری دارند. رفتار را می توان با استفاده از روش هایی مانند طبقه بندی، خوشه بندی و غیره تحلیل کرد. یکی از مهم ترین الگوریتم های طبقه بندی، الگوریتم جنگل تصادفی است که دقت بالایی دارد و از طرفی پیاده سازی و تفسیر نتایج با استفاده از این الگوریتم به سادگی قابل انجام است. با توجه به بررسی های انجام شده دقت الگوریتم جنگل تصادفی به شدت وابسته به پارامترهای ورودی آن است. این پارامترها شامل 9 مورد ازجمله تعداد درخت ها، عمق آن ها، نحوه رای گیری، بهره اطلاعاتی و غیره است. تعیین بهینه این پارامترها یک مسئله بهینه سازی با فضای حالت بزرگ است. در این پژوهش روشی بر اساس الگوریتم ژنتیک برای تعیین مقادیر بهینه این پارامترها ارایه شده است. در اثر تعیین بهینه پارامترها، نتایج به دست آمده در مقایسه با حالت پیش فرض الگوریتم و سایر تحقیقات، بهبود دقت تشخیص را نشان می دهد. نتایج ارزیابی حاکی از آن است که دقت تشخیص نفوذ در روش پیشنهادی، 98% بوده است که در مقایسه با الگوریتم جنگل تصادفی با پارامترهای پیش فرض حدودا 11% و در مقایسه با پژوهش های قبلی 08% دقت تشخیص، افزایش یافته است.
کلید واژگان: الگوریتم جنگل تصادفی، الگوریتم ژنتیک، حمله تزریق SQL، سیستم تشخیص نفوذ پایگاه دادهJournal of Command and Control Communications Computer Intelligence, Volume:5 Issue: 1, 2022, PP 87 -98Despite all the efforts of security experts to detect SQL injection attacks, according to OWASP report’s, SQL injection attack is still used as the most important cyber attack by attackers. In order to detect attacks, two methods are used: signature-based and behavior-based. Signature-based methods are used for known attacks, and behavior-based methods are suitable for detecting unknown attacks. Behavior-based intrusion detection systems are more useful because attacks are implemented in different ways. Behavior can be analyzed by methods such as classification, clustering, etc. One of the most important classification algorithms is the random forest algorithm which has high accuracy and on the other hand the implementation and interpretation of the results can be done easily using this algorithm. According to the studies, the accuracy of the random forest algorithm is highly dependent on its input parameters. These parameters include 9 items, including the number of trees, their depth, voting method, information gain, and so on. Optimal determination of these parameters is an optimization problem with large state space. In this research, a method based on genetic algorithm to determine the optimal values of these parameters is presented. Due to the optimal determination of the parameters, the obtained results show an improvement in the detection accuracy compared to the default state of the algorithm and other researches. The evaluation results indicate that the intrusion detection accuracy in the proposed method was %98, which is about %11 higher than the random forest algorithm with default parameters and %08 higher than previous studies.
Keywords: Random forest algorithm, Genetic algorithm, SQL injection attack, Database intrusion detection system -
باتوجه به افزایش جمعیت و اینکه منابع انرژی رو به کاهش است، در این تحقیق به مطالعه انرژی مصرفی خانگی پرداخته شده است. هدف از این پژوهش پیش بینی عوامل موثر بر انرژی مصرفی خانگی می باشد. برای این پیش بینی از سه الگوریتم قواعدM5 ، نزدیک ترین همسایه و جنگل تصادفی استفاده شده است که در نرم افزار weka موجود می باشد. در این پژوهش از الگوریتم ارزیابی همبستگی ویژگی ها برای انتخاب بهترین عوامل نیز استفاده شده است. این الگوریتم مهمترین عوامل موثر بر انرژی مصرفی و میزان تاثیر آنها را مشخص می کند. نتایج حاصل از این بررسی نشان می دهد که چراغ ها و وسایل روشنایی، درجه حرارت و دما در اتاق نشیمن، درجه حرارت و دما در خارج از ساختمان، درجه حرارت و دما در خارج از ایستگاه هواشناسی چیورس، سرعت وزیدن باد، رطوبت در منطقه آشپزخانه و درجه حرارت و دما در محل لباسشویی بیشترین تاثیر را در مصرف انرژی خانگی دارد. همچنین از بین الگوریتم های آزموده شده، جنگل تصادفی بهترین نتیجه را به دست می دهد.
کلید واژگان: انرژی مصرفی خانگی، الگوریتم M5Rules، الگوریتم نزدیکترین همسایه، الگوریتم جنگل تصادفی، ارزیابی همبستگی ویژگی ها، وسایل روشنایی، دما، ایستگاه هواشناسی چیورسDue to increasing population and decreasing energy sources, this research studies the consumption of domestic energy. The purpose of this study is to predict the factors affecting household energy consumption. To do this, we use 3 algorithms, M5Rules, K-nearest neighbor and random forest, available in Weka software. In this study, the feature correlation algorithm is used to select the most important factors affecting energy consumption and their impact. The results show that lights and fixtures, temperature of the living room, outside temperature, temperature outside of Chievres Station, wind speed, humidity in the kitchen and the temperature in the laundry area have the most impact on household energy consumption. Among the methods, random forest algorithm presented the best results.
Keywords: Household Energy Consumption, M5Rules Algorithm, K-NN, Random Forest Algorithm, Correlation Evaluation of Properties, Lighting Devices, Temperature, Chievers Weather Station -
این مقاله روشی مبتنی بر استراتژی های یادگیری ماشین برای حل مسئله مکان یابی خطا در خطوط انتقال جریان مستقیم ولتاژ بالا (HVDC) ارائه می دهد. در روش مکان یابی پیشنهادی، تنها از سیگنال ولتاژ پس از خطای اندازه گیری شده از یک پایانه برای استخراج ویژگی های موردنیاز بهره گیری می شود. در این مقاله، متناسب با بعد بالای بردار ویژگی های ورودی، امکان استفاده از دو تخمین گر متفاوت شامل شبکه عصبی رگرسیون تعمیم یافته (GRNN) و الگوریتم جنگل تصادفی (RF) برای یافتن رابطه موجود بین ویژگی های الگوها و مکان وقوع خطا مورد بررسی قرار می گیرد. نتایج ارزیابی با استفاده از الگوهای یادگیری و تست بدست آمده از شبیه سازی انواع خطاها در یک خط انتقال هوایی بلند و بر اساس مقادیر مختلف محل وقوع خطا، مقاومت خطا و جریان پیش از خطا، نشان دهنده کارآیی و دقت قابل قبول روش پیشنهادی می باشند.
کلید واژگان: مکان یابی خطا، خطوط انتقال HVDC، شبکه عصبی رگرسیون تعمیم یافته، الگوریتم جنگل تصادفیThis paper presents a novel method based on machine learning strategies for fault locating in high voltage direct current (HVDC) transmission lines. In the proposed fault-location method، only post-fault voltage signals measured at one terminal are used for feature extraction. In this paper، due to high dimension of input feature vectors، two different estimators including the generalized regression neural network (GRNN) and the random forest (RF) algorithm are examined to find the relation between the features and the fault location. The results of evaluation using training and test patterns obtained by simulating various fault types in a long overhead transmission line with different fault locations، fault resistance and pre-fault current values have indicated the efficiency and the acceptable accuracy of the proposed approach.Keywords: Fault Location, HVDC Transmission Lines, Generalized Regression Neural Network, Random Forest Algorithm
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.