به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

clustering

در نشریات گروه فنی و مهندسی
  • S. Haghzad Klidbary *, M. Javadian
    In analyzing phenomena around us, clustering is among the most commonly used techniques in machine learning for comparing, and categorizing them into different groups based on intrinsic features. One of the main challenges facing clustering algorithms is selecting a suitable representative for each cluster. Existing algorithms often choose a single representative, which can lead to suboptimal performance on many datasets (especially asymmetric datasets). This process is completely dependent on the type of internal distribution of the clusters, and that single point may not be a suitable representative for that cluster. The proposed algorithm for dealing with datasets, inspired by the fuzzy ALM method and avoiding complex formulas, and calculations, initially breaks the system down into simpler (two-dimensional) systems. After spreading ink drops, by finding the vertical Narrow path and the horizontal narrow path, it selects a set of points as the representation of each cluster. The proposed algorithm, unlike many conventional algorithms, provides a representative set for each cluster and also enhances the algorithm's performance in dealing with datasets that have an asymmetric structure by introducing a new distance measure based on the KNN method and utilizing the set of prime numbers. The Accuracy, F1-Score, and AMI achieved when working with many low-dimensional, and high-dimensional datasets has been higher compared to algorithms such as FUALM, HiDUALM, K-Means, DBSCAN, DENCLUE and IRFLLRR and in some cases, the achieved accuracy has been equal to 100 percent.
    Keywords: Clustering, Similarity Measure, Fuzzy Logic, Ink Drop Spread, Active Learning Method, High-Dimensional Clustering
  • جواد جهان آرا*، حسین سهلانی

    امروزه شبکه های اجتماعی، محل حکمرانی و بستری مناسب برای دشمنان کشور شده است. در جریان تجمع هایی که گاهی در کشور رخ داده، به درستی اثبات شده که شبکه های اجتماعی و پیام رسان های خارجی، محلی برای ساماندهی، مدیریت، تحریک، ترغیب و حتی آموزش جوانان برای اغتشاش و خرابکاری بوده است. هدف از این مطالعه این است که چگونه یادگیری ماشین می تواند توسط نهادهای امنیتی یا انتظامی برای کشف، پیشگیری و مقابله با تجمعات غیرقانونی با سرعتی بسیار دقیق و سریع استفاده شود. برای دستیابی به این هدف تعداد 73 مقاله در بازه زمانی 2012 تا 2023 که در آن از روش های یادگیری ماشین استفاده شده موردبررسی قرار گرفته است. بااین حال شبکه های عصبی مصنوعی با 44%، روش های جنگل تصادفی با 30% و روش K - نزدیک ترین همسایه با 26% متداول ترین روش های مورداستفاده بودند. همچنین 62% از پژوهشگران از مجموعه داده های مجرمانه برخط پورتال های عمومی بر روی شبکه اینترنت و 38% نیز از مجموعه داده های رسمی و خصوصی سازمان های قانونی ازجمله پلیس در تحقیقات خود استفاده نموده اند. نتایج تحقیق نشان می دهند که به کارگیری روش های جنگل تصادفی بهترین کارایی را داشته است اما برای مجموعه داده های بزرگ، استفاده از روش های شبکه عصبی مصنوعی بهترین نتایج را برای پیش بینی وقوع جرم بر اساس زمان و مکان آن برآورده ساخته است.

    کلید واژگان: یادگیری ماشین، شبکه های عصبی مصنوعی، تجمع، فراخوان
    Javad Jahanara *, Hossein Sahlani

    Nowadays, social networks have become a governing space and a suitable platform for the enemies of the country. During occasional protests that occur in the country, it has been properly demonstrated that social networks and foreign messengers serve as a place for organizing, managing, inciting, encouraging, and even educating young people for disruption and vandalism. The aim of this study is to show how machine learning can be utilized by security or law enforcement agencies to detect, prevent, and counter illegal gatherings with high precision and speed. To achieve this goal, a total of 73 articles published between 2012 and 2023, which employed machine learning methods, were examined. However, artificial neural networks were the most common method used, accounting for 44%, followed by random forest methods at 30%, and K-nearest neighbor methods at 26%. Additionally, 62% of researchers utilized online criminal datasets from public portals on the internet, while 38% used official and private datasets from legal organizations such as the police in their research. The results indicate that the use of random forest methods had the best performance, but for large datasets, the use of artificial neural networks yielded the best results for predicting crime occurrence based on time and location.

    Keywords: Machine Learning, Artificial Neural Networks, Clustering, Recall
  • Gholamreza Farahani*

    Recent advances in energy harvesting technology cause Wireless Sensor Networks (WSNs) to be one of the most common communications in different fields. In this paper, a new and appropriate solution based on geographic routing in WSNs with mobile stations is presented to decrease the number of routings and ultimately reduce the usage of energy in the network. In the proposed method named Geographic Routing with the Mobile Sink (GRMS), in the process of selecting the Cluster Head (CH) element, each node that is selected as the CH announces its new role to the other network nodes. By announcing this information, other nodes are also connected to the cluster. In each cluster, the CH creates and broadcasts a schedule in the cluster that contains the time slots assigned to each cluster member. The proposed GRMS method is compared with GEAR, GAF, and GMR methods. The simulation results show that the GRMS has reduced energy consumption compared to GEAR, GAF, and GMR methods. Also, the end-to-end delay in packet delivery has decreased and the number of dead nodes has decreased

    Keywords: Wireless Sensor Network, Geographic Routing, Clustering, Mobile Station
  • Humairah Mansor, Shazmin Aniza Abdul Shukor*, Razak Wong Chen Keng, Nurul Syahirah Khalid

    Building fixtures like lighting are very important to be modelled, especially when a higher level of modelling details is required for planning indoor renovation. LIDAR is often used to capture these details due to its capability to produce dense information. However, this led to the high amount of data that needs to be processed and requires a specific method, especially to detect lighting fixtures. This work proposed a method named Size Density-Based Spatial Clustering of Applications with Noise (SDBSCAN) to detect the lighting fixtures by calculating the size of the clusters and classifying them by extracting the clusters that belong to lighting fixtures. It works based on Density-Based Spatial Clustering of Applications with Noise (DBSCAN), where geometrical features like size are incorporated to detect and classify these lighting fixtures. The final results of the detected lighting fixtures to the raw point cloud data are validated by using F1-score and IoU to determine the accuracy of the predicted object classification and the positions of the detected fixtures. The results show that the proposed method has successfully detected the lighting fixtures with scores of over 0.9. It is expected that the developed algorithm can be used to detect and classify fixtures from any 3D point cloud data representing buildings.

    Keywords: Clustering, Fixtures, Heuristic, Point Cloud Data, Segmentation
  • Moslem Jahantigh, Hamidreza Ramazi *

    Various methods have been used for clustering big data. Pattern recognition methods are suitable methods for clustering these data. Due to the large volume of samples taken in the drilling of mines and their analysis for various elements, this category of geochemical data can be considered big data. Examining and evaluating drilling data in the Lar copper mine in Sistan and Baluchistan province located in the southeast of Iran requires the use of these methods. Therefore, the main goal of the article is the clustering of the drilling data in the mentioned mine and its zoning of the geochemical data. To achieve this goal, 3500 samples taken from drilling cores have been used. Elemental analysis for six elements has been done using the ICP-Ms method. Pattern recognition methods including SOM and K-MEANS have been used to evaluate the relation between these elements. The silhouette method has been used to determine and evaluate the number of clusters. Using this method, 4 clusters have been considered for the mentioned data. According to this method, it was found that the accuracy of clustering is higher in the SOM method. By considering the 4 clusters, 4 zones were identified using clustering methods. By comparing the results of the two methods and using the graphical method, it was determined that the SOM method has a better performance for clustering geochemical data in the studied area. Based on that, zones 2 and 4 were recognized as high-grade zones in this area.

    Keywords: Clustering, SOM, KMEANS, Drilling, Silhouette
  • زهرا مومنی قهفرخی، مهدیه قزوینی*، امید عابدی
    یکی از مصداق های هوشمند سازی، توسعه زیرساخت های حمل ونقل با استفاده از شبکه های موردی بین خودرویی است که باعث ایجاد معماری های جدیدی بر پایه رایانش ابری و مه شده است. تحرک و سرعت بالای وسایل نقلیه، منجر به بی ثباتی در این نوع شبکه ها و ایجاد موانعی در اشتراک گذاری مطمئن اطلاعات می شود. راه حل های مبتنی بر خوشه بندی به عنوان یک راه حل بهینه برای پایداری شبکه، دستیابی به امکانات مختلف مانند کیفیت خدمات و انتشار اطلاعات هستند. ازجمله مسائلی که در پایداری خوشه نقش موثری دارند می توان به نحوه ساخت خوشه، روش های انتخاب سرخوشه و نحوه انتقال داده ها اشاره کرد. به عبارتی چالش اصلی در این شبکه ها، نحوه خوشه بندی و انتخاب سرخوشه است. یکی از معایب اصلی الگوریتم های خوشه بندی ناپایداری خوشه و انتخاب نامناسب سرخوشه است. در این پژوهش، یک روش خوشه بندی دوسطحی برای شبکه های موردی بین خودرویی ارائه شده است که سطح پایین آن (سطح نزدیک به خودروها) به عنوان مه و سطح بالای آن (سطح نزدیک به زیرساخت) به عنوان ابر نام گذاری شده است. ارسال داده های محلی و ساختارهای مربوط به مدیریت موقعیت، در سطح مه انجام می پذیرند و سایر عملیات که مربوط به انتقال داده به زیرساخت و در برخی مواقع محاسبات توزیع شده می باشند از طریق ابر انجام می شوند. روش پیشنهادی خوشه بندی را با معیارهای سرعت، جهت و موقعیت مکانی انجام می دهد و با انتخاب سرخوشه مناسب پایداری خوشه را بیشتر می کند کار دیگری که روش پیشنهادی انجام می دهد جایگزینی به موقع سرخوشه برای جلوگیری از بین رفتن خوشه است. به علاوه، با ارائه یک الگوریتم مسیریابی مبتنی بر پیش بینی نحوه ی حرکت خودروها بار بین سرخوشه، ابر و خودرو تقسیم می شود که این تقسیم بندی وظایف بین مه و ابر ضمن کاهش بار روی زیرساخت شبکه، با متعادل سازی بار بین مه و ابر، می تواند باعث بهبود هم زمان سربار و کیفیت سرویس شبکه موردی بین خودرویی شود. یکی دیگر از معایب روش ها تاخیر در ارسال اطلاعات است که روش پیشنهادی با انجام پیش بینی و ارسال درست اطلاعات تاخیر را کاهش می دهد. نتایج حاصل از شبیه سازی ها نشان می دهد که روش پیشنهادی در مقایسه با روش های مشابه، از تعداد گام کمتری برای ارسال اطلاعات استفاده می کند و تاخیر، نرخ تحویل و سربار خوشه بندی را به طور متوسط به ترتیب 41، 18 و 29 درصد بهبود می بخشد.
    کلید واژگان: رایانش ابری، رایانش مه، پیش بینی، خوشه بندی VANET
    Zahra Momeni Ghahfarokhi, Mahdieh Ghazvini *, Omid Abedi
    Vehicular ad hoc networks is one of the examples of intelligentization is the development of transportation infrastructure , which has led to the creation of new architectures based on cloud and fog computing. Mobilility and high speed of vehicles lead to instability in these types of networks and create obstacles in reliable information sharing. Clustering-based solutions are an optimal solution for network stability, achieving various features such as service quality and information dissemination. Among the issues that play an effective role in the stability of the cluster, we can mention how to build the cluster, how to choose the cluster head, and how to transfer data. In other words, one of most important challenges in these networks is how to cluster and select the cluster head. One of the main disadvantages of clustering algorithms is cluster instability and inappropriate cluster head selection. In this research, a two-level clustering method for case networks between vehicles is presented, whose lower level (the level close to the cars) is named as fog and its upper level (the level close to the infrastructure) is named as the cloud. Local data transmission and location management structures are performed at the fog level, and other operations related to data transfer to the infrastructure and sometimes distributed computing are performed through the cloud. The proposed method performs clustering with the criteria of speed, direction and location, and increases the stability of the cluster by selecting the appropriate cluster head. In addition, by providing a routing algorithm based on predicting the way cars move, the load is divided between the cluster head, the cloud, and the car. It can simultaneously improve the overhead and service quality of the inter-vehicle ad hoc network. Another disadvantage of the methods is the delay in sending information. The proposed method reduces the delay by making predictions and sending information correctly. The results of simulations show that compared to similar methods, the proposed method uses fewer steps to send information and improves the delay, delivery rate, and clustering overhead by 41, 18, and 29 percent respectively.
    Keywords: VANET, Cloud Computing, Fog Computing, Prediction, Clustering
  • Masoumeh Akbarzadeh, Houshang Taghizadeh *, Majid Bagherzadeh Khajeh

    The purpose of this study is to design and analyze a model for exit strategies from recession in companies operating in the automotive parts manufacturing industry. This study is of a developmental-applied nature and follows a mixed-methods approach (qualitative and quantitative). The qualitative section is based on a multi-grounded theory approach to develop a qualitative model of dimensions, combining empirical exploratory findings (interviews) and theoretical exploratory findings (meta-synthesis of scientific documents). Quantitative analyses were conducted using the fuzzy cognitive map approach and clustering of companies based on k-means partitioning. The validity of the qualitative findings was confirmed using content validity for constructs and the opinions of external experts. The quantitative research population consisted of two groups: an expert panel of 18 individuals and managers and directors of automotive parts manufacturing companies located in northwest Iran. The expert panel was selected through purposive sampling, while the sample of companies, comprising 360 firms, was selected using stratified random sampling based on provincial distribution. The qualitative findings identified a model of exit strategies from recession for automotive parts manufacturers within a framework of 63 key concepts, 11 subcategories, and 3 major categories. The quantitative findings resulted in the development of a relational model comprising one sender node, two receiver nodes, and eight central nodes. Company clustering identified three major clusters of firms in response to recession exit strategies. The overall analysis of corporate exit strategies from recession indicated that automotive parts manufacturers should adopt a long-term plan focused primarily on transformation-oriented strategies to achieve a suitable level of competitiveness and competitive advantage in the business environment.

    Keywords: Supply Chain Management Strategies, Recession, Automotive Component Manufacturing Industry, Clustering
  • Vahid Golmah, Golsa Mirhashemi*

    Data visualization is a key component of undirected data mining that it transforms data, information, and knowledge into visual view. In this paper, we formulate data visualization problem as a quadratic assignment problem (DV-QAP). The QAP is an NP-Hard problem and has high complexity that it is more acute for data visualization problem because it has intense dependencies among variables and big search space. Therefore, the exact approaches are inefficient to solve DV-QAP and we introduce a new technique called Distributed Self Adaptive Genetic Algorithm with Migration (DSAGAM) that their parameters adjust to increases the exploration and exploitation. This paper focuses on the effect of controlling the migration process and adjusting parameters with respect to the fitness to explore such big search spaces to improve solutions quality. Then we demonstrate the efficiency of the model for a real data set compared with the SGA, SAMGA, IGA and Sammon's mapping approaches.

    Keywords: Data Visualization, Adaptive Genetic Algorithms, Quadratic Assignment Problem, Clustering
  • Armin Mokhtari, Seyed Hamed Moosavirad *, Siavash Bayat, Alireza Eftekhari
    Data can enhance equipment maintenance and asset management by providing predictive insights and minimizing downtime. Implementing data gathering and predictive maintenance systems is essential for improving reliability and cost efficiency. However, addressing challenges such as high implementation costs, data integration issues, and the need for skilled personnel is crucial for maximizing their benefits. Maintenance managers at a steel holding company in Iran, as a case study aimed to implement predictive maintenance but faced high costs for full implementation. Selecting a subset of equipment parts posed a complex decision-making problem, as eligibility needed to be based on maintenance criteria rather than traditional factors like price and location. To address this, we proposed a framework using machine learning to cluster equipment parts based on maintenance-related criteria. While clustering simplifies decision-making, it introduces uncertainty. To mitigate this, we represent each cluster with a trapezoidal fuzzy number. The Silhouette method is employed to determine the optimal number of clusters, followed by the K-means++ method for clustering. Our approach successfully grouped 201 equipment parts into seven clusters based on criteria such as importance, maintenance period, and daily working hours. Fuzzy logic is used to interpret the clusters, reducing uncertainty and ensuring that no equipment is overlooked.
    Keywords: Clustering, Condition Monitoring, Maintenance, Trapezoidal Fuzzy Numbers, Unsupervised Machine Learning
  • Nima Moradi *, Mosayeb Jalilian

    Nowadays, online shopping plays a vital role in providing services and delivering goods to customers in the context of business intelligence and e-commerce. This research analyzes the customer purchase data of an Iranian online shopping company in Tehran. Among the available datasets provided by the company, 200 thousand records of one week of transactions have been selected for the present study. Several classification methods (i.e., Random Forest, gradient-boosted trees, K-Nearest Neighbor (KNN), Naïve Bayes, Kernel Naïve Bayes, and Neural Networks) and clustering approaches have been applied to discover the knowledge and patterns. The results show that before balancing the dataset, the KNN algorithm with K=5 is the best classification method among the existing methods. However, after balancing, gradient-boosted trees outperform the other classification methods. For clustering methods, the results show that the K-Means algorithm with K=3 is more efficient regarding the average within centroid distance for each cluster. Finally, concluding remarks and suggestions for future studies are stated.

    Keywords: Online Shopping, Data Mining, Classification, Clustering
  • ایمان احمدی*

    هدف از پژوهش حاضر ایجاد نقشه مکانی- زمانی گسترش سامانه های آبیاری نوین در استان های ایران با استفاده از کتابخانه t-map نرم افزار R-Studio است. داده های خام مورد استفاده در این پژوهش از جداول آماری ارائه شده توسط مرکز آمار وزارت جهاد کشاورزی در مورد توسعه سامانه های آبیاری پیشرفته در استان های ایران در دوره زمانی سال های 1388 تا 1401 به دست آمد. همچنین در این پژوهش خوشه بندی استان های کشور با توجه به معیارهای درصد تکمیل سامانه های آبیاری مدرن، درصد توسعه شبکه های آبیاری و زه کشی و درصد پوشش انهار و کانال های سنتی به صورت تجمعی تا سال 1401، انجام شد. به صورت اجمالی روش کار به این صورت بود که ابتدا با استفاده از داده های خام، فایل اکسلی آماده سازی شد که محتوای آن سازگار با اطلاعات جغرافیایی مربوط به استان های ایران باشد. سپس به کمک توابع نرم افزار R-Studio ادغام محتوای فایل اکسل و اطلاعات جغرافیایی انجام شد و در نهایت با استفاده از توابع کتابخانه t-map، نقشه های مکانی-زمانی تهیه شد. برای انجام خوشه بندی، از توابع کتابخانه factoextra استفاده شد. توابع موجود در این کتابخانه قادر به استانداردسازی داده ها قبل از انجام فرآیند خوشه بندی به روش های مختلف هستند. بر اساس نتایج به دست آمده از 6014211 هکتار زمین های زراعی دارای کشت آبی، 2469835 هکتار به سیستم های آبیاری نوین تجهیز شده اند که بیانگر تکمیل 41 درصدی این سامانه ها در کل کشور است. درصد توسعه شبکه های آبیاری و زه کشی و درصد پوشش انهار و کانال های سنتی به ترتیب برابر با 15% و 5/0% به دست آمد. از سوی دیگر نقشه مکانی-زمانی درصد تکمیل سامانه های آبیاری نوین نشان داد که در استان های پیشرو در کشت آبی استقبال از این سامانه ها کمتر از سایر استان ها بوده است، مثلا استان های خوزستان و فارس که به صورت تجمعی 31 درصد از اراضی کشت آبی را در اختیار دارند بترتیب 9% و 18% در استقرار سامانه های آبیاری نوین پیشرفت داشته اند. لازم به ذکر است که هرچند استقرار سامانه های آبیاری پیشرفته به افزایش راندمان آبیاری در سطح مزرعه منجر می شود، اما با توجه به گزارش های سایر محققین، برای موثر بودن استقرار این سامانه ها بر روی افزایش سطح سفره های آب زیرمینی، وجود کنتورهای هوشمند برای چاه های کشاورزی تغذیه کننده این سیستم های آبیاری الزامی است.

    کلید واژگان: سامانه های آبیاری پیشرفته، خوشه بندی، نرم افزار R-Studio، نقشه مکانی- زمانی
    Iman Ahmadi*

    The purpose of this research is to create a spatio-temporal map illustrating the expansion of modern irrigation systems across Iran's provinces using the t-map package in R-Studio. The raw data used in this research was obtained from the statistical tables provided by the statistics center of the Ministry of Agricultural Jihad regarding the development of advanced irrigation systems in Iran from 2009 to 2022. First, an Excel file was prepared using the raw data, ensuring its compatibility with the geographical information of Iran's provinces. This data was then integrated with geographic information in R-Studio software, and spatio-temporal maps were generated using the functions of the t-map package. For clustering analysis, functions from the factoextra package were used. This package allows for data standardization before clustering using various methods. Moreover, in this research, Iran's provinces were clustered according to three criteria: the percentage of completion of modern irrigation systems, the percentage of development of irrigation and drainage networks, and the percentage of coverage of traditional irrigation canals in 2022. The findings indicate that out of 6,014,211 hectares of irrigated agricultural land, 2,469,835 hectares have been equipped with modern irrigation systems, reflecting an average implementation rate of 41% nationwide. Furthermore, the development percentages of irrigation and drainage networks and the coverage of traditional canals were found to be 15% and 0.5%, respectively. The spatio-temporal map of modern irrigation system implementation revealed that provinces with the most extensive irrigated agriculture exhibited lower adoption rates of these systems compared to others. For example, Khuzestan and Fars, which cumulatively account for 31% of the country's irrigated lands, have only progressed by 9% and 18%, respectively, in establishing new irrigation systems. It is important to note that while advanced irrigation systems enhance irrigation efficiency at the farm level, their significant effect on levels of groundwater table requires the presence of smart meters for agricultural wells that supply these systems.

    Keywords: Modern Irrigation Systems, Clustering, R-Studio Software, Spatial-Temporal Map
  • بهبود سرعت سیستم تشخیص نفوذ از طریق کاهش حجم داده ها با استفاده از DBSCAN مبتنی بر هسته
    سید ابوالفضل شاهزاده فاضلی*، اعظم قوه ندوشن، جمال زارع پور احمدآبادی

    اینترنت اشیاء یک فناوری به سرعت در حال تکامل است که دستگاه های فیزیکی را از طریق سیستم های شبکه ای به هم متصل می کند. بااین حال، همان طور که اینترنت اشیاء به گسترش خود ادامه می دهد، چالش های امنیتی مختلفی را ایجاد می کند که نیازمند راه حل های مناسب برای محافظت از اطلاعات حساس و حریم خصوصی کاربران است. این مقاله بر روی بهبود سرعت سیستم تشخیص نفوذ به عنوان یک راه حل حیاتی برای امنیت اینترنت اشیاء تمرکز دارد. در سیستم های تشخیص نفوذ، وجود حجم زیاد داده موجب کاهش سرعت یادگیری می شود. در این مقاله، الگوریتم خوشه بندی DBSCAN با افزودن پارامتر حداقل همسایگی جهت کاهش هدفمند نمونه ها اصلاح شده است، که سعی در افزایش سرعت سیستم تشخیص نفوذ و کاهش زمان و هزینه یادگیری دارد. تنظیم پارامترهای DBSCAN اصلاح شده با الگوریتم ژنتیک انجام می شود. نتایج آزمایش ها بر روی مجموعه داده Kaggle و NSL_KDD نشان می دهد که مدل پیشنهادی قادر است با کاهش تا 80٪ از حجم داده ها، دقت طبقه بندی را برای مجموعه داده Kaggle بالای 96٪ و برای مجموعه داده NSL_KDD بالای 51/92٪ حفظ نماید. همچنین، زمان محاسبات برای مجموعه داده Kaggle از ms09/458 بهms 21/47 و برای مجموعه داده NSL_KDD ازms 2/995 بهms 60/223، کاهش یافته است. به این ترتیب، با وجود بهبود در سرعت و کاهش زمان و هزینه، عملکرد مطلوب مدل حفظ شده است.

    کلید واژگان: اینترنت اشیاء، سیستم تشخیص نفوذ، الگوریتم درخت طبقه بندی و رگرسیون، DBSCAN، RN، مجموعه داده Kaggle، مجموعه داده NSL، KDD
    Improving the speed of the intrusion detection system performance by reducing the data volume using kernel-based DBSCAN
    Seyed Abolfazl Shahzadeh Fazeli *, Azam Ghoveh Nodoushan, Jamal Zarepour-Ahmadabadi

    The Internet of Things (IoT) is a rapidly evolving technology that connects physical devices through networked systems. However, as IoT continues to expand, it poses various security challenges that require appropriate solutions to protect sensitive information and user privacy. This paper focuses on improving the speed of intrusion detection systems (IDS) as a critical solution for IoT security. In IDS, the large volume of data can slow down the learning process. In this paper, the DBSCAN clustering algorithm is modified by adding a minimum neighborhood parameter to reduce data samples in a targeted manner, aiming to enhance the speed of IDS and reduce learning time and costs. The parameters of the modified DBSCAN are tuned using a genetic algorithm. Experimental results on the Kaggle and NSL_KDD datasets demonstrate that the proposed model can maintain classification accuracy above 96% for the Kaggle dataset and above 92.51% for the NSL_KDD dataset, even with up to an 80% reduction in data volume. Additionally, computation time for the Kaggle dataset decreased from 458.09 ms to 47.21 ms, and for the NSL_KDD dataset from 995.2 ms to 223.60 ms. Thus, despite improvements in speed and reductions in time and cost, the model's optimal performance is maintained.

    Keywords: Internet Of Things, Intrusion Detection System, Clustering, Classification, Regression Tree Algorithm, DBSCAN, Data Reduction, RN, Genetic Algorithm, Kaggle Dataset, NSL, KDD Dataset
  • M. Shahrouzi*, M. Rashidi-Moghaddam

    Clustering is a well-known solution to deal with complex database features as an unsupervised machine learning technique. One of its practical applications is the selection of non-similar earthquakes for consequent analysis of structural models. In the present work, appropriate clustering of seismic data is searched via optimization. Silhouette value is penalized and used to define the performance objective. A stochastic search algorithm is combined with a greedy search to solve the problem for distinct sets of near–field and far-field ground motion records. The concept of coherency is borrowed from optics to propose a coherency metric for earthquake signals before and after being filtered by structural models. It is then evaluated for various cases of structural response-to-record and response-to-response comparisons. According to the results the proposed coherency detection procedure performs well; confirmed by distinguished structural response spectra between different clusters.

    Keywords: Coherency Index, Clustering, Soft Computing, Optimization, Nonlinear Dynamic Analysis
  • شایسته طباطبائی *

    آفت سوسک سرخرطومی حنایی عامل ورود بیماری های باکتریایی و قارچی به نخل می باشد که در صورت مشاهده در مزارع، خسارت سنگینی به نخلستان ها وارد می کند. امروزه تحول در محیط ارتباطات بی سیم امکان توسعه گره های حسگر کم هزینه، کم مصرف، چند عملکردی و کوتاه برد جهت ردیابی این آفت در نخلستان را فراهم آورده است. در الگوریتم های ردیابی هدف موجود، با افزایش سرعت هدف، احتمال از دست دادن هدف نیز افزایش می یابد. بر این اساس در مقاله حاضر روش جدیدی برای ردیابی هدف پیشنهاد می شود که از دست دادن هدف را کاهش می دهد. از طرفی با توجه به محدودیت انرژی سطح باتری در گره های حسگر، نیازمند برنامه زمانی برای دوره خواب و بیداری حسگرها در راستای افزایش طول عمر شبکه هستیم. به منظور بهبود مصرف انرژی در این مقاله از رویکرد برنامه ریزی زمانی جهت تنظیم دوره خواب و بیداری گره ها با استفاده از الگوریتم بهینه سازی ازدحام گربه و منطق فازی استفاده شده است. از شبیه سازی روش پیشنهادی و مقایسه آن با روش Tracking-45-Degree-vectors در شبیه ساز Opnet می توان دریافت که پروتکل پیشنهادی عملکرد بسیار بهتری دارد، بطوریکه نرخ تاخیر انتها به انتها به میزان 02/27 درصد، نرخ تاخیر دسترسی به رسانه به میزان 01/2 درصد، نرخ گذردهی به میزان 62/0 درصد، نسبت سیگنال به نویز به میزان 28/3 درصد و میانگین انرژی مصرفی باتری به میزان 277/8 درصد نسبت به پروتکل Tracking-45-Degree-vectors بهبود یافته است. لازم به ذکر است الگوریتم پیشنهادی برای یک هدف شبیه سازی و تست شده است.

    کلید واژگان: خوشه بندی، مصرف انرژی، شبکه های حسگر بی سیم، الگوریتم بهینه سازی ازدحام گربه ها، منطق فازی، ردیابی هدف متحرک، سوسک سرخرطومی خرما.
    Shayesteh Tabatabaei*

    The Rhynchophorus ferrugineus is a major pest that serves as a carrier for bacterial and fungal diseases, causing significant damage to palm plantations when observed on farms. Nowadays, advancements in wireless communication environments have made it possible to develop low-cost, energy-efficient, multi-functional, and short-range sensor nodes for tracking this pest in palm plantations. In existing target tracking algorithms, the probability of losing the target increases with its speed. Therefore, this paper proposes a new method for target tracking that reduces the likelihood of losing the target. Additionally, considering the energy constraints of battery-powered sensor nodes, we need a scheduling mechanism for their sleep and wake-up cycles to enhance the network's lifespan. To improve energy consumption, this paper utilizes a time scheduling approach to adjust the sleep and wakeup periods of nodes using the Cat Swarm Optimization algorithm and Fuzzy Logic optimization. By simulating the proposed method and comparing it with the Tracking-45-Degree-vectors method in the Opnet simulator, it can be observed that the proposed protocol performs significantly better. Specifically, the end-to-end delay rate improves by 27.02%, the media access delay rate improves by 2.01%, the throughput rate improves by 0.62%, the signal-to-noise ratio improves by 3.28%, and the average battery energy consumption improves by 8.77% compared to the Tracking-45-Degree-vectors protocol. It is worth mentioning that the proposed algorithm has been simulated and tested for a single target scenario.

    Keywords: Clustering, Energy Consumption, WSN, Cat Swarm Optimization Algorithm, Fuzzy Logic, Target Tracking, Rhynchophorus Ferrugineus
  • M. Sorkhpour, M. Rezvani, E. Tahanian *, M. Fateh
    The expansion of machine learning applications across different domains has given rise to a growing interest in tapping into the vast reserves of data generated by edge devices. To preserve data privacy, federated learning was developed as a collaboratively decentralized privacy-preserving technology to overcome the challenges of data silos and data sensibility. This technology faces certain limitations due to the limited network connectivity of mobile devices and malicious attackers. In addition, data samples across all devices are typically not independent and identically distributed, which presents additional challenges to achieve convergence in fewer communication rounds. In this paper, we have simulated attacks, namely Byzantine, label flipping, and noisy data attacks, besides non-IID data. We proposed  Robust federated learning against poisoning attacks (RFCaps) to increase security and accelerate convergence. RFCaps incorporate a prediction-based clustering and a gradient quality evaluation method to prevent attackers from the aggregation phase by applying multiple filters and accelerating convergence using the highest quality gradients. Compared to MKRUM, COMED, TMean, and FedAvg algorithms, RFCap has high robustness in the presence of attackers and has achieved a higher accuracy of up to 80%  on both MNIST and Fashion-MNIST datasets.
    Keywords: Federated Learning, Capsule Neural Networks, Poisoning Attacks, Clustering
  • حسین خیرالهی، محمد چهاردولی*، محمد سیم جو
    تعیین بهترین ناحیه کاندیدای پایلوت یکی از چالش های مهم و اساسی در ارزیابی اقتصادی پروژه های تزریق آب در میادین نفتی می باشد. نتایج و ثمرات این انتخاب مهم در گام ها و تصمیمات بعدی مرتبط با بررسی ریسک سرمایه گذاری در پروژه های کلان توسعه میدان نمایان گر خواهد بود. برای تصمیم گیری در این خصوص می توان از معیار های زمین شناسی، عملیاتی و اقتصادی استفاده نمود. به همین منظور، در این مطالعه از روش های تصمیم گیری چند شاخصه به همراه الگوریتم های خوشه بندی همانند کا- میانگین جهت تعیین بهترین ناحیه پیاده سازی پایلوت استفاده شد. جهت نیل به این هدف مجموعه داده های تاریخچه تولید، توزیع اشباع نفت در گستره مخزن و پارامترهای توصیف کننده خواص مخزن برای نواحی مختلف میدان استخراج شده و سپس پارامتر شاخص شباهت مخزنی برای تمام نواحی در گستره میدان محاسبه شد. در ادامه، معیارهای عملیاتی از قبیل تعداد و متوسط فاصله چاه های تداخلی (چاه های موجود در ناحیه کاندید)، تعداد و متوسط فاصله چاه های موجود در همسایگی (چاه های موجود در شعاع مشخصی از ناحیه کاندید)، و فاصله نواحی کاندیدا از تجهیزات سرچاهی تعیین شد. سپس با تشکیل ماتریس تصمیم و اعمال روش های تصمیم سازی چندشاخصه از قبیل روش شانون آنتروپی، روش تاپسیس و روش سلسله مراتبی، مقدار شاخص فرصت پایلوت برای هر ناحیه از میدان محاسبه شد. در نهایت، رتبه بندی نهایی براساس تلفیق نتایج روش های تصمیم گیری چند شاخصه با به کارگیری استراتژی میانگین رتبه ها انجام گرفت. مطابق نتایج حاصله برای سه ناحیه برتر پایلوت، خروجی روش آنالیز سلسله مراتبی به ترتیب برابر با 50/11، 46/10 و97/6% و برای روش آنتروپی شانون برابر با 67/11، 80/9 و 80/6% بود. رتبه بندی نهایی براساس تلفیق نتایج روش های تصمیم گیری چند شاخصه با به کارگیری استراتژی میانگین رتبه ها تعیین شد. براین اساس، سه ناحیه مذکور بیشترین امتیاز فرصت پایلوت را در گستره میدان کسب نموده و به عنوان اولویت های اول کاندیدای پیاده سازی پایلوت روش های تزریق آب پایه برای مطالعات توسعه ای پیشنهاد شدند.
    کلید واژگان: انتخاب محل پایلوت، تزریق آب، تصمیم گیری چند شاخصه، الگوریتم های خوشه بندی، تاپسیس
    Hossein Kheirollahi, Mohammad Chahardowli *, Mohammad Simjoo
    Selecting the best candidate pilot area is one of the most important and challenges decisions in the oil and gas filed development plan. Pilot-scale projects are conducted to reduce reservoir uncertainties and investment risk and the lesson learned from this study will be extended to the full field implementation. The main objective of this study is to utilize sseveral geological, operational and economic criteria to make decisions optimally among candidate areas. Firstly, reservoir similarity index (RSI) is calculated using the oil production history, saturation data. For this reason, clustering methods including k-means, k-medoids and c-means are used to identify the center of the dominant cluster. Afterwards, other operational criteria such as the number of interference, adjacent wells, the average distance between these wells and area center and the average distance from facilities are determined for all candidate areas. Finally, the decision matrix is created and then multi-criteria decision making (MCDM) methods are utilized to calculate pilot opportunity index for each area. According to the obtained results, the assigned pilot opportunity index of the hierarchical analysis method was equal to 11.50, 10.46 and 6.97%, and for the Shannon entropy method it was equal to 11.67, 9.80 and 6.80%, respectively for the top three pilot areas. The area with the highest value is selected as the first rank candidate for pilot implementation. Moreover, mean rank method is utilized to aggregate and introduce the best pilot area.
    Keywords: Pilot Selection, Water Flooding, Risk Management, Multi Criteria Decision Making, Clustering
  • محمد کاکش پور، محمدرضا جلیلی قاضی زاده*، سید عباس حسینی، احمد شرافتی
    تخمین هدررفت، مدیریت فشار و مدیریت در شرایط اضطراری از مزایای ایجاد ناحیه های مجزای اندازه گیری (DMA1) در شبکه های توزیع آب است. اما توسعه غیراصولی شبکه ها به صورت سنتی با لحاظ اهم شاخص ها در ایجاد DMA این موضوع را به یک مسئله پیچیده تبدیل کرده است. در این تحقیق یک روش برای ایجاد نواحی مجزای اندازه گیری با شاخص های انتخاب بهینه ارائه شد. بدین منظور از سه شبکه توزیع آب بالرما2، مدنا3 و دی تاون4 به دو روش گیروان-نیومن5 و فست نیومن6 که مبتنی بر معیار پیمانگی7 هستند، برای خوشه بندی8 استفاده شد. سپس به کمک الگوریتم ژنتیک9 و نرم افزار ایپنت10 باهدف کاهش هزینه در ناحیه بندی فیزیکی با رعایت قید حداقل فشار گره ای تعیین شد و به کمک شاخص های هزینه ای، هیدرولیکی و کیفی نتایج پهنه بندی حاصل تحقیق تحلیل شد و اثربخشی آن ها مورد بحث قرار گرفت. نتایج نشان داد که شاخص های مذکور می تواند منجر به انتخاب بهینه بهترین طرح پیشنهادی برای اصلاح شبکه های سنتی موجود و ایجاد DMA در شبکه های توزیع آب باشد. معیار هزینه و پیمانگی نسبت به سایر شاخص ها اثرگذاری بیشتری در تعیین تعداد بهینه نواحی داشتند. روش گیروان-نیومن نتایج مناسب تری را نسبت به روش فست نیومن ارائه کرد.
    کلید واژگان: DMA، شبکه توزیع آب، گیروان-نیومن، فست نیومن، خوشه بندی
    Mohammad Kakeshpour, Mohammad Reza Jalili Ghazizadeh *, Seyed Abbas Hoseyni, Ahmad Sharafati
    Estimation of leakage, pressure management, and emergency management are among the advantages of establishing DMA in the WDN. However, the unprincipled development of WDN in a traditional way has turned this issue into a complex problem in terms of essential indexes in creating DMA. In this study, a method is presented to design DMAs with optimal selection indicators. For this purpose, three water distribution networks of Balerma, Madena, and D-Town were used for clustering using the Girvan-Newman and Fast Newman methods, which are based on the modularity criterion. Then, with use of a genetic algorithm and EPANET software, to reduce the cost in physical zoning, it was determined by observing the condition of minimum nodal pressure, and with the help of cost, hydraulic, and quality indicators, the zoning results of the research were analyzed and their effectiveness was discussed. The results showed that the mentioned indicators could lead to the optimal selection of the best-proposed plan to modify existing traditional networks and stablish DMA in WDN. The cost and modularity criteria had more effect than other indicators in determining the optimal number of areas. The Girvan-Newman's method provided more relevant results in comparison with the Fast Newman's method.
    Keywords: DMA, Water Distribution Network, Girvan-Newman, Fast Newman, Clustering
  • محمدمهدی بنی حسینی، وحید برادران*، محمدهادی درودیان

    پایش و تعیین لحظه ای وضعیت ترافیک در بزرگراه های شهری و برون شهری نقش موثری در افزایش بهره وری منابع و زیرساخت ها و همچنین افزایش رضایت ذینفعان سیستم های حمل ونقل دارد. تجزیه وتحلیل متغیرهای تصادفی ترافیکی مانند تردد و سرعت به تشخیص و پیش بینی وضعیت های غیرعادی ترافیک در یک مسیر با کمترین استفاده از منابع انسانی که عموما نشان از وجود بحران های ترافیکی دارند، کمک می کند. در این مقاله، نمودارهای کنترل آماری تک و چندمتغیره برای پایش متغیرهای ترافیکی و شتاسایی وضعیت های غیرعادی پیشنهاد شده است. جهت ارتقا, عملکرد نمودارهای کنترل، الگوریتمی فراابتکاری مبتنی بر روش بهینه سازی ازدحام ذرات برای خوشه بندی بازه های زمانی ترافیک بر پایه ی داده های متغیرهای ترافیکی در یکی از معابر برون شهری تهران ارائه شده است. به ازای هر خوشه، نمودارهای کنترل مختلف توسعه داده شده و عملکرد آنها در هر خوشه ارزیابی شده است. استخراج قواعد تشخیص وضعیت های غیرعادی و اجرای نمودارهای کنترلی نشان می دهد که رویکرد پیشنهادی دقت قابل قبولی برای تعیین وضعیت ترافیک در یک مسیر دارد.

    کلید واژگان: بهینه سازی ازدحام ذرات، خوشه بندی، کنترل ترافیک هوشمند، نمودار کنترلی شوهارت، وضعیت ترافیک
    Seyed Mohammadmahdi Banihosseini, Vahid Baradaran *, Mohammadhadi Doroudian

    Traffic monitoring and control in urban and intercity highways plays an effective role in increasing the efficiency of resources and infrastructure, as well as increasing the satisfaction of the stakeholders of transportation systems. Analyzing random traffic variables such as traffic and speed and diagnosing and predicting their unusual situations, which generally indicate the existence of traffic crises, is one of the approaches to monitoring traffic flow and solving traffic problems in metropolises. In this article, by using the data collected by traffic sensors, the data related to traffic variables have been grouped using an innovative algorithm based on the particle swarm optimization method in terms of the traffic situation. The grouped data were used to calculate suitable control limits for time intervals, and the results indicate the high performance of this method. For this purpose, in the first step, using an innovative method based on particle swarm optimization, the training data is grouped based on the values of traffic variables, including density, traffic and speed, and then the appropriate group is identified for each variable value. In the next step, the traffic situation is calculated for the clusters and hours of the day, and based on that, superior and standard control charts are drawn. The obtained results indicate the appropriate accuracy of the proposed system in traffic monitoring.

    Keywords: Particle Swarm Optimization, Clustering, Intelligent Traffic Control, Shohart Control Chart, Traffic Situation
  • امیر سالار مهرآباد، احمد شوشتری*
    از جمله موارد چالش برانگیز در آنالیز مودال عملیاتی، وابستگی روش های آن به قضاوت کاربر در جداسازی مودهای فیزیکی از مودهای جعلی و تفکیک مودهای واقعی سازه از یکدیگر است. در سال های اخیر، مطالعات گسترده یی درخصوص خودکارسازی روش های آنالیز مودال عملیاتی صورت گرفته است. در غالب پژوهش های مذکور تلاش شده است که با استفاده از روش های یادگیری ماشین نیاز به دخالت کاربر در محاسبه ی پارامترهای مودال به میزان کمینه برسد. در پژوهش حاضر، به منظور جداسازی مودهای فیزیکی از مودهای جعلی از روش خوشه بندی DBSCAN استفاده شده است. درنهایت، به کمک روش خوشه بندی سلسله مراتبی مودهای فیزیکی شناسایی شده از یکدیگر تفکیک شده اند. الگوریتم معرفی شده بر روی یک سازه ی 6 درجه ی آزادی و یک پل واقعی پیاده سازی شده است. نتایج نشان می دهند استفاده از الگوریتم خوش بندی DBSCAN نسبت به الگوریتم های پیشین مانند K means، توان بالاتری در تفکیک مودهای فیزیکی از ریاضی را دارد.
    کلید واژگان: آنالیز مودال عملیاتی خودکار، یادگیری ماشین، خوشه بندی، پایش سلامت سازه
    A. Salar Mehrabad, A. Shooshtari *
    Estimating a structure's modal parameters is essential for various applications, including health monitoring, damage detection, design verification, and model updating. Modal parameters are a structure's natural frequencies, mode shapes, and damping ratios. They can be used to understand the structure's dynamic behavior and to identify any changes that may occur over time. Operational modal analysis (OMA) is a technique that uses the response of a structure to environmental loads to estimate modal parameters. OMA is a non-destructive testing method that can be used on structures in their operating environment. This makes it a valuable tool for health monitoring and damage detection of buildings, bridges, wind turbines, and stadiums. One of the challenges of OMA is that its methods rely on the user's judgment to separate physical modes from spurious modes and to distinguish between real modes of the structure. Spurious modes are not caused by the actual structure but by noise or other environmental factors. Real modes are caused by the structure itself. In recent years, there has been extensive research on automating OMA methods for modal parameter estimation. Most of these studies have attempted to minimize the need for user intervention in modal parameter calculation by using machine learning techniques. Machine learning techniques can be used to identify physical modes automatically and to distinguish between real modes of the structure. This research uses the Stochastic Subspace Identification (SSI) method for OMA. The DBSCAN clustering method is used to separate physical modes from spurious modes. Finally, the hierarchical clustering method is used to distinguish between real modes of the structure. The proposed algorithm was implemented on a 6-degree-of-freedom structure and a real bridge. The results show that the proposed method has a higher power to separate physical modes from spurious modes than previous methods.
    Keywords: Automatic Operational Modal Analysis, Machine Learning, Clustering, Structural Health Monitor
  • Roya Cheshmi Khani, Mohammadali Afshar Kazemi *, Abbas Toloie Eshlaghy, Ezzatollah Asgharizadeh

    Iranian Commercial banks are always considered as one of the most important institutions active in the money and capital market, due to the economic structure of the country and the lack of development of the capital markets, which makes them in charge of financing the economic sectors of the country. However, these banks are not successful in fulfilling their mission. High level of banks' reserves shows that they do not pay enough attention to risk management and credit portfolio management. There are several models such as linear programming, integer programming, zero and one programming that can provide an optimal combination of the elements that make up the facility basket. However, entering financial information into mathematical planning by considering all conditions is not straightforward to achieve such a goal. In this research, using data mining to optimize the multi-objective model of facility allocation is done using neural network. First, the effective variables were extracted from the bank database and after preparation, the most important features were identified using different algorithms such as random forest algorithm, MARS, and step-wise regression. Then, these methods were compared with each other and the best method was selected. In order to cluster the customers, k-means and k-medoids models have been used. Using different criteria, including the silhouette and the best number of clusters, two clusters have been estimated and customers have been identified in two low-risk and high-risk categories. And finally, by using convolutional neural network, the risk and profit of each customer has been predicted.

    Keywords: Loan, Data Mining, Clustering, Deep Learning, Convolutional Neural Network, CNN, LSTM
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال