clustering algorithms
در نشریات گروه برق-
به کارگیری الگوکاوی بر روی داده های مرتبط با مسیرها و جاده ها، دستاوردهای با ارزش و اثرگذاری را در حوزه های مختلفی، همچون راه و شهرسازی، حمل و نقل و حتی پیش بینی سرویس های اجتماعی به ارمغان آورده است. در این مقاله به کاوش الگوهای خط سیر در اشیا متحرک در شبکه های جاده ای پرداخته شده است. تا بتوان به کمک آن الگوهای مناسبی را استخراج نماییم. ازجمله چالش های موجود در تکنیک های خوشه بندی در بحث الگوکاوی، پیدا کردن الگوهای متوالی همراه با زمان اجرای پایین می باشد. برای حل این مشکل، از تکنیک های خوشه بندی برای معرفی یک الگوریتم پیشنهادی به نام BFEs-Enhanced استفاده شده است، که با استفاده از آن می توان الگوهای Flock متوالی و معنی داری را که دارای بازه زمانی پایینی می باشند، استخراج نمود. نتایج شبیه سازی نشان می دهد که، روش پیشنهادی به دلیل استفاده از معیارهای مناسب برای خوشه بندی که شامل: حداکثر فاصله ثابت و حداقل تعداد می باشد و اضافه کردن معیار جدیدی به نام حداقل دوره زمانی به الگوریتم پیشنهادی و از طرف دیگر، در روش پیشنهادی علاوه بر معیار فاصله که الگوریتمBFE-Enhanced داشته است، معیار جهت نیز برای بهبود دقت عملکرد به الگوریتم پیشنهادی اضافه شده است. که در نتیجه، الگوریتم پیشنهادی، بازه زمانی را کاهش و تعداد الگوهای معنی دار و متوالی را افزایش می دهد.
کلید واژگان: الگوکاوی خط سیر، اشیا متحرک، شبکه های جاده ای، الگوریتم های خوشه بندی، الگوریتم BFE-EnhancedJournal of Iranian Association of Electrical and Electronics Engineers, Volume:20 Issue: 3, 2023, PP 125 -133Pattern mining on paths and roads data has brought up valuable and effective achievements in different areas, such as: roads and urbanization, transportation, and even forecasting social services. The trajectory patterns of moving objects in road networks were examined to extract efficient patterns. Among the challenges in clustering techniques of pattern mining is to find consecutive patterns with low run time. To solve this problem, a clustering algorithm was proposed titled BFEs-Enhanced, which can be used to extract sequential and meaningful flock patterns with a short time interval. Simulation results showed that the proposed method, thanks to the use of efficient criteria for clustering, such as maximum distance and minimum number demonstrated an outstanding performance. In addition, a new criterion was added to the algorithm called minimum time period. Along with the distance criterion in BFE-Enhanced algorithm, the criterion of direction was also added to the algorithm to improve its accuracy. Therefore, the proposed algorithm is featured with a shorter time interval and higher number of meaningful and sequential patterns.
Keywords: Trajectory Pattern Mining, Moving Objects, Road Networks, BFE-Enhanced, Clustering Algorithms -
مدل نگاشت-کاهش یک مدل برای اجرای برنامه های کاربردی داده های بزرگ می باشد. همچنین این مدل، یک مدل برنامه نویسی موازی برای نوشتن برنامه هایی می باشد که می توانند بر روی ابر اجرا شوند. سازمان ها بطور فزاینده ای در حال تولید داده هستند که حاصل فرایندهای کسب وکار ، فعالیت های کاربران، ردیابی وب سایت ها، حسگرها، مالی، حسابداری و غیره تولید می شوند. الگوریتم های خوشه بندی داده، به عنوان ابزاری برای تجزیه و تحلیل حجم زیاد داده به کار می روند. هدف اصلی این الگوریتم ها، این است که داده ها را در خوشه هایی دسته بندی کنند، و اشیای داده در هر خوشه با یکدیگر شباهت دارند. در این مقاله، الگوریتم خوشه بندی سلسله مراتبی متراکم که یکی از تکنیک های داده کاوی می باشد با استفاده از طراحی نگاشت و کاهش پیاده سازی شده و سپس نتایج این الگوریتم با حالت بدون نگاشت و کاهش مورد مقایسه قرار می گیرد. آزمایش های انجام شده نشان می دهد با افزایش اندازه داده های ورودی، زمان اجرا کاهش می یابد. زمان اجرای الگوریتم به روش موازی نسبت به روش ترتیبی برای مجموعه داده ای به اندازه 200 شی داده، 16.80% و برای مجموعه داده ای به اندازه 1000 شی داده، 29.26% بهبود یافت. همچنین درصد استفاده از پردازنده کل سیستم در روش موازی از 22% به 94% ارتقاء یافت.
کلید واژگان: نگاشت-کاهش، هادوپ، الگوریتم های خوشه بندی داده، پردازش موازیThe map-reduce model is a method for executing large data applications. It is also a parallel programming model for writing applications that can be executed on the cloud. Organizations are increasingly producing data that is generated by business processes, user activities, website tracking, sensors, finance, accounting, and more. Data clustering algorithms are used as tools for analyzing large volumes of data. The main purpose of these algorithms is to categorize data into clusters so that the data objects in each cluster are more similar. In this paper, a dense hierarchical clustering algorithm, one of the data mining techniques, is implemented using map-reduce design and then the results of this algorithm are compared with the usual one. Experiments show that runtime decreases with increasing input data size. The runtime of the algorithm improved by 16.80% for the 200 data-point dataset, and 29.26% for the dataset with 1000 data points. The percentage of CPU usage in the parallel system also increased from 22% to 94%.
Keywords: Map-Reduce, Hadoop, clustering algorithms, parallel programming -
Cluster-based Wireless Sensor Network (CWSN) is a kind of WSNs that because of avoiding long distance communications, preserve the energy of nodes and so is attractive for related applications. The criticality of most applications of WSNs and also their unattended nature, makes sensor nodes often susceptible to many types of attacks. Based on this fact, it is clear that cluster heads (CHs) are the most attacked targets by attackers, And also according to their critical operations in CWSNs, their compromise and control by an attacker will disrupt the entire cluster and sometimes the entire network, so their security needs more attentiveness and must be ensured. In this paper, we introduce a hybrid Intrusion Detection System (HIDS) for securing CHs, to take advantages of both anomaly-based and misuse-based detection methods, that is high detection and low false alarm rate. Also by using a novel preprocessing model, significantly reduces the computational and memory complexities of the proposed IDS, and finally allows the use of the clustering algorithms for it. The simulation results show that the proposed IDS in comparison to existing works, which often have high computational and memory complexities, can be as an effective and lightweight IDS for securing CHs.Keywords: Wireless Sensor Networks (WSNs), Intrusion Detection Systems (IDSs), Cluster-heads (CHs), data preprocessing model, clustering algorithms
-
با افزایش وسعت مزرعه بادی، تنوع سرعت باد و تعداد ژنراتورها، برای کاهش پیچیدگی محاسبات و زمان شبیه سازی به معادل سازی بادها و ژنراتورها پرداخته می شود. در این مقاله، سرعت های باد ورودی توربین ها در یک بازه مشخص در نظر گرفته می شوند و با پیشنهاد رگرسیون عصبی و ایجاد ساختار آن، نشان داده می شود که سرعت های باد ورودی در این مطالعه چه قدر بر توان خروجی موثرند و چه اهمیتی برای فضای ویژگی خوشه بندی دارند. این در حالی است که به طورمعمول به دلیل پیچیدگی رابطه دینامیکی بین توان خروجی و سرعت باد، روش های سنتی رگرسیون گیری نیز پیچیده تر می شوند. پس از اتمام رگرسیون گیری، رابطه ای برای محاسبه درایه های ماتریس فضای ویژگی پیشنهاد می گردد و سپس به ارائه و اعمال خوشه بندی فازی بر روی فضای ویژگی مذکور مبادرت می گردد. درنتیجه سرعت های باد خوشه بندی و سپس در هر خوشه معادل سازی می شوند. از ویژگی های خوشه بندی فازی آن است که به راحتی در نقطه بهینه محلی اسیر نمی شود. سپس بر اساس روابطی خاص، پارامترهای معادل برای ژنراتور معادل در هر خوشه محاسبه می گردد. در این مقاله رگرسیون قوی و درعین حال نتایج معادل سازی بسیار نزدیک به مدل دقیق برای بادها و ژنراتورهای معادل اخذ می گردد.کلید واژگان: روش مدل سازی معادل، مشخصه توان اکتیو خروجی، روش نمایش چندماشینی، الگوریتم خوشه بندی، رگرسیون عصبیAs the size of wind farms and therefor the wind speed variety and number of generators is increased, it is of interest to work with equivalent models for wind and generators to avoid complexity in calculation and time consuming simulations. In this paper, an interval of wind inputs will be considered and with the suggestion of the neural regression and with the creation of its structure, it will be shown that how much the input winds affect the output power and its importance for feature space in the clustering, too. Normally, due to the complexity of dynamic relationship between output power and wind speed traditional regression methods become more complex. After finishing regression, with suggestion of a formula to calculate the entries of the feature space matrix, fuzzy clustering algorithm will be proposed and applied on the feature space. In each cluster the equivalent model for the wind is determined as well as the aggregated parameters are calculated based on specific formulas. The fuzzy clustering is not fallen easily in to local optimums. Strong regression as well as very closeness between equivalent and detailed models are shown as the benefits of using the proposed approach in this paper.Keywords: Equivalent modeling method, active power output characteristics, multi-machine representation method, clustering algorithms, neural regression
-
Journal of Artificial Intelligence in Electrical Engineering, Volume:6 Issue: 21, Spring 2017, PP 9 -25UCTTP is a NP-hard problem, which must be performed for each semester frequently. The major technique in the presented approach would be analyzing data to resolve uncertainties of lecturers’ preferences and constraints within a department in order to obtain a ranking for each lecturer based on their requirements within a department where it is attempted to increase their satisfaction and develop lecturers timetabling by using clustering algorithms. The first goal of this paper is to improve satisfaction of lecturers and then optimize the ranking of lecturers based on soft constraints weights over their preferences. The proposed method applies a two-step algorithm. At the first step, the department performs timetabling process using fuzzy decision making approach to prioritize and rank lecturers by local search algorithm with seven neighbor structures and genetic algorithm to improve lecturers’ ranks as well as thoroughly satisfying hard constraints over the department in a local manner. In the second step, two clustering and traversing agents are used, where the former clusters lecturers of the department and the latter finds the extra resources. Following the clustering and traversing, in order to reach the major goals of the paper, mapping action is performed based on lecturers’ constraints in resources. In this method, the list of each lecturer’s selective preferences is resolved, prioritized and ranked by applying fuzzy decision making method based on fuzzy comparison of daily and weekly timeslots of per lecturer and then the timetable including department lecturers with their fitness functions is given to the hybrid algorithm in order to improve the quality of fitness function of lecturers within each timetable so that the clustering and mapping is performed based on a desired logic of each lecturer’s fitness function.Keywords: clustering algorithms, fuzzy multi criteria decision making approach, hybrid approach, university courses timetabling
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.