به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

hierarchical clustering

در نشریات گروه برق
تکرار جستجوی کلیدواژه hierarchical clustering در نشریات گروه فنی و مهندسی
تکرار جستجوی کلیدواژه hierarchical clustering در مقالات مجلات علمی
  • شیما سیمسار، محمود البرزی*، علی رجب زاده قطری، علی یزدیان ورجانی
    امروزه پاسخ تقاضا به عنوان عنصر مهم در قابلیت اطمینان شبکه هوشمند شناخته شده است. سیستم های مدیریت انرژی خانه های هوشمند که راه اندازی وسایل برقی را با توجه به ضرورت استفاده و کارایی در اولویت قرار میدهند، نقشی حیاتی در اثربخشی استراتژی های پاسخ تقاضا دارند. شفاف سازی جزئیات مصرف برق در قبوض با وجود فناوری های حسگر به نظارت بهینه استفاده از لوازم خانگی کمک می کند. در این تحقیق، یک مدل یادگیری ماشین بدون نظارت، برای خوشه بندی لوازم خانگی به منظور مدیریت قبوض برق بر اساس ویژگی های ذاتی آنها مطرح گردید، چرا که بر این اساس میتوان جزئیات مصرف به ازای هر خوشه از لوازم خانگی را در قبض مصرفی دوره لحاظ کرد و به دلیل وجود خوشه های محدود برای لوازم خانگی امکان مدیریت و نظارت بر مصرف برق امکان پذیر میگردد. لوازم خانگی با روش خوشه بندی سلسله مراتبی به سه خوشه طبقه بندی شدند. خوشه اول لوازمی است که به صلاحدید مشتری بلافاصله روشن شوند، خوشه دوم طبق برنامه زمانبندی روشن میشوند و استفاده از آنها میتواند به تعویق افتد و خوشه سوم لوازمی هستند که توسط تعداد محدودی از مشتریان ترجیح داده میشوند. ضریب silhouette بعنوان معیاری برای ارزیابی عملکرد مدل خوشه بندی سلسله مراتبی ایجاد شد، که مقدار 0.56رضایت بخشی مدل را نشان می دهد. بر اساس نتایج، مشخص شد که روش خوشه بندی پیشنهادی می تواند با انتخاب ویژگی های مناسب، انواع مختلف لوازم خانگی را بطور منطقی طبقه بندی کند، زیرا لوازم موجود در یک خوشه شبیه به یکدیگر هستند و می توانند به کاربران در درک عملکرد لوازم خانگی کمک کنند.
    کلید واژگان: شبکه هوشمند، سیستم مدیریت انرژی خانگی، پاسخ تقاضا، خوشه بندی سلسه مراتبی
    Shima Simsar, Mahmood Alborzi *, Ali Rajabzadeh Ghatari, Ali Yazdian
    Nowadays, demand response is recognized as an important element in the reliability of smart grid. Smart home energy management systems, which prioritize the start-up of electrical appliances according to the necessity of use and efficiency, play a vital role in the effectiveness of load response strategies in residential areas. Considering the sensor technologies, clarification on electricity consumption details helps to optimally monitor how the appliances are used. In this research, an unsupervised machine learning model was proposed for the clustering of home appliances to manage the bills of customers based on their inherent characteristics. Due to the small number of clusters, it becomes possible to manage electricity consumption. The hierarchical clustering method was used to classify appliances into three clusters. The first cluster is the appliances that are turned on at the discretion of the consumers immediately, the second cluster is the appliances that can be turned on according to the schedule and their usage can be postponed and the third cluster is appliances that are preferred by a limited number of consumers. The silhouette coefficient was developed as a measure of the hierarchical clustering model performance, where the average silhouette coefficient of 0.56 indicates the satisfaction of the model. Based on the results, it was found that the proposed clustering method can rationally classify different types of home appliances by selecting the appropriate characteristics since the appliances in a cluster are very similar to each other and can help users understand the operating conditions of the appliances.
    Keywords: Smart Grid, Home Energy Management System, Demand Response, Hierarchical Clustering
  • محمدعلی باهری فرد، رسول کاظم زاده*، احمد صادقی یزدانخواه، موسی مرزبند

    امروزه با توسعه زیرساخت های شبکه الکتریکی و پدید آمدن مفاهیمی چون پاسخگویی تقاضا و استفاده از خودروهای الکتریکی در اهدافی غیر از حمل و نقل، شناختن الگوهای رفتاری مشخصات فنی شبکه به منظور مدیریت بهینه سیستم های الکتریکی بسیار اهمیت یافته است.یکی از پارامترهای حیاتی در مدیریت سیستم برق، عدم تعادل شبکه توزیع است. راه های مختلفی برای بهبود و کنترل عدم تعادل شبکه وجود دارد. یکی از این راه ها تشخیص رفتار پروفایل های عدم تعادل باس در شبکه با استفاده از تجزیه و تحلیل داده ها است. در گذشته ، تجزیه و تحلیل داده های برای محیط های بزرگی مانند ایالات و کشورها انجام می شد. با این حال پس از ظهور مفهوم شبکه های هوشمند ، مطالعه رفتاری و شناخت این الگوها در محیط های کوچک و مقیاس پایین، نقش اساسی و مهمی در مدیریت عمیق این شبکه ها پیدا کرده است. یکی از روش های مناسب در تشخیص الگوهای رفتاری استفاده از داده کاوی است. در این مقاله از مفاهیم خوشه بندی سلسله مراتبی و میانگین-k برای تشخیص الگوی رفتاری شاخص عدم تعادل در یک شبکه توزیع نامتعادل استفاده میشود. سپس با تعیین خوشه هدف و با استفاده از پاسخگویی تقاضا به بهبود شاخص عدم تعادل پرداخته میشود. این روش باعث کاهش تعداد باسهای شرکت کننده در برنامه های پاسخگویی تقاضا میشود. در ادامه با استفاده از مفهوم طبقه بندی، یک درخت تصمیم در راستای کاهش زمان میترینگ ساخته میشود.

    کلید واژگان: طبقه بندی، خوشه بندی، شبکه توزیع نامتعادل، داده کاوی، خودروی الکتریکی
    M.A. Baherifard, R. Kazemzadeh *, A.S. Yazdankhah, M. Marzband

    With the development of electrical network infrastructure and the emergence of concepts such as demand response and using electric vehicles for purposes other than transportation, knowing the behavioral patterns of network technical specifications to manage electrical systems has become very important optimally. One of the critical parameters in the electrical system management is the distribution network imbalance. There are several ways to improve and control network imbalances. One of these ways is to detect the behavior of bus imbalance profiles in the network using data analysis. In the past, data analysis was performed for large environments such as states and countries. However, after the emergence of smart grids, behavioral study and recognition of these patterns in small-scale environments has found a fundamental and essential role in the deep management of these networks. One of the appropriate methods in identifying behavioral patterns is data mining. This paper uses the concepts of hierarchical and k-means clustering methods to identify the behavioral pattern of the imbalance index in an unbalanced distribution network. For this purpose, first, in an unbalanced network without the electric vehicle parking, the imbalance profile for all busses is estimated. Then, by applying the penetration coefficient of 25% and 75% for electric vehicles in the network, charging\discharging effects on the imbalance profile is determined. Then, by determining the target cluster and using demand response, the imbalance index is improved. This method reduces the number of busses competing in demand response programs. Next, using the concept of classification, a decision tree is constructed to minimize metering time.

    Keywords: Classification, Data Mining, decision tree, demand response, hierarchical clustering, k-means, Electric Vehicle, ‎unbalanced distribution network.‎
  • Maryam Hourali*, Mansoureh Hourali

    Today we live in a period that is known to an area of communication. By increasing the information on the internet, the extra news are published on news agencies websites or other resources, the users are confused more with the problems of finding their desired information and related news. Among these are recommended systems they can automatically finding the news and information of their favorite’s users and suggesting to them too. This article attempts to improve the user’s interests and user’s satisfactions by refining the content based recommendation system to suggest better sources to their users. A clustering approach has been used to carry out this improvement. An attempt has been made to define a cluster threshold for clustering the same news and information in the K-means clustering algorithm. By detecting best resemblance criterion value and using an external knowledge base (ontology), we could generalize words into a set of related words (instead of using them alone). This approach is promoted the accuracy of news clustering and use the provided cluster to find user’s favorite news and also could have suggest the news to the user. Since the dataset has an important and influential role in advisory recommended systems, the standard Persian dataset is not provided and not published yet. In this research, an attempted has been made to connect and publish the dataset to finish the effect of this vacuum. The data are collected and crawl 8 periods of days from the Tabnak news agency website. The profile of each volunteers has been created and also saved at the same time as they read the favorite news on that period of time. An analysis shows that the proposed clustering approach provided by the NMI criterion has reached 70.2%  on our the dataset. Also, using the suggested clustering recommendation system yield 89.2% performance based on the accuracy criterion, which shows an improvement of 8.5% in a standardized way.

    Keywords: Recommender system, Persian news, Hierarchical clustering, Ontology
  • نگین دانشپور*، علی برزگری

    به دلیل اهمیت بالای کیفیت داده ها در عملکرد سامانه های نرم افزاری، فرآیند پاکسازی داده به خصوص تشخیص رکوردهای تکراری، طی سالیان اخیر یکی از مهم ترین حوزه های علوم رایانه به حساب آمده است. در این مقاله روشی برای تشخیص رکوردهای تکراری ارایه شده است که با خوشه بندی سلسله مراتبی رکوردها بر اساس ویژگی های مناسب در هر سطح، میزان شباهت میان رکوردها تخمین زده می شود. این کار سبب می شود تا خوشه هایی در سطح آخر به دست آیند که رکوردهای درون آن ها بسیار مشابه یکدیگر باشند. برای کشف رکوردهای تکراری نیز مقایسه تنها بر روی رکوردهای درون یک خوشه از سطح آخر انجام می گیرد. همچنین در این مقاله برای مقایسه میان رکوردها، یک تابع تشابه نسبی بر پایه تابع فاصله ویرایشی ارایه شده که دقت بسیار بالایی به همراه دارد. مقایسه نتایج ارزیابی سامانه نشان می دهد که روش ارایه شده، در زمان کمتری، 90% تکراری های موجود را با دقت 97% کشف می کند و بهبود داشته است.

    کلید واژگان: تشخیص تکراری، پاک سازی داده، خوشه بندی سلسله مراتبی، تابع تشابه، انتخاب ویژگی
    Negin Daneshpour*, Ali Barzegari

    Accuracy and validity of data are prerequisites of appropriate operations of any software system. Always there is possibility of occurring errors in data due to human and system faults. One of these errors is existence of duplicate records in data sources. Duplicate records refer to the same real world entity. There must be one of them in a data source, but for some reasons like aggregation of data sources and human faults in data entry, it is possible to appear several copies of an entity in a data source. This problem leads to error occurrence in operations or output results of a system; also, it costs a lot for related organization or business. Therefore, data cleaning process especially duplicate record detection, became one of the most important area of computer science in recent years. Many solutions presented for detecting duplicates in different situations, but they almost are all time-consuming. Also, the volume of data is growing up every day. hence, previous methods don’t have enough performance anymore. Incorrect detection of two different records as duplicates, is another problem that recent works are being faced. This becomes important because duplicates will usually be deleted and some correct data will be lost. So it seems that presenting new methods is necessary. In this paper, a method has been proposed that reduces required volume of process using hierarchical clustering with appropriate features. In this method, similarity between records has been estimated in several levels. In each level, a different feature has been used for estimating similarity between records. As a result, clusters that contain very similar records will be created in the last level. The comparisons are done on these records for detecting duplicates. Also, in this paper, a relative similarity function has been proposed for comparing between records. This function has high precision in determining the similarity. Eventually, the evaluation results show that the proposed method detects 90% of duplicate records with 97% accuracy in less time and results have improved.

    Keywords: Duplicate Record Detection, Data Cleaning, Hierarchical Clustering, Similarity Function, Feature Selection
  • وحید قاسمی*، محمد جوادیان، سعید باقری شورکی
    V. Ghasemi *, M. Javadian, S. Bagheri Shouraki

    In this work, a hierarchical ensemble of projected clustering algorithm for high-dimensional data is proposed. The basic concept of the algorithm is based on the active learning method (ALM) which is a fuzzy learning scheme, inspired by some behavioral features of human brain functionality. High-dimensional unsupervised active learning method (HUALM) is a clustering algorithm which blurs the data points as one-dimensional ink drop patterns, in order to summarize the effects of all data points, and then applies a threshold on the resulting vectors. It is based on an ensemble clustering method which performs one-dimensional density partitioning to produce ensemble of clustering solutions. Then, it assigns a unique prime number to the data points that exist in each partition as their labels. Consequently, a combination is performed by multiplying the labels of every data point in order to produce the absolute labels. The data points with identical absolute labels are fallen into the same cluster. The hierarchical property of the algorithm is intended to cluster complex data by zooming in each already formed cluster to find further sub-clusters. The algorithm is verified using several synthetic and real-world datasets. The results show that the proposed method has a promising performance, compared to some well-known high-dimensional data clustering algorithms.

    Keywords: Ensemble Clustering, High Dimensional Clustering, Hierarchical Clustering, Unsupervised Active Learning Method
  • بهنام طاهری خامنه، حمید شکرزاده*

    رشد انبوه اطلاعات در وب مشکلاتی را به دنبال داشته است که از مهم ترین آن ها می توان به چالش های ایجاد شده برای جستجو در وب اشاره کرد. با توجه به این که بیشتر محتویات وب امروزی برای استفاده توسط انسان طراحی شده است، ماشین ها تنها قادر به دست کاری و فهم داده ها در سطح لغت هستند؛ این مساله مهم ترین مانع در سرویس دهی بهتر به کاربران وب است. هدف این مقاله ارایه نتایج بهتر در پاسخ به جستجوی کاربران وب معنایی است. به این منظور در روش پیشنهادی ابتدا عبارت مورد نظر کاربر با توجه به میزان موضوعات مرتبط با آن، مورد بررسی قرار می گیرد. پاسخ به دست آمده از این بررسی، وارد یک سامانه رتبه دهی متشکل از سامانه تصمیم گیری فازی و خوشه بندی سلسله مراتبی می شود تا نتایج مطلوب تری را به کاربر بازگرداند. گفتنی است که روش پیشنهادی نیاز به هیچ گونه دانش قبلی برای خوشه بندی داده ها ندارد؛ علاوه بر این دقت و جامعیت این پاسخ نیز اندازه گیری می شود؛ درنهایت، بر روی نتایج به دست آمده آزمون F اعمال می شود که اغلب به عنوان یک معیار از عملکرد سامانه، برای ارزیابی الگوریتم و سامانه های مورد استفاده در نظر گرفته می شود. نتایج حاصل از این آزمون نشان می دهد که روش ارایه شده در این مقاله می تواند پاسخ دقیق تر و جامع تری نسبت به روش های مشابه خود ارایه دهد و به طور میانگین دقت را تا 22/1 درصد افزایش دهد.

    کلید واژگان: وب معنایی، منطق فازی، خوشه بندی سلسله مراتبی، روابط معنایی پنهان، الگوریتم HFCS
    Behnam Taheri Khameneh, Hamid Shokrzadeh*

    This paper discusses about the future of the World Wide Web development, called Semantic Web. Undoubtedly, Web service is one of the most important services on the Internet, which has had the greatest impact on the generalization of the Internet in human societies. Internet penetration has been an effective factor in growth of the volume of information on the Web. The massive growth of information on the Web has led to some problems, the most important one is search query. Nowadays, search engines use different techniques to deliver high quality results, but we still see that search results are not ideal. It should also be noted that information retrieval techniques to a certain extent can increase the search accuracy. Most of the web content is designed for human usage and machines are only able to understand and manipulate data at word level. This is the major limitation for providing better services to web users. The solution provided for this topic is to display the content of the web in such a way that it can be readily understood and comprehensible to the machine. This solution, which will lead to a huge transformation on the Web is called the Semantic Web and will begin. Better results for responding to the search for semantic web users, is the purpose of this research. In the proposed method, the expression, searched by the user, will be examined according to the related topics. The response obtained from this section enters to a rating system, which is consisted of a fuzzy decision-making system and a hierarchical clustering system, to return better results to the user. It should be noted that the proposed method does not require any prior knowledge for clustering the data. In addition, accuracy and comprehensiveness of the response are measured. Finally, the F test is applied to obtain a criterion for evaluating the performance of the algorithm and systems. The results of the test show that the method presented in this paper can provide a more precise and comprehensive response than its similar methods and it increases the accuracy up to 1.22%, on average.

    Keywords: Semantic Web, Fuzzy Logic, Hierarchical Clustering, Latent Semantic, HFCS
  • علیرضا لطیفی پاکدهی، نگین دانشپور*

    خوشه بندی یکی از شاخه های مهم موجود در داده کاوی است که هدف آن تقسیم داده ها به زیرمجموعه های معناداری است که خوشه نامیده می شوند. این تکنیک شامل فرآیند پیدا کردن گروه بندی طبیعی در مجموعه داده ها، بر اساس شباهت و تفاوت است به نحوی که اطلاعات قبلی کمی در مورد داده ها در دسترس است و یا اصلا اطلاعاتی در دسترس نیست. در طی دهه های متمادی الگوریتم های فراوانی برای خوشه بندی در رویکردهای مختلف و متفاوت و یا ترکیبی از آنها ایجاد شده اند. در این مقاله الگوریتمی بر پایه رویکردهای مبنی بر تراکم و سلسله مراتبی ارائه می شود. DBSCANیکی از الگوریتم های مطرح شده در رویکرد مبتنی بر تراکم است. این الگوریتم نیاز به دو پارامتر دارد که تعیین آن هنوز یک چالش بزرگ است. در روش پیشنهادی پارامترهای الگوریتم DBSCANطوری تنظیم می شود که بدون نیاز به دخالت کاربر، خوشه های احتمالی بصورت خودکار یافت شوند. سپس خوشه های نزدیک به یکدیگر به قدری باهم ادغام می شوند تا کیفیت خوشه های نهایی به نحو مطلوبی ارتقا یابد. بدین ترتیب خوشه های باکیفیت و دقیقی بدست خواهد آمد. در انتها برای آزمایش این الگوریتم ترکیبی جدید از داده های واقعی موجود در پایگاه داده UCIاستفاده شد. نتایج نشان می دهد که الگوریتم ترکیبی جدید کارایی بیشتر و دقیقتر و سرعت مناسبی نسبت به روش های قبلی دارد.

    کلید واژگان: داده کاوی، خوشه بندی ترکیبی، خوشه بندی سلسله مراتبی، خوشه بندی مبتنی بر تراکم
    Alireza Latifi Pakdehi, Negin Daneshpour*

    Clustering is one of the most important field of data mining that aims to divide data into meaningful subsets which are called clusters. This technique involves the process of finding natural groupings in the data set based on the similarities and di similarities which a little or no information about data are available. Over the decades, many clustering algorithms are created in different approaches or a combination of them. In this paper, an algorithm based on density and hierarchical approaches is presented. DBSCAN is one of the algorithms presented in the density-based approach. This algorithm requires two parameters that its determination is a great challenge. In the proposed method, DBSCAN algorithm parameters can be set without user involvement, so that potential clusters are found automatically. The clusters which are so close to each other are merged together until the quality of the final clusters to be enhanced properly. Thus, clusters could be more accurate and high quality. Finally, in order to test the new proposed algorithm, the real dataset in the UCI machine learning repository was used. The results indicate that the new algorithm is more efficient and accurate, and its speed is better than previous methods.

    Keywords: data mining, combinational clustering, hierarchical clustering, density-based clustering
  • احمد رضا جعفریان مقدم *، فرناز برزین پور، محمد فتحیان
    سیستم ایمنی مصنوعی (AIS) یکی از مهمترین الگوریتم های متاهیوریستیک به منظور حل مسائل بسیار پیچیده می باشد. از این الگوریتم می توان در تحلیل خوشه بندی داده ها استفاده نمود. علی رغم اینکه AIS قادر است پیکربندی فضای جستجو را به خوبی نمایش دهد اما تعیین خوشه های داده ها به طور مستقیم با استفاده از خروجی آن بسیار مشکل است. بر این اساس در این مقاله الگوریتم دو مرحله ای پیشنهاد شده است. در مرحله اول با استفاده از الگوریتم AIS پیشنهادی، فضای جستجو مورد بررسی قرار گرفته و پیکربندی فضا تعیین می شود و در مرحله دوم با استفاده از روش خوشه بندی سلسله مراتبی، خوشه ها و تعداد آنها مشخص می شود. در انتها الگوریتم پیشنهادی بر روی نمونه واقعی متشکل از داده های زلزله در ایران پیاده سازی و با نتایج الگوریتم مشابه مقایسه شده است. نتایج نشان داد که الگوریتم پیشنهادی توانسته است نقایص موجود در AIS و روش خوشه بندی سلسله مراتبی را پوشش دهد و از طرفی از دقت و سرعت قابل قبولی برخوردار است.
    کلید واژگان: تحلیل خوشه بندی، سیستم ایمنی مصنوعی (AIS)، خوشه بندی سلسله مراتبی
    Ahmad Reza Jafarian-Moghaddam *, Farnaz Barzinpour, Mohammad Fathian
    Artificial immune system (AIS) is one of the most meta-heuristic algorithms to solve complex problems. With a large number of data, creating a rapid decision and stable results are the most challenging tasks due to the rapid variation in real world. Clustering technique is a possible solution for overcoming these problems. The goal of clustering analysis is to group similar objects.
    AIS algorithm can be used in data clustering analysis. Although AIS is able to good display configure of the search space, but determination of clusters of data set directly using the AIS output will be very difficult and costly. Accordingly, in this paper a two-step algorithm is proposed based on AIS algorithm and hierarchical clustering technique. High execution speed and no need to specify the number of clusters are the benefits of the hierarchical clustering technique. But this technique is sensitive to outlier data.
    So, in the first stage of introduced algorithm using the proposed AIS algorithm, search space was investigated and the configuration space and therefore outlier data are determined. Then in second phase, using hierarchical clustering technique, clusters and their number are determined. Consequently, the first stage of proposed algorithm eliminates the disadvantages of the hierarchical clustering technique, and AIS problems will be resolved in the second stage of the proposed algorithm.
    In this paper, the proposed algorithm is evaluated and assessed through two metrics that were identified as (i) execution time (ii) Sum of Squared Error (SSE): the average total distance between the center of a cluster with cluster members used to measure the goodness of a clustering structure. Finally, the proposed algorithm has been implemented on a real sample data composed of the earthquake in Iran and has been compared with the similar algorithm titled Improved Ant System-based Clustering algorithm (IASC). IASC is based on Ant Colony System (ACS) as the meta-heuristics clustering algorithm. It is a fast algorithm and is suitable for dynamic environments. Table 1 shows the results of evaluation.
    The results showed that the proposed algorithm is able to cover the drawbacks in AIS and hierarchical clustering techniques and the other hand has high precision and acceptable run speed.
    Keywords: Clustering Analysis, Artificial immune system (AIS), Hierarchical Clustering
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال