clustering
در نشریات گروه عمران-
International Journal of Optimization in Civil Engineering, Volume:15 Issue: 1, Winter 2025, PP 39 -56
Clustering is a well-known solution to deal with complex database features as an unsupervised machine learning technique. One of its practical applications is the selection of non-similar earthquakes for consequent analysis of structural models. In the present work, appropriate clustering of seismic data is searched via optimization. Silhouette value is penalized and used to define the performance objective. A stochastic search algorithm is combined with a greedy search to solve the problem for distinct sets of near–field and far-field ground motion records. The concept of coherency is borrowed from optics to propose a coherency metric for earthquake signals before and after being filtered by structural models. It is then evaluated for various cases of structural response-to-record and response-to-response comparisons. According to the results the proposed coherency detection procedure performs well; confirmed by distinguished structural response spectra between different clusters.
Keywords: Coherency Index, Clustering, Soft Computing, Optimization, Nonlinear Dynamic Analysis -
پایش و تعیین لحظه ای وضعیت ترافیک در بزرگراه های شهری و برون شهری نقش موثری در افزایش بهره وری منابع و زیرساخت ها و همچنین افزایش رضایت ذینفعان سیستم های حمل ونقل دارد. تجزیه وتحلیل متغیرهای تصادفی ترافیکی مانند تردد و سرعت به تشخیص و پیش بینی وضعیت های غیرعادی ترافیک در یک مسیر با کمترین استفاده از منابع انسانی که عموما نشان از وجود بحران های ترافیکی دارند، کمک می کند. در این مقاله، نمودارهای کنترل آماری تک و چندمتغیره برای پایش متغیرهای ترافیکی و شتاسایی وضعیت های غیرعادی پیشنهاد شده است. جهت ارتقا, عملکرد نمودارهای کنترل، الگوریتمی فراابتکاری مبتنی بر روش بهینه سازی ازدحام ذرات برای خوشه بندی بازه های زمانی ترافیک بر پایه ی داده های متغیرهای ترافیکی در یکی از معابر برون شهری تهران ارائه شده است. به ازای هر خوشه، نمودارهای کنترل مختلف توسعه داده شده و عملکرد آنها در هر خوشه ارزیابی شده است. استخراج قواعد تشخیص وضعیت های غیرعادی و اجرای نمودارهای کنترلی نشان می دهد که رویکرد پیشنهادی دقت قابل قبولی برای تعیین وضعیت ترافیک در یک مسیر دارد.
کلید واژگان: بهینه سازی ازدحام ذرات، خوشه بندی، کنترل ترافیک هوشمند، نمودار کنترلی شوهارت، وضعیت ترافیکTraffic monitoring and control in urban and intercity highways plays an effective role in increasing the efficiency of resources and infrastructure, as well as increasing the satisfaction of the stakeholders of transportation systems. Analyzing random traffic variables such as traffic and speed and diagnosing and predicting their unusual situations, which generally indicate the existence of traffic crises, is one of the approaches to monitoring traffic flow and solving traffic problems in metropolises. In this article, by using the data collected by traffic sensors, the data related to traffic variables have been grouped using an innovative algorithm based on the particle swarm optimization method in terms of the traffic situation. The grouped data were used to calculate suitable control limits for time intervals, and the results indicate the high performance of this method. For this purpose, in the first step, using an innovative method based on particle swarm optimization, the training data is grouped based on the values of traffic variables, including density, traffic and speed, and then the appropriate group is identified for each variable value. In the next step, the traffic situation is calculated for the clusters and hours of the day, and based on that, superior and standard control charts are drawn. The obtained results indicate the appropriate accuracy of the proposed system in traffic monitoring.
Keywords: Particle Swarm Optimization, Clustering, Intelligent Traffic Control, Shohart Control Chart, Traffic Situation -
از جمله موارد چالش برانگیز در آنالیز مودال عملیاتی، وابستگی روش های آن به قضاوت کاربر در جداسازی مودهای فیزیکی از مودهای جعلی و تفکیک مودهای واقعی سازه از یکدیگر است. در سال های اخیر، مطالعات گسترده یی درخصوص خودکارسازی روش های آنالیز مودال عملیاتی صورت گرفته است. در غالب پژوهش های مذکور تلاش شده است که با استفاده از روش های یادگیری ماشین نیاز به دخالت کاربر در محاسبه ی پارامترهای مودال به میزان کمینه برسد. در پژوهش حاضر، به منظور جداسازی مودهای فیزیکی از مودهای جعلی از روش خوشه بندی DBSCAN استفاده شده است. درنهایت، به کمک روش خوشه بندی سلسله مراتبی مودهای فیزیکی شناسایی شده از یکدیگر تفکیک شده اند. الگوریتم معرفی شده بر روی یک سازه ی 6 درجه ی آزادی و یک پل واقعی پیاده سازی شده است. نتایج نشان می دهند استفاده از الگوریتم خوش بندی DBSCAN نسبت به الگوریتم های پیشین مانند K means، توان بالاتری در تفکیک مودهای فیزیکی از ریاضی را دارد.کلید واژگان: آنالیز مودال عملیاتی خودکار، یادگیری ماشین، خوشه بندی، پایش سلامت سازهEstimating a structure's modal parameters is essential for various applications, including health monitoring, damage detection, design verification, and model updating. Modal parameters are a structure's natural frequencies, mode shapes, and damping ratios. They can be used to understand the structure's dynamic behavior and to identify any changes that may occur over time. Operational modal analysis (OMA) is a technique that uses the response of a structure to environmental loads to estimate modal parameters. OMA is a non-destructive testing method that can be used on structures in their operating environment. This makes it a valuable tool for health monitoring and damage detection of buildings, bridges, wind turbines, and stadiums. One of the challenges of OMA is that its methods rely on the user's judgment to separate physical modes from spurious modes and to distinguish between real modes of the structure. Spurious modes are not caused by the actual structure but by noise or other environmental factors. Real modes are caused by the structure itself. In recent years, there has been extensive research on automating OMA methods for modal parameter estimation. Most of these studies have attempted to minimize the need for user intervention in modal parameter calculation by using machine learning techniques. Machine learning techniques can be used to identify physical modes automatically and to distinguish between real modes of the structure. This research uses the Stochastic Subspace Identification (SSI) method for OMA. The DBSCAN clustering method is used to separate physical modes from spurious modes. Finally, the hierarchical clustering method is used to distinguish between real modes of the structure. The proposed algorithm was implemented on a 6-degree-of-freedom structure and a real bridge. The results show that the proposed method has a higher power to separate physical modes from spurious modes than previous methods.Keywords: Automatic Operational Modal Analysis, Machine Learning, Clustering, Structural Health Monitor
-
امروزه در بحث مدیریت ارتباط با مشتری مراودات شرکت ها با مشتریان خود بطور قابل توجهی تغییر کرده است. تحلیل رفتار مشتریان مختلف و اختصاص صحیح منابع به آن ها به نسبت ارزشی که در سیستم ها خلق میکنند، یکی از چالش های مهم در حوزه مدیریت ارتباط با مشتری می باشد. هدف از این تحقیق ارائه الگوی مناسبی جهت بخش بندی مشتریان متناسب با ارزش آفرینی آن ها می باشد. در فرآیند پیشنهادی این تحقیق که در یک شرکت حمل و نقل ریلی مسافری اجرا گردیده است، داده های مربوط به به کلیه مسافران و مشتریان شرکت در بازه زمانی 4 ساله؛ از ابتدای سال 1397 تا انتهای سال 1400 دریافت و پس از تعیین مقادیر شاخص های مدل آر. اف. ام. (RFM)(تازگی مبادله، تعداد دفعات مبادله و ارزش پولی مبادله) مشتریان بر اساس معیارهای سه گانه، با استفاده از تکنیک خوشه بندی کامینز خوشه بندی می شوند. در ادامه با وزن دهی به معیارهای آر. اف. ام براساس روش بهترین- بدترین و محاسبه ارزش دوره عمر، خوشه های موجود اولویت بندی شده و مشتریان کلیدی و با ارزش شرکت تعیین شده اند. در نهایت نیز پیشنهاداتی جهت ایجاد بهبود در سیستم مدیریت ارتباط با مشتری تدوین شده است.
کلید واژگان: ارتباط با مشتری، آر.اف.ام، اولویت بندی، بهترین بدترین، خوشه بندیToday, the interaction of companies with customers in the form of customer relationship management (CRM) has changed significantly. Identifying the characteristics of different customers and allocating optimal resources to them according to their value for companies has become one of the main concerns in the field of customer relationship management. The aim of this research is to provide a suitable model for customer segmentation based on their value creation. In the proposed process of this research, which has been implemented in a passenger rail transport company, the data related to all passengers and customers of the company in a period of 4 years; From the beginning of 2014 to the end of 2017, and after determining the values of the indicators of the model that is R. F. M. (Recency; Frequency, and Monetary value) customers are clustered based on three criteria, using K-means clustering technique. Next, by weighting the criteria (RFM) based on the best-worst method and calculating the lifetime value, the existing clusters are prioritized and the key and valuable customers of the company are identified. Finally, suggestions for improving the Customer Relationship Management system is presented.
Keywords: Customer Relationship, RFM, Prioritization, Best Worst, Clustering -
کاهش مصرف حامل های انرژی یکی از مسایل و ضرورت های اصلی در نظام اقتصادی کشور در وضعیت فعلی می باشد. گاز طبیعی به عنوان یکی از حامل های مهم بوده که بخش عمده ای از تامین انرژی حرارتی را در پایانه های حمل بار و مسافر بر عهده دارد. در این تحقیق ابتدا مجموعه ای از راهکارهای کاهش مصرف گاز طبیعی در پایانه ها گردآوری شده اند که تعداد قابل توجهی از این راهکارها مرتبط با موتورخانه پایانه ها می باشد. سپس در این باره پنج معیار سهولت اجرای راهکار از نظر فنی، سهولت اندازه گیری کاهش مصرف گاز بواسطه اجرای راهکار، مدت زمان مناسب برای اجرای راهکار، دسترسی به تکنیسین متخصص برای اجرای راهکار و دسترسی به قطعات و ابزارهای مورد نیاز برای اجرای راهکار، برای ارزیابی و اولویت بندی راهکارها مورد توجه قرار گرفتند. وزن و درجه اهمیت هریک از معیارها با یکدیگر مساوی نمی باشد. از این رو بین دوبدوی معیارها مقایسات زوجی در طیف لیکرت صورت گرفته تا در نهایت ضرایب وزنی معیارها محاسبه شود. این راهکارها بر اساس پنج معیار مذکور و توسط گروهی از خبرگان امتیازدهی شده و بر اساس امتیازهای حاصله و با استفاده از تکنیک تحلیل سلسله مراتبی (AHP) راهکارها اولویت بندی شدند. در پایان به کمک تکنیک خوشه بندی K-Means، راهکارها بر اساس امتیازات پنج معیار مورد ارزیابی در سه گروه دسته بندی و ارایه شدند. تعدادی از این راهکارها مرتبط با تنظیمات فنی، عایق کاری، جایگزینی تجهیزات، توجه به استانداردهای عملکردی، نصب تجهیزات جدید و اقدامات پایه ای می باشند.کلید واژگان: موتورخانه، خوشه بندی، گاز طبیعی، حمل مسافر، حمل بارReducing the consumption of energy carriers is one of the main issues and necessities in the current economic conditions of the country. Natural gas is one of the important carriers that is responsible for most of the thermal energy supply in freight and passenger terminals. In this research, first, a set of solutions to reduce natural gas consumption in terminals have been collected, a significant number of which are related to the powerhouses of terminals. Then in this regard, five criteria of technical ease of implementation of the solution, ease of measuring the reduction of gas consumption through the implementation of the solution, appropriate time to implement the solution, access to specialized technicians to implement the solution and access to parts and tools needed to implement the solution. Evaluation and prioritization of solutions were considered. The weight and importance of each criterion are not equal. Therefore, pair-wise comparisons were made between the two criteria to finally calculate the weight coefficients of the criteria. These strategies were scored based on the above five criteria by a group of experts and were prioritized based on the scores obtained using the Analytic Hierarchy Process (AHP) technique. Finally, using the K-Means clustering technique, the solutions were classified and presented in three groups based on the scores of the five criteria evaluated. Some of these solutions are related to technical adjustments, insulation, equipment replacement, compliance with performance standards, installation of new equipment, and basic measures.Keywords: Powerhouse, Clustering, Natural gas, Passenger Transport, Cargo transportation
-
وقوع جرم در جامعه، نه تنها باعث ایجاد ناامنی و آشفتگی زندگی مردم می شود و هزینه های مادی و معنوی گسترده ای بر دوش جامعه می گذارد، بلکه زمان، هزینه و انرژی بسیار زیادی را نیز از ماموران امنیتی کشور به خود معطوف می کند. بررسی مکانی وقوع جرم در گذشته و پیش بینی احتمال رخداد آن در آینده و یا به عبارت دیگر، تعیین کانون های مکانی جرم خیز می تواند به مدیریت بهتر پیشگیری از وقوع جرم و یا برخورد موثر با آن کمک کند. اما متاسفانه اندازه گیری یک کانون بحران یک مسیله پیچیده است. در این راستا، روش های آماری وجود دارند که برای شناسایی کانون های بحران می توانند مورد استفاده قرار گیرند، که از جمله آن ها تحلیل های خوشه ای است. در پژوهش حاضر سعی شده است جهت کارایی مناسب اینگونه تحلیل ها، با رویکردی ترکیبی از سامانه های اطلاعات مکانی و خوشه بندی K-means، توزیع مکانی جرم در شهر قزوین (به عنوان نمونه موردی) مورد بررسی قرار گیرد تا براین اساس، به تعیین دقیق تر مکان کانون های جرم کمک شود. نتایج نشان داد که این رویکرد ترکیبی، امکان مدلسازی کانون های مکانی وقوع جرم در شهر قزوین را دارا بوده، به نحوی که مشخص شد، توزیع جرم های اقتصادی و اجتماعی در حوالی کلانتری 11 و جرایم امنیتی در کلانتری 17 شهر مذکور، بیشتر است.
کلید واژگان: وقوع جرم، کانونهای بحران، خوشه بندی، سامانه های اطلاعات مکانی، قزوینThe occurrence of crime in society causes insecurity and chaos in people's lives, imposes extensive material and spiritual costs on society, and diverts a lot of time, money, and energy from the country's security agents. Spatial investigation of a crime in the past and predicting the likelihood of its occurrence in the future, or in other words, determining the spatial centers of crime, can help manage crime prevention better or deal with it effectively. Unfortunately, measuring a crisis center is a complex issue. In this regard, many statistical methods can be used to identify crisis hotspots, including cluster analysis. In the present study, for the proper efficiency of such analyzes, with a combined approach of spatial information systems and K-means clustering, the spatial distribution of crime in Qazvin (as a case study) is investigated. Assist in locating crime centers more accurately. The results showed that this combined approach could model the local centers of crime in Qazvin.
Keywords: Crime Occurrence, Crisis Centers, Clustering, Geospatial Information Systems, Qazvin -
استفاده بی رویه از منابع آب زیرزمینی سبب شده تا وضعیت آبخوان ها در شرایط بحرانی قرار گیرد. این مطالعه به ارایه یک چارچوب در استفاده از شبکه بیزین در برآورد سطح آب زیرزمینی و تحلیل هیدروگراف آبخوان می پردازد. یک دوره آماری 10 ساله، 8 سال جهت آموزش و 2 سال جهت صحت سنجی مدل، استفاده شد. مدل شبکه بیزین در سه حالت صریح، خوشه بندی و حالت با تاخیر دو و سه ماهه اجرا و مورد تحلیل قرار گرفت. نتایج شبیه سازی در حالت صریح نشان داد که بیشتر چاه های مشاهده ای دارای همبستگی مناسبی بین سطح آب زیرزمینی شبیه سازی شده و مشاهداتی می باشد. نتایج حالت خوشه بندی نسبت به حالت صریح دارای دقت کمتری بود. در حالت سوم، تاخیر دو و سه ماهه جهت شبیه سازی استفاده شد. در این حالت نتایج نشان داد که میزان همبستگی بین سطح آب زیرزمینی مشاهده شده و شبیه سازی شده کاهش یافته است به گونه ای که در تاخیر زمانی یک ماهه، ریشه میانگین مجذور مربعات خطا برابر 1.87 متر، در حالت با تاخیر دو ماهه 3.76 متر و در حالت سه ماهه برابر 6.42 متر است. بنابراین، تاخیر زمانی یک ماهه جهت شبیه سازی ها انتخاب گردید و به منظور ارزیابی و برآورد تغییرات کل آبخوان از هیدروگراف آبخوان استفاده شد که نتایج حاکی از دقت مناسب نتایج برای کل آبخوان می باشد.
کلید واژگان: آبخوان قزوین، خوشه بندی، سطح آب زیرزمینی، شبکه بیزین، شبیه&lrm، سازیExcessive use of groundwater resources has put the aquifers in critical situations. This study provides a framework for using the Bayesian network for groundwater level estimation and aquifer hydrograph analysis. A 10-year statistical data, 8 years data for model training, and 2 years data for model validation, were used. The Bayesian network model was implemented and analyzed in three explicit, clustering, and two- and three-month delay states. Explicit simulation results showed that most of the wells have a good correlation between the simulation and observed data. Clustering results were less accurate than explicit ones. In the third case, two and three months delay data was used to simulations. The results showed that the correlation between observed and simulated groundwater levels decreased. At 1, 2 and 3 months delay statues, Root Mean Square Error was 1.87 m, 3.76 m, and 6.42 m, respectively. Therefore, the one-month lag time was chosen for the simulations and aquifer hydrograph was used to evaluate and estimate total aquifer variations. The results indicate the appropriate accuracy of the aquifer parameters estimation.
Keywords: Bayesian Network, clustering, Groundwater Level, Qazvin aquifer, Simulation -
همواره کارآمدی روش واگذاری طرح های زیر بنایی به پیمانکاران یکی از دغدغه های اصلی کارفرمایان می باشد. هدف از این پژوهش، پیشنهاد روشی جدید برای اختصاصی نمودن معیارهای ارزیابی، با توجه به نوع پروژه ی تحت واگذاری و اولویت بندی و تعیین امتیاز پیشنهادی معیارهای ارزیابی پیمانکاران با استفاده از دو روش مختلف می باشد، روش اول شامل تحلیل های آماری بر روی پرسشنامه ها و روش دوم شامل متن کاوی مصاحبه ها است. برای این منظور، پس از مطالعات کتابخانه ای، میدانی و طراحی پرسشنامه، پرسشنامه ها در اختیار خبرگان این صنعت قرار گرفت و با تحلیل آماری آنها، معیارها و زیرمعیارهای مهم تعیین شد و سپس با گروهی دیگر از خبرگان به صورت باز مصاحبه انجام شد. با متن کاوی متون مصاحبه ها و خوشه بندی آنها، معیارها و شاخص های ارزیابی پیمانکاران شناسایی شده و نتایج این دو روش با آیین نامه اجرایی بند “ج” ماده 12 قانون برگزاری مناقصات،مقایسه گردید. برای تحلیل پرسشنامه ها از نرم افزار SPSS و برای متن کاوی مصاحبه ها از الگوریتم K-means بهره گرفته شده است. یافته های پژوهش بیانگر همسویی نتایج متن کاوی و پرسشنامه می باشد. از همسویی نتایج متن کاوی و پرسشنامه می توان نتیجه گرفت که معیارهای شناسایی شده از دقت و قابلیت تعمیم قابل قبولی برخوردارند و سازمان ها می توانند از این معیارها و شاخص های ارزیابی برای انتخاب مناسب ترین پیمانکار در مناقصات استفاده کنند. معیارهای شناسایی شده توسط ابزار متن کاوی و پرسشنامه، علاوه بر پوشش تمامی معیارهای معرفی شده در آیین نامه اجرایی قانون برگزاری مناقصات، دو معیار جدید تحت عنوان مدیریت دعاوی و بهداشت، ایمنی و محیط زیست و کنترل کیفت را نیز شامل می شوند.
کلید واژگان: معیارهای ارزیابی پیمانکاران، متن کاوی، داده کاوی، خوشه بندی، مناقصهThe efficiency of contractors selection in infrastructure projects is always one of the main concerns of employers. The purpose of this study is to propose a new method for specification of evaluation criteria, according to the type of project under assignment and prioritization, and to determine the proposed score of the evaluation criteria of the contractors using two different methods. The first involves statistical analysis of the questionnaires and the second involves the text mining of the interviews. For this purpose, after library studies, fieldwork and questionnaire design, questionnaires were given to experts in the industry and their statistical analysis identified important criteria and sub-criteria and then interviewed another group of experts. Using the text mining and clustering of interview texts, the criteria and indices of contractors' evaluation were identified and the results of these two methods were compared with the bidding law implementing regulations in Iran. SPSS software was used to analyze the interviews and K-means algorithm was used to interviews text mining. The findings of the study indicate that the results of the text mining and questionnaire are in agreement and It can be concluded that the identified criteria have acceptable accuracy and generalization capability and organizations can use these criteria and evaluation indicators to select the most suitable contractor in the tenders. Identified Criteria, in addition to covering all the criteria introduced in the Bidding Law Implementing Regulations, also include two new criteria, namely Claim Management and Safety Management & Quality Control.
Keywords: Construction Evaluation Criteria, Text Mining, Data Mining, clustering, Tender -
در سال های اخیر با پیشرفت فناوری های جمع آوری اطلاعات و فراهم شدن حجم عظیمی از داده های پیچیده همچون سری های زمانی نیاز به روش هایی مناسب به منظور تجزیه و تحلیل این نوع داده بیش از پیش احساس می شود. از میان روش های مختلف داده کاوی موجود تکنیک خوشه بندی داده ها با هدف ساده سازی مجموعه داده های بزرگ و استخراج اطلاعات مفید توجه بسیاری از محققین علوم کامپیوتر را به خود جلب کرده است. مسئله ی انتخاب تابع فاصله یکی از مهم ترین چالش هایی است که پیش از آغاز فرآیند خوشه بندی سری های زمانی مورد توجه قرار می گیرد. انتخاب تابع فاصله ی مناسب یک مجموعه داده به شناخت ماهیت داده پیش از انجام عملیات خوشه بندی وابسته می باشد و از این رو امری پیچیده و زمانبر می باشد. از سویی دیگر تاکنون توابع فاصله ی مختلفی با ویژگی ها و نقاط قوت متفاوت به منظور اندازه گیری میزان تفاوت/شباهت میان سری های زمانی پیشنهاد داده شده است. چگونگی ارایه ی یک روش خوشه بندی با قابلیت بهره جستن از ویژگی های توابع فاصله ی مختلف به طور همزمان و بدون نیاز به شناخت ماهیت داده ها پیش از آغاز فرآیند خوشه بندی، چالش اصلی این تحقیق می باشد. به منظور حل این مسئله در این تحقیق یک روش خوشه بندی با ترکیب روش خوشه بندی Fuzzy C-Means (FCM) و الگوریتم شناخته شده ی مبتنی بر هوش جمعی انبوه ذرات (PSO) با هدف استفاده از توابع فاصله ی مختلف با وزن های متفاوت در حین فرآیند خوشه بندی پیشنهاد داده شد. انتخاب تابع هدف در این مطالعه به گونه ای بوده است که نتیجه ی حاصل از خوشه بندی بیشترین اشتراک را با نتایج خوشه بندی حاصل از توابع فاصله ی مختلف داشته باشد. به عبارت دیگر روش خوشه بندی ارایه شده در این تحقیق یک روش خوشه بندی توافقی می باشد که نتیجه حاصل توافق میان توابع فاصله ی مختلف می باشد. روش پیشنهادی ارایه شده در این تحقیق با در نظر گرفتن سه تابع فاصله ی مختلف بر روی هفت سری مجموعه داده ی شناخته شده از سری های زمانی پیاده سازی شد و با پنج روش دیگر مقایسه گردید نتایج حاصل از این مقایسه نشان داد روش ارایه شده در این تحقیق در بیشتر از 85 درصد موارد بهتر از سایر روش ها عمل کرده است.
کلید واژگان: داده کاوی، خوشه بندی، تابع فاصله، سری زمانی، Fuzzy C-Means، الگوریتم انبوه ذراتIn recent years, the advancement of information gathering technologies such as GPS and GSM networks have led to huge complex datasets such as time series and trajectories. As a result it is essential to use appropriate methods to analyze the produced large raw datasets. Extracting useful information from large data sets has always been one of the most important challenges in different sciences, and data mining techniques provide useful solutions to solve this problem. Nowadays, clustering technique as the most widely used function of data mining, has attracted the attention of many researchers in various sciences. Due to different applications, the problem of clustering time series data has become highly popular and many approaches have been presented in this field. An efficient clustering method groups data in such a way that the objects in the same cluster are more similar to each other than to objects in different clusters. In order to compute the difference/similarity between time series data in clustering process, a similarity measure or distance function is used. Therefore, choosing an appropriate distance function is one of the most important challenges that should be considered before starting the clustering process. So far, various distance functions have been proposed to measure the difference/similarity between time series and each of them have its own strengths and weaknesses. Since choosing a suitable distance function to cluster a specific data set is a complicated process, in this study, we proposed a clustering method based on combination of the well-known Fuzzy C-Means (FCM) method and the Particle Swarm Optimization with the ability of using different distance functions in time series clustering process. In this way, the step of choosing the best distance function before starting time series clustering procedure has been deleted and different similarity measures can participate in the clustering process with different impacts. The objective function in this study is defined based on Fuzzy C-Means clustering objective function and the particle Swarm Optimization algorithm is used to find the optimal value for the considered objective function. Finally, by considering three distance functions including Euclidean distance, dynamic time warping and Pearson correlation coefficients the proposed method was implemented on seven well-known UCR time series datasets. Also, by considering the average normalized mutual information as a criterion for evaluating the performance of methods in this research, the proposed method was compared with five other methods. The results of this comparison indicated that the method presented in this study performed better in more than 85% of cases rather than other methods. In order to have a better evaluation, Tukey’s multiple comparison tests with a threshold of p < 0.05 is used with the ability of comparing the methods in pairs. The results obtained by Tukey test showed that, in about 83% of cases, the difference between achieved results by the proposed method in this study and results obtained by the other five techniques are statistically significant. Overall, the results of this study clearly showed the superiority of the proposed clustering method in the production of high quality clusters in comparison to some other methods.
Keywords: Clustering, Time Series, Particle Swarm Optimization, Fuzzy C-Means -
سنجنده های ابرطیفی با اخذ تعداد زیادی از باندهای الکترومغناطیسی مجاور همواره از پتانسیل های بالایی در شناسایی عوارض و پدیده های سطح زمین برخوردار هستند. این تعداد زیاد باند اگر چه موجب می شود تا این نوع سنجنده ها توانایی بالاتری در تقریب منحنی طیفی مواد داشته باشند ولی از سوی دیگر مشکلاتی را نیز به وجود می آورند. سختی در انتقال داده، ضعف عملکرد طبقه بندی کننده های مرسوم به دلیل تعداد داده های آموزشی محدود و زمان و حجم پردازش بالا از جمله ی مهم ترین این مشکلات می باشند. از این رو روش های مختلف کاهش ویژگی برای این نوع تصاویر پیشنهاد شده است. در مقاله پیش رو یک روش استخراج ویژگی نظارت نشده مبتنی بر تکنیک خوشه بندی ارائه شده است. در روش پیشنهادی، پس از خوشه بندی تصویر و تشکیل فضای پدیده به کمک میانگین خوشه ها، باندها به کمک الگوریتم خوشه بندی K-medoids خوشه بندی می شود. و در هر خوشه از چهار نوع شاخص آماری گرایش مرکزی میانگین، میانگین هندسی، میانگین هارمونیک و میانه به منظور استخراج ویژگی استفاده می شود. نتایج نهایی پیاده سازی ها بر روی سه تصویر واقعی ابرطیفی در شرایط وجود تعداد داده های آموزشی مختلف در هر کلاس نشان می دهد که دقت کلی طبقه بندی با ویژگی های به دست آمده از روش پیشنهادی این تحقیق در بهترین حالت (72.12) می تواند تا حدود 7 درصد بیشتر از چهار روش دیگر کاهش ویژگی تبدیل مولفه اصلی (PCA) (64.39)، موجک (64.58)، روش انتخاب ویژگی بر اساس خوشه بندی باندها بر مبنای واریانس(65.30) و استخراج ویژگی غیر پارامتریک وزن دار (NWFE) (64.12) باشد.
کلید واژگان: استخراج ویژگی، طبقه بندی، فضای پدیده، خوشه بندی، بعد مجازی، طبقه بندی کننده بیشترین شباهتHyperspectral sensors have high capability in identifying objects by acquiring a large number of adjacent electromagnetic bands. Although This large number of bands makes it possible to approximate the more precise spectral curve of the material, it also brings some challenges. The difficulty in data transfer, the weak performance of conventional statistical classifications due to the limited number of training data, and the high processing time are the most important ones. Hence, different methods of dimensionality reduction are proposed for hyperspectral images. In the following article, an unsupervised feature extraction method is proposed based on the bands clustering technique. In the proposed method, after the prior image clustering and forming the prototype space with the aid of the clusters’ averages, the bands are clustered using the K-medoids clustering algorithm. In each cluster, four types of central tendency measures, mean, geometric mean, harmonic mean, and median are used to extract the final features. The experiments are conducted on the three real hyperspectral images with medium and high spatial resolution. Final results indicate that the classification results of the proposed method can reach (72.12) which is 7% higher than the other four competitive methods, principal component analysis (PCA) (64.39), wavelet (64.58), feature selection method based on bands clustering based on variance (65.30) and non-parametric weighted features extraction (NWFE) (64.12) .
Keywords: Feature Extraction, Classification, Prototype Space, Clustering, Virtual Dimensionality, Maximum Likelihood Classifier -
پل های کابلی از جمله شریان های حیاتی با اهمیت زیاد هستند که همه ساله هزینه های بالایی صرف تعمیر و نگهداری آنها می شود. پایش سلامت این پل ها می تواند از خسارت های مالی و جانی نامطلوب بکاهد. در این مقاله یک روش پایش سلامت پل های کابلی بر اساس پردازش سیگنال و خوشه بندی داده ها ارایه شده است. از آنجا که دقت روش پردازش سیگنال می تواند به شدت بر دقت شناسایی خسارت تاثیر گذار باشد، در بخش اول مقاله، ابتدا مقایسه ای شده است بین کارایی روش محبوب FDD و دو روش جدیدتر AFDD و TDD که تعدادی از ضعف های این روش را برطرف کرده اند، و در نهایت روشی که کارامدتر می باشد انتخاب شده است. از میان این روش ها، روش FDD با موفقیت در بسیاری از روش های مبتنی بر پردازش سیگنال به کار رفته است ولی روش های جدیدتر AFDD و TDD هنوز به اندازه FDD مورد مطالعه قرار نگرفته اند. در بخش دوم با بهره گیری از شبکه عصبی رقابتی برای خوشه بندی فرکانسها، یک شاخص خسارت جدید با محاسبه فاصله اقلیدسی مراکز خوشه ها ارایه شده است. نتایج نشان می دهد که روش ارایه شده می تواند با دقت مناسبی حالت های سالم و آسیب را از یکدیگر تفکیک کند.کلید واژگان: شناسایی خسارت، پایش سلامت سازه ها، پردازش سیگنال، خوشه بندی داده ها، شبکه عصبی رقابتیCable-stayed bridges are vital structures which need significant maintenance and repair costs every year. Therefore, health monitoring of such structures can mitigate human and financial losses. In this paper, a damage detection method for cable-stayed bridges is proposed using signal processing and clustering. Since the accuracy of signal processing can considerably affect the accuracy of damage detection results, in the first part of the paper, a comparison is carried out between the popular FDD method and two newer AFDD and TDD methods which have improved some of the FDD drawbacks. Then, the most effective method is selected. Among these procedures, FDD is successfully implemented in signal-based procedures. However, the two newer ones have not adequately investigated in comparison to FDD. In the second part, by using competitive neural network for clustering, a new damage index is introduced by calculation of the Euclidian distances of cluster centers. Results show that the proposed damage detection algorithm can differentiate healthy and damage states with acceptable accuracy.Keywords: damage detection, Structural health monitoring, signal processing, clustering, competitive neural network
-
در سالهای اخیر، رشد بالا و روزافزون داده های خطوط سیر مکانی و لزوم پردازش و استخراج اطلاعات مفید و الگوهای معنی دار از آن ها منجر به جلب توجه محققان بسیاری در زمینه خوشه بندی خطوط سیر مکانی-زمانی شده است. تاکنون توابع شباهت و الگوریتم های خوشه بندی مختلفی برای طبقه بندی خطوط سیر ارائه شده اند. گستردگی الگوریتم های خوشه بندی و نتایج منحصر به فرد هر یک بر لزوم توجه و بررسی نقاط ضعف و قوت آن ها تاکید می کند. در این تحقیق، الگوریتم های خوشه بندی در خطوط سیر مکانی که تعمیم یافته از الگوریتم های خوشه بندی داده های نقطه ای هستند به چهار دسته ی کلی روش های افرازی، سلسله مراتبی، چگالی مبنا و مبتنی بر بهینه سازی تقسیم شدند و پرکاربردترین الگوریتم ها در هر دسته پیاده سازی و مورد ارزیابی قرار گرفتند. فرایند ارزیابی بر روی دو مجموعه داده با پیچیدگی متفاوت و در سه حالت بدون خطا، خطا با توزیع گوسین و وجود داده پرت انجام گرفته تا توانایی روش ها در شرایط مختلف بررسی گردد. از شاخص سیلووت و زمان محاسباتی به عنوان دو پارامتر برای مقایسه و ارزیابی استفاده شده است. با توجه به نتایج به دست آمده توجه به داده و ویژگی های آن در انتخاب روش مناسب خوشه بندی حائز اهمیت است. با این حال در مجموع بهترین نتایج از لحاظ کیفیت خوشه بندی به ترتیب از دسته های مبتنی بر بهینه سازی، افرازی، سلسله مراتبی و چگالی مبنا و از لحاظ سرعت محاسبات به ترتیب دسته های چگالی مبنا، سلسله مراتبی، افرازی و مبتنی بر بهینه سازی حاصل شده است. دسته افرازی (صرفا زیر دسته طیفی) بالاترین مقاومت در برابر داده پرت و روش های چگالی مبنا و مبتنی بر بهینه سازی بالاترین مقاوت در برابر نویز را از خود نشان داده اند.کلید واژگان: خطوط سیر مکانی، خوشه بندی، شاخص سیلووت، زمان محاسباتیIn recent years, the tremendous and increasing growth of spatial trajectory data and the necessity of processing and extraction of useful information and meaningful patterns have led to the fact that many researchers have been attracted to the field of spatio-temporal trajectory clustering. The process and analysis of these trajectories have resulted in the extraction of useful information which is able to respond to different challenges in real-world applications such as traffic management and control, smart transportation, surveillance, security and biological studies. Clustering is one of the most important methods for trajectory pattern extraction, their volume reduction, discovering outliers in trajectories, indexing and their simple visualization. So far, different similarity functions and clustering algorithms have been proposed for trajectory clustering. The diversity of clustering algorithms and their unique results highlights the need for paying attention to their weaknesses and strengths. Some clustering algorithms are only effective on low volume datasets. There are also some algorithms which are only able to extract clusters with convex shape, whereas some of them extract clusters of any shapes. On the other hand, several clustering functions require the determination of the initial value, such as the number of clusters by the users while some others do not need initial inputs. In addition, outlier detection is not possible in all clustering algorithms. In this study, spatial trajectories clustering algorithms that are extended from point clustering algorithms is divided into four general categories: partitioning-based clustering, hierarchical clustering, optimization-based clustering and density-based clustering. Then, the most commonly used algorithms in each category are implemented and evaluated. The evaluation process is performed on two sets of data (cross and i5) with dissimilar complexity. The effect of noise and outliers is one of the most critical parameters engaged in the performance quality of clustering functions which is considered in this study. The Silhouette index and computational time are used as two parameters for comparison and evaluation. According to obtained results, it is crucial to consider the data, its features, and also the utilized distance function in order to decide on the proper clustering method. However, generally, the best results regarding the clustering quality are obtained from optimization-based clustering. With the integration of genetic algorithm into the K-means, all results in two cases of using both two datasets and using two different distance functions are improved. Using the genetic algorithm in K-means leads to finding the optimum location of cluster centers and dealing with the local minimum problem. It is important to note that high computational time is one of the weaknesses of optimization-based clustering. After the optimization-based clustering, regarding the clustering quality, partitioning-based, hierarchical and density-based clustering have achieved the second, third and fourth ranks respectively. With regard to the computational time, the best results are obtained from the density-based, hierarchical, partitioning-based and optimization-based clustering consecutively. Some methods such as K-means (a sub-category of partitioning-based clustering) are severely sensitive to outliers while spectral sub-category of partitioning-based clustering has a high resistance against them. Moreover, the density-based and optimization-based clustering methods have the highest tolerance against noise.Keywords: Spatio-Temporal Trajectories, Clustering, Silhouette Index, Computational Time
-
زلزله ها همواره به عنوان یکی از مخرب ترین بلایای طبیعی شناخته می شوند. به دلیل خسارت های اقتصادی و تلفات جانی بسیار بالا، پیش بینی زلزله امری ضروری به نظر می رسد. در این نوشتار، تغییرات زمانی پارامتر $b$ از رابطه ی گوتنبرگ ریشتر قبل از زلزله هایی با بزرگای $M_w=6.0$ و یا بالاتر از آن در ناحیه ی جنوبی ایران، منطقه ی قشم و اطراف آن مورد بررسی قرار گرفته است. از دو روش خوشه بندی K-M e a n s و نقشه ی خود سازمان ده S O M، برای یافتن الگو از این نوع زلزله ها استفاده شده است. براساس دو سنجه ی سیلوئیت و دیویس بولدین، تعداد 3 خوشه به عنوان تعداد بهینه ی خوشه برای هر دو روش مذکور به دست آمده است. قبل از تمامی زلزله های مورد بررسی، خوشه یی که معرف کاهش در مقدار $b$ است، مشاهده شده است. به عنوان نتیجه ی نهایی، کاهش مقدار $b$ در بازه ی زمانی مشخص به عنوان یک الگوی مشخص برای رخداد این زلزله های مخرب معرفی شده است.کلید واژگان: پیش بینی زلزله، داده کاوی، خوشه بندی، الگویابی، رابطه ی گوتنبرگ ریشترIran is known as one of the high risk seismic regions of the world. Over the past 50 years, many destructive earthquakes have occurred in this area, causing much human loss and financial damage. So, from the perspective of emergency-management and hazard preparedness, it is essential to make an effort to predict earthquake occurrence. Earthquake prediction is an instance of interdisciplinary research, which is a concern of many scientists in various fields, such as geology, seismology, engineering, mathematics, computer science and even social sciences, who study different aspects of the matter to find new solutions. Efforts in this field are divided into long-term and short-term predictions. The short-term predictions are based on precursors such as foreshock, seismic quiescence, decrease in radon concentrations and other geochemical phenomenon. Due to numerous complexities and unknown factors inside the earth, exact prediction of earthquakes is difficult and practically impossible. During the last two decades, many techniques have been developed to discover the pattern of seismic data and predict three earthquake parameters, namely; time of occurrence, location and magnitude of future earthquakes. Soft computing and data mining techniques, such as neural networks, fuzzy logic and clustering methods are appropriate tools for problems, such as earthquake prediction, that suffer from inherent complexities. Many researchers have used these approaches to reduce uncertainty in results. In this paper, the b-value of the Gutenberg Richter law has been considered as a precursor to earthquake prediction. Prior to earthquakes equal to or greater than $M_w$ = 6.0, temporal variation of the b-value has been examined in Qeshm island and neighboring areas in the south of Iran, from 1995 to 2012. The clustering method, by the k-means algorithm, and a self-organizing map (SOM) have been undertaken to find a pattern of variation of the b-value. Three clusters are obtained as an optimum number of clusters by the Silhouette Index and the Davis-Bouldin index. Prior to all the mentioned earthquakes $(M_wgeq 6.0)$ a cluster, known as a decrease in b-value, has been seen; so, a decrease in the b-value before main shocks has been considered as a distinctive pattern. Also, an approximate time of decrease has been determined.Keywords: Earthquake prediction, data mining, clustering, pattern recognition, Gutenberg, Richter law
-
با پیشرفت روز افزون تکنولوژی های جمع آوری اطلاعات و امکان دسترسی به حجم عظیمی از داده همواره نیازمند روش هایی برای تجزیه و تحلیل این حجم داده خام و استخراج اطلاعات مفید از آن می باشیم. امروزه خوشه بندی داده به عنوان یکی از روش های آنالیز و ساده سازی مجموعه داده های بزرگ، مورد توجه بسیاری از محققین قرار گرفته است. در این میان خوشه بندی سری های زمانی با دقت مورد قبول، حائز اهمیت بسیاری می باشد. در روش پیشنهادی از ترکیب الگوریتم تکاملی دیفرانسیلی و روش خوشه Fuzzy-Cmeans به عنوان یکی از الگوریتم های خوشه بندی مطرح و شناخته شده، برای خوشه بندی سری های زمانی استفاده گردید. در این روش برای کاهش مجهولات مسئله و در نتیجه افزایش کارایی الگوریتم، تکنیک های مختلف نمایش داده های مکانی-زمانی را مورد بررسی قرار دادیم و از این میان روش ضرایب DCT را برای کاهش مجهولات مراکز خوشه ها انتخاب کردیم. بدین مفهوم که الگوریتم تکاملی دیفرانسیلی انتخابی برای خوشه بندی، به جای یافتن تمامی المان های مراکز خوشه های موجود در مجموعه داده، تنها تعداد محدودی از ضرایب DCT این مراکز را یافته و سپس با استفاده از همین ضرایب محدود مراکز خوشه ها بازسازی می شوند. با در نظر گرفتن تابع فاصله ی Dynamic Time Warping و انتخاب تابع بهینه سازی مربوط به روش خوشه بندی Fuzzy-Cmeans، روش پیشنهادی بر روی دو مجموعه داده پیاده سازی شد و با روش خوشه بندی FCM و روش خوشه بندی مبتنی بر الگوریتم تکاملی دیفرانسیلی بدون استفاده از ضرایب DCT مقایسه گردید. روش پیشنهادی کندتر از الگوریتم خوشه بندی Fuzzy-Cmeans بوده اما به دلیل استفاده از روش تبدیل کسینوسی گسسته برای کاهش مجهولات، سریع تر از روش خوشه بندی معمول مبتنی بر الگوریتم تکاملی دیفرانسیلی عمل می کند. همچنین نتایج حاصل از مقایسه ی این سه روش نشان دهنده ی عملکرد بهتر روش پیشنهادی نسبت به دو روش دیگر می باشد.کلید واژگان: سری زمانی، خوشه بندی، الگوریتم تکاملی دیفرانسیلی، روش خوشه بندی Fuzzy، Cmeans، تبدیل کسینوسی گسستهTime series is a type of data with complex structure. Analysis of time series is used in sciences such as meteorology, economics, geology, marine science, medicine and engineering widely. So, Because of time series applications in various sciences, the interest to analyze these data has been increased.On the other hand by developing information gathering technologies such as mobile, GPS and sensors, and Access to large volumes of time series data, we always require methods to extract useful information from large datasets. Thus, data mining is an important method for solving this problem. Clustering analysis as the most commonly used function of data mining, has attracted many researchers in computer science. Clustering is a strong instrument for knowledge discovery and it provides useful information about existing patterns in datasets. In general, the purpose of clustering is representing large datasets by a fewer number of cluster centers. It simplifies large datasets and thus is an important step in the process of knowledge discovery and data mining. Fuzzy C-means (FCM) clustering is one of the most important classic clustering methods that have been used in many researches. The main disadvantage of this method is the high probability of getting trapped in local optima especially in facing high-dimensional data such as time series. Furthermore Euclidean distance is the most commonly used similarity measure in Fuzzy C-means but sometimes, its necessary to use another similarity/dissimilarity measures instead of Euclidean distance. In this paper in order to compensate the shortcomings of Fuzzy C-means algorithm, we used one of the existing evolutionary algorithms. Evolutionary algorithms has gained huge popularity in the field of pattern recognition and clustering recently. Among the existing evolutionary algorithms, the differential evolution algorithm as a strong, fast and efficient global search method has been attracted the attention of researchers. In this paper, we proposed a technique for clustering time series data using a combination of Fuzzy C-means and differential evolution (DE) approach and we considered dynamic time warping (DTW) as distance measures between time series. Also, in this method we used Discrete Cosine Transform (DCT) to time series dimension reduction. Finding all elements of cluster centers using differential evolution is time consuming and the large number of unknown parameters related to the cluster centers will reduce the efficiency and the speed of differential evolution algorithm.So, for reducing the search space,the most important Discrete Cosine Transform coefficients of the cluster centers were recognized as the main unknown clustering problem in the proposed method and differential evolution algorithm tries to determine the near optimal Discrete Cosine Transform coefficients of cluster centers by minimizing the Fuzzy C-means objective function. Experimental results over two popular data sets indicate the superiority of the proposed technique compared to fuzzy C-means and a clustering algorithm based on differential evolution without using dimension reduction techniques.Comparing the run time of the methods, the proposed method is slower than the Fuzzy C-means clustering algorithm, but due to the use of discrete cosine transform method to reduce unknowns, it operates faster than differential evolution without using dimension reduction techniques.Keywords: Time Series, Clustering, Fuzzy C, Means, Differential Evolution, Discrete Cosine Transform
-
International Journal of Optimization in Civil Engineering, Volume:6 Issue: 4, Autumn 2016, PP 567 -578Stochastic nature of earthquake has raised a challenge for engineers to choose which record for their analyses. Clustering is offered as a solution for such a data mining problem to automatically distinguish between ground motion records based on similarities in the corresponding seismic attributes. The present work formulates an optimization problem to seek for the best clustering measures. In order to solve this problem, the well-known K-means algorithm and colliding bodies optimization are employed. The latter acts like a parameter-less meta-heuristic while the former provides strong intensification. Consequently, a hybrid algorithm is proposed by combining features of both the algorithms to enhance the search and avoid premature convergence. Numerical simulations show competative performance of the proposed method in the treated example of optimal ground motion clustering; regarding global optimization and quality of final solutions.Keywords: clustering, silhuette, K, means, colliding bodies optimization
-
وقوع زلزله های مخرب بشر را بر آن داشته است که در فکر تدوین یک برنامه زیر بنایی برای کاهش خطرات و آسیب های ناشی از آن باشد. کاهش آسیب پذیری در برابر زلزله تنها از طریق تمهیدات ساختمانی مقدور نخواهد بود و هنگامی تحقق می یابد که ایمنی شهر در برابر خطرات زلزله به عنوان یک هدف در تمامی سطوح برنامه ریزی شهری مدنظر قرار گیرد. تخصیص صحیح و مناسب کاربری های مختلف شهری کمک شایانی به مسئله ی مدیریت بحران شهری مرتبط با زلزله می نماید بنابراین شناخت متغیرهای مختلف موثر در میزان آسیب پذیری مناطق شهری در برابر زلزله ازنظر کاربری زمین شهری ، تعریف و بیان رابطه ی آن ها با آسیب پذیری، تجزیه وتحلیل آن ها و درنهایت دستیابی به نقشه های بهینه کاربری با آسیب پذیری کم تر در مقابل زلزله هدف اصلی این تحقیق می باشد. در این تحقیق، به منظور بهینه کردن تخصیص کاربری های شهری با رویکرد کاهش آسیب پذیری ناشی از زلزله بر اساس فاکتورهای فیزیکی از الگوریتم بهینه سازی چند هدفه NSGA-II استفاده شده است. منطقه 12 شهرداری تهران به عنوان منطقه ی مطالعاتی در نظر گرفته شد. در این الگوریتم اهداف اصلی شامل بیشینه سازی سازگاری کاربری های مجاور، دسترسی کاربری ها، دسترس پذیری کاربری های بهداشتی-درمانی و مسکونی به شبکه معابر و کمینه سازی خطرپذیری در برابر خطر زلزله و کمینه سازی تغییر کاربری ها تعریف شده است. با توجه به چند هدفه بودن الگوریتم NSGA-II، درنهایت تصمیم گیرنده در جبهه ی جواب بهینه با تعداد زیادی جواب مواجه خواهد شد و این مسئله تصمیم گیری را دشوار خواهد کرد. به این منظور در این تحقیق برای کمک به تصمیم گیری بهتر و نمایش سناریوهای متناظر با اولویت تصمیم گیرندگان، از آنالیز خوشه بندی با روش K-means استفاده شده است. در تست های انجام شده بر روی الگوریتم بهینه سازی، مشخص شد که نتایج ازنظر همگرایی و تست تکرار پذیری قابل قبول می باشند. همچنین در چینش های بهینه ی به دست آمده وضعیت توابع هدف بهتر از وضعیت موجود است. نتایج این تحقیق می تواند به عنوان یک ابزار حمایت از تصمیم گیری به برنامه ریزان و سیاست گذاران مدیریت شهری مرتبط با زلزله در خصوص برنامه ریزی صحیح فضای شهری کمک نماید. روش مناسب بهینه سازی و منطبق با مسئله و تعریف توابع هدف مطابق با واقعیت و واردکردن جنبه های اصلی مسئله آسیب پذیری زلزله در مدل ارائه شده و اعمال نظرات تصمیم گیرندگان در مراحل تحقیق و در مرحله ی پایانی برای انتخاب چینش بهینه با تجزیه و تحلیل نتایج حاصل از سناریوها و خوشه بندی سناریوها نشان دهنده ی کارایی مدل می باشد.کلید واژگان: الگوریتم بهینه سازی چندهدفه، الگوریتم ژنتیک با مرتب سازی نامغلوب، تخصیص کاربری اراضی، سیستم اطلاعات مکانی، خوشه بندی، آسیب پذیری زلزله، شهر تهرانThe occurrence of earthquake has made human being consider fundamental plans to reduce the consequent danger and destruction. The only means to reduce the vulnerability is to set specific management of urban crisis in construction; moreover, this aim cannot be achieved unless the city immunity, in confrontation of the earthquake, is considered as a major purpose in all stages of urban planning. Proper allocation of various urban land uses helps hugely the process of management of urban crisis related to the earthquake; accordingly, recognizing the different effective variables of vulnerability of urban areas from the aspects of urban land use, definition and declaring their relations with vulnerability, their analysis and finally preparing the land use optimizing maps with less percentage of vulnerability, is the principle target of this paper.
In this paper, for optimizing urban land use allocation, with the approach of reducing the vulnerability caused by the earthquake based on the physical factors, the multi-objective optimization algorithm NSGA-II was used for modeling. The 12th district of Tehran was taken as the subject of study. In this algorithm the main objectives include: maximizing compatibility of adjacent land uses, accessibility of land uses, availability of sanitary-medical and residential land uses to the Road network and minimizing susceptibility in earthquake's time and Minimizing land uses change. Considering the fact that the NSGA-II algorithm is multi-objective, the decision maker encounters different solutions in the Pareto-optimal front, which makes the process more complicated. Accordingly, to aid the decision making process and presenting the correspondent scenarios with the decision maker's priority, the clustering analysis was used with K-means approach. To study the changes of the results of different implementations of algorithm and stability of optimization algorithm, convergence trend and repeatability test carried out.
In the resulted optimized land use arrangements, the levels of objective functions are much better than the previous arrangement. Moreover, accessibility objective function has been improved mostly under the effect of optimization (27 %). The average percentage of the improvement of the objective functions in the algorithm was 19 %. In the repeatability test, the average percentage of the overlay of the algorithm's solutions in different runs was recorded as 76 %, which can be recognized as a proper value, and represents the suitable repeatability of the algorithm. The results were found acceptable based on the convergence trend, by having the stable value of the objective functions after specific times of iteration.
Several factors represent the efficiency of the model which can be named as; the proper method of optimization that was compatible with the problem, defining the objective functions based on the reality and including the main aspects of the problem of the earthquake vulnerability in the presented model, concerning the opinion of the decision makers in the process of the research and the final stage for selecting the optimum arrangement with the analysis of the results of the scenarios and the scenario's clustering. The results of this research can be an aid as a means to support deciding for the planner and urban management policy makers encountering earthquake, in planning appropriately for the urban spaces.Keywords: Multi, Objective Optimization Algorithm, Land Use Allocation, Non, dominated Sorting Genetic Algorithm, II, Geospatial Information System, Clustering, Earthquake Vulnerability, Tehran -
در سال های اخیر، تکنولوژی لیدار به عنوان یک تکنولوژی کارآمد در کسب اطلاعات سه بعدی از زمین شناخته شده و هر روز بیش از پیش مورد توجه مهندسین و متخصصان مهندسی ژئوماتیک قرار می گیرد. استخراج عوارض از داده های لیدار به عنوان یکی از مسائل مهم در پردازش این اطلاعات به شمار می آید. یکی از راه های استخراج اتوماتیک عوارض از این داده ها استفاده از الگوریتم های خوشه بندی میباشد. تعیین روش بهینه خوشه بندی، تعداد خوشه بهینه و همچنین توصیفگرهای بهینه از جمله مسائل مهم در خوشه بندی این داده ها می باشند که تاکنون یک جواب ثابت و جهانی برای آنها ارائه نشده است. هدف از این تحقیق، تعیین توصیفگرهای بهینه در خوشه بندی داده های لیدار می باشد. برای این منظور، از یک نمونه داده لیدار 147 توصیفگر بافتی استخراج شده و با مینیمم کردن معیار NCE با کمک الگوریتم ژنتیک، که به عنوان یکی از الگوریتم های قوی در حل مسائل بهینه سازی مطرح می باشد، توصیفگرهای بهینه استخراج شدند. نتایج بدست آمده کارآیی الگوریتم ژنتیک در بهینه سازی و نیز بهینه بودن توصیفگرهای انتخاب شده را نشان می دهند.کلید واژگان: لیدار، استخراج عوارض، خوشه بندی، توصیفگرهای بافتی، بهینه سازی، الگوریتم ژنتیکLiDAR has been recently known as a powerful technology for 3D information acquisition from objects, and researchers are working on developing reliable techniques such as clustering for automatic object extraction from LiDAR data. Finding optimal clustering method, number of clusters and descriptors are the most challenging problems in clustering of LiDAR data. In this research, a GA based solution is presented for finding optimal descriptors of in LiDAR data clustering.
A vast number of features were considered in two categories of single operator and composite descriptors. Single operator features are extracted from first and last pulses of intensity and range data (FR, LR, FI and LI) in which, each operator are executed on this four data to extract four operator features. Besides, two other features of NDIR and NDII are also extracted from the resulted features. Here, ten groups of single operator features were extracted: Raw data (6 features), Scene Ratio(12 features), fractal (12 features), Gabor (12 features), Haralick (24 features), Moments (24 features), SemiVariogram (12 features), Normal Vector (36 features) and Roughness (6 features). Composite features are extracted using a combination of the operators in the first category which nine features were generated. Finally, 171 features are extracted from LiDAR data.
To simplify the computations, in the first level, unsuitable features are deleted from the list based on manual observation. Minimizing the NCE measure in clustering of LiDAR data using k-means algorithm, optimal descriptors in the remained list are assessed through Genetic Algorithm.
To evaluate the proposed method a sample area from the city of Stuttgart, Germany, were used. From the 171 extracted features 100 unsuitable features were deleted manually and the optimization process were executed on 71 features. In the sample area three clusters of Buildings, Trees and Land were considered for clustering. After executing GA process 5 features were selected as optimal features. Obtained results proved the ability of the GA algorithm as an optimization tool as well as the optimality of the selected descriptors in clustering.Keywords: LiDAR, Descriptor, Object Extraction, Clustering, Textural Descriptor, Genetic Algorithm -
با توجه به تغییرات مختلف و مداوم کاربری ها، در نظر گرفتن خاصیت دینامیک محیط شهری در برنامه ریزی شهری از اهمیت خاصی برخوردار است. بنابراین پیشنهاد چینش مناسب کاربری های شهری پس از وقوع تغییر در کاربری ها، کمک شایانی به مساله ی مدیریت پویای شهری می نماید. هدف اصلی این تحقیق ارائه ی روشی بر اساس GIS و الگوریتم بهینه سازی چندهدفه ی NSGA-II است که با استفاده از آن بتوان در صورت تغییر یک کاربری، چینش بهینه ی سایر کاربری های منطقه، در سطح قطعات شهری، به دست آورد. یک هدف فرعی نیز استفاده از آنالیز خوشه بندی برای کمک به تصمیم گیرنده در انتخاب جواب مورد نظر می باشد به نحوی که تصمیم گیرنده بتواند با توجه به معرفی اولویت های برنامه ریزی، سناریوی حاصل را ملاحظه و انتخاب نماید. در سازگارسازی الگوریتم NSGA-II با مساله، چهار تابع هدف بیشینه سازی سازگاری، بیشینه سازی وابستگی، بیشینه سازی مطلوبیت و بیشینه سازی همسانی کاربری های مجاور تعریف شدند. تامین سرانه ی کاربری ها در منطقه نیز به صورت قید در سناریوهای تولید شده به کار گرفته شد. به منظور حمایت از تصمیم گیری و نمایش سناریوها به تصمیم گیرندگان از آنالیز خوشه بندی با استفاده از الگوریتم بهینه سازی کلونی مورچه استفاده شد. در نهایت مدل با استفاده از داده های دو محله از منطقه ی 7 شهرداری تهران پیاده سازی و تست شد. همچنین نتایج حاصل از الگوریتم بهینه سازی از نظر همگرایی و تست تکرارپذیری در سطح قابل قبولی می باشند. در چینش های بهینه ی به دست آمده نیز وضعیت توابع هدف بهتر از وضعیت موجود است و کمبود سرانه ها تا حد قابل توجهی جبران شده است. مدل حاصل به برنامه ریزان و سیاست گزاران شهری در خصوص اصلاح طرح تفصیلی موجود پس از تغییر یک یا چند کاربری کمک می نماید.
کلید واژگان: مدیریت کاربری اراضی شهری، تغییر کاربری، سیستم اطلاعات مکانی، بهینه سازی چندهدفه، خوشه بندی، حمایت از تصمیم گیری، NSGA، IIIn urban space, the need to different facilities and diverse land uses increases continuously. Continuous changes in the demands of the citizens results in rapid and frequent land use changes. Therefore, dynamic characteristics of urban environment should be considered in urban planning. On the other hand, land uses have different effects on each other. In other words, any change in the land use of a parcel or zone, will results in tendency of its neighboring parcels for land use change. Therefore, proposing of new land use arrangements after any occurred land use change could be a proper response to such tendencies. The main goal of this study is to propose a method, based on GIS and NSGAII optimization algorithm, for generating optimum land use arrangements after any occurred land use change.Usually, the output of a multi-objective optimization algorithm is a collection of optimum solutions. Selection of appropriate solution from such a collection needs extra efforts and processes. Therefore, another goal of this research is to use an appropriate clustering method that helps the user to select the most preferred solution. With such a method, the decision maker can introduce his planning priorities, perceive the resulted scenario and select accordingly. In this research, ant colony clustering algorithm is used for clustering, first because of its high speed, and then because the representative of the clusters are selected from the Pareto front solutions. In this research, for modelling of the aspects of land use change and its factors, four objective functions are considered, which are: the maximization of land use compatibility, the maximization of land use dependency, the maximization of land use suitability, and the maximization of land use compactness. Finally, the providence of per capita for different land uses is considered as constraints. The ant colony clustering algorithm is used for clustering of the found solutions (land use arrangements). The developed method is implemented and tested using the data related to some districts of region 7 of Tehran.Different evaluations are considered and carried out for the results of optimization. These include the convergence trend, repeatability test, and the comparison of the previous land use arrangement with the optimized ones. In the resulted optimized land use arrangements, the levels of objective functions are much better than the previous arrangement. Furthermore, the required per capita for different land uses are much better satisfied. The highest improvement in the objective functions is 36%, which is related to land suitability. In addition, the required per capita is improved by 18.5% of. The results of clustering using ant colony clustering algorithm are compared with those of K-means and Fuzzy K-means. The comparison showed that the ant colony clustering algorithm is faster. In addition, the results of this clustering method are exactly the original solutions of the land use arrangement optimization.Finally, the developed method can help urban planners and decision makers to correct and change the detailed urban plans according to any occurred land use change. One of the limitations of the detailed urban land uses plans is that they are not flexible and cannot opt to the deviations from the plan. This research is one step in the development of a general approach to dynamic urban planning. Such a planning approach can respond to the continuous and dynamic changes of the land uses in urban space.Keywords: Urban Land use Planning, Land Use Change, Multi Objective Optimization, Clustering, GIS, Decision Support -
پدیده Speckle جزء طبیعت تصاویر رادار می باشد که باعث کاهش دقت تفسیر، طبقه بندی، قطعه بندی و... در این تصاویر می-شود. محققین توسط روش های مختلف سعی در کاهش این پدیده در تصاویر رادار داشته اند. یکی از روش های کاهش پدیده Speckle در تصاویر رادار فیلترهای حیطه مکان می باشند. عمده روش های فیلتر حیطه مکان از حدآستانه هایی برای طبقه بندی انواع اهداف استفاده می کنند، سپس بر مبنای نوع هدف پدیده Speckle را کاهش می دهند. استفاده حدآستانه بر روی تصاویر برای طبقه بندی هدف یک روش با خطا بالا است. بنابراین، روش خوشه بندی برای طبقه بندی هدف در این پژوهش استفاده می شود. در روش پیشنهادی، ابتدا پدیده Speckle تصویر خام رادار با استفاده از فیلتر میانگین کاهش یافت، سپس روش خوشه بندی K-Means با تعداد خوشه های متفاوت بر روی تصویر پیاده سازی شد. تعداد خوشه بهینه برای منطقه مورد مطالعه با استفاده از شاخص دیویس-بولدین تعیین گردید. در نهایت، تصویر فیلتر شده در یک سطح تصمیم گیری با تصاویر خوشه بندی و خام رادار تولید شد. نتایج روش پیشنهادی با روش های دیگر شامل فیلتر میانگین، فیلتر Lee، فیلتر Enhance Lee، فیلتر گاما و فیلتر میانه با استفاده از شاخص های حفظ اطلاعات رادیومتریکی و حفظ لبه مقایسه شد. نتایج نشان می دهد که روش پیشنهادی نسبت به روش های دیگر بر اساس شاخص های حفظ لبه و اطلاعات رادیومتریکی صحت بالاتری دارد.
کلید واژگان: پدیده Speckle، فیلترهای حیطه مکان، خوشه بندی، تصاویر تک کاناله رادارSpeckle phenomenon is appurtenance of radar image nature that is caused accuracy reduction in interpretation، classification، segmentation، etc. over these images. Researchers have tried to decrease this phenomenon in radar images. One of the speckle phenomenon reduction methods in the radar images is spatial domain filters. Main methods of the spatial domain filter use thresholds for classifying type of targets، then speckle phenomenon decreases based on type of target. Using threshold in images for target classification is a method with great error. Therefore، clustering method is used for target classification in this research. In proposed method، firstly، speckle phenomenon of radar raw image decreased by using Mean filter. Afterwards، K-Means clustering method implemented over the filtered image with various cluster numbers. Optimal cluster number in case study determined using Davis Bouldian index. Finally، filtered image was produced in a decision level with the clustering and the raw radar images. Results of the proposed method were compared with other method including Mean filter، Lee filter، Enhanced Lee filter، Gamma filter and Median filter by using radiometric and edge preservation indexes. Results show that the proposed method has higher accuracy than the other implemented methods based on the mentioned indexes.Keywords: Speckle phenomena, Spatial domain filters, Clustering, Single Channel Radar image -
تا کنون برای بهبود دقت روش های خوشه بندی پیشنهادات متعددی ارایه شده است که از آن جمله می توان به استفاده از روش های نیمه نظارت شده، ترکیب خوشه بندی ها و خوشه بندی دوگانه اشاره نمود. یکی از مهمترین رویکردها در این زمینه استفاده از اطلاعات مکانی تصویر می باشد. در این تحقیق چهار روش خوشه بندی که از اطلاعات مکانی سطح تصویر استفاده می-کنند با یکدیگر مقایسه گردید. این چهار روش شامل اعمال فیلتر اکثریت، استفاده از داده های بافت، خوشه بندی مبتنی بر شیء، و استفاده از میدان های تصادفی مارکوف می باشند که در کنار روش خوشه بندی k-means ساده روی چهار نمونه تصویر آزمایش شدند. استفاده از داده های بافت برای تصاویر واقعی تا 10.8 درصد و روش میدان های تصادفی مارکوف برای تصاویر شبیه سازی شده با 22.8 درصد بیشترین افزایش دقت را نسبت به خوشه بندی k-means نشان داده اند. نتایج این پژوهش نشان می دهند که استفاده از خوشه بندی k-means در شکل ساده اش به هیچ وجه همه توانایی اطلاعاتی تصویر را به کار نمی گیرد و نتایج و انتظارات کاربر را برآورده نخواهد کرد و استفاده از اطلاعات همسایگی یکی از بهترین راهکارهای افزایش دقت می باشد.
کلید واژگان: اطلاعات مکانی، تصویر ماهواره ای، خوشه بندی، سنجش ازدورIn order to enhance the accuracy of the image clustering, many clustering algorithms such as semi-supervised clustering, clustering ensembles and Coclustering have so far been proposed where the most effective strategy is when spatial context in clustering is considered. In this study, four clustering methods in which the spatial neighborhoodinformation is used are investigated. Theseinclude: using texture information, object based clustering, Markov random field clustering and applying majority filter onthe clustering results. These four methodsare tested on the two synthetic and two real high resolution satellite images. The results show that using texture informationin clustering can enhance the overall accuracy of the clustering of the real images up to 10.8% relative to the simplek-means clustering. Markov random field clustering of the synthetic images shows 22.8% improvement in overall accuracy.The results show that using spatial context can enhance the overall accuracy of the satellite image clustering.Keywords: Clustering, Remote Sensing, Satellite Image, Spatial Context
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.