graph clustering
در نشریات گروه پدافند غیرعامل-
خوشه بندی گره های گراف از جنبه ساختاری یا محتوایی، همواره موردتوجه پژوهشگران حوزه داده کاوی بوده است؛ اما به خوشه بندی گراف بر مبنای ساختار و محتوا به طور ترکیبی کمتر توجه شده است. با توجه به نیاز خوشه بندی ساختاری-محتوایی در شبکه های اطلاعاتی که شبکه های اجتماعی نمونه ای از آنهاست، در این مقاله الگوریتم خوشه بندی ICS-Cluster ارایه شده که هر دو جنبه ساختار و محتوا را به صورت هم زمان در نظر می گیرد. هدف این روش، رسیدن به خوشه هایی با ساختار درونی منسجم (ساختاری) و مقادیر ویژگی (محتوایی) همگن در گراف است. در این روش ابتدا گراف اولیه به یک گراف ساختاری-محتوایی تبدیل می شود که در آن وزن هر یال (ارتباط) بیانگر شباهت ساختاری-محتوایی دو گره (موجودیت) است. خوشه بندی با توجه به وزن یال ها به صورت افزایشی انجام می شود بدین معنا که گره های یال با وزن بالا به عنوان خوشه در نظر گرفته می شوند و وزن یال های متصل به خوشه با یکدیگر ادغام شده و به صورت یک یال متصل به خوشه در نظر گرفته می شوند، این مراحل تا زمانی که الگوریتم به تعداد خوشه موردنظر کاربر برسد، ادامه خواهد یافت. الگوریتم ICS-Cluster به هر تعداد خوشه که مدنظر کاربر است، گراف را خوشه بندی می کند. مقایسه الگوریتم مطرح شده با سه الگوریتم خوشه بندی ساختاری- محتوایی ارایه شده، بر اساس معیارهای شش گانه سنجش کیفیت خوشه، بیانگر عملکرد مناسب روش ICS-Cluster است. این معیارها معیارهای ساختاری تراکم خوشه، خطای یال و پیمانگی، معیار محتوایی میانگین شباهت، معیار ساختاری-محتوایی CS-Measure و زمان اجرای روش ها است.
کلید واژگان: خوشه بندی گراف، خوشه بندی ساختاری- محتوایی، گراف خصوصیت، استخراج خوشهResearchers have always been interested in graph nodes clustering based on content or structure. But less attention has been paid to clustering based on both structure and content. But a content-structural clustering is needed in information networks like social networks. In this paper, the ICS-Cluster algorithm is proposed which takes into consideration both the structure and content aspects of the nodes. The purpose of this approach is to gain a coherent internal structure (structural aspect) and homogeneous attribute values (content aspect) in the graph. In this approach firstly the graph is converted into a content-structural graph which edges’ weight show similarity between the connected nodes. Incremental clustering is done based on edges’ weight in this process the edges with the most weight is considered as clusters then the weight of connected edge to the cluster is aggregated and they’ll be one edge, the process is repeated until the algorithm reaches the number of clusters that indicated by the user. ICS-Cluster algorithm number of cluster is indicated by the user. Comparing ICS-Cluster with other content structural algorithm based on six criteria for measuring cluster quality shows that ICS-Cluster has good performance. These criteria contain structural criteria (Modularity, Error Link, and Density), content criterion (Average Similarity), content-structural criterion (CS-Measure) and the run time.
Keywords: Graph Clustering, content-structural clustering, Attributed Graph, Cluster Extraction
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.