به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

data clustering

در نشریات گروه کتابداری و مدیریت اطلاعات
تکرار جستجوی کلیدواژه data clustering در نشریات گروه علوم انسانی
تکرار جستجوی کلیدواژه data clustering در مقالات مجلات علمی
  • الهام یلوه، یعقوب نوروزی*، اشکان خطیر

    خوشه بندی به عنوان یک فرایند جهت شناخت ماهیت و ساختار داده ها در بسیاری از حوزه های علوم و فناوری های مرتبط با آن نقش مهمی در سازماندهی داده ها دارد. یکی از الگوریتم های پرکاربرد و ساده خوشه بندی، کا-میانه است. پژوهش حاضر با هدف مرور نظام مند تحقیقات در زمینه بهبود الگوریتم کا-میانه برای خوشه بندی داده ها صورت گرفته است. این پژوهش با یک راهبرد جدید بر مبنای کاستی های الگوریتم کا-میانه به بررسی تحقیقات انجام شده در این زمینه و نقش آن در سازماندهی داده ها در محدوده سال های 2010 تا 2020 می پردازد. برای این منظور میزان توجه پژوهشگران به رفع هر یک از کاستی های این الگوریتم برای بهبود طی سال های مزبور در قالب پرسش های پژوهش تدوین شده است. در این پژوهش با استفاده از استراتژی جست وجو، پالایش، و استخراج مقاله ها در نهایت، 47 منبع مرتبط شناسایی و مورد بررسی قرار گرفت. یافته ها نشان داد که بیشترین تحقیقات صورت گرفته با غلبه بر کاستی حساس به مراکز خوشه اولیه در جهت بهبود الگوریتم کا-میانه انجام شده است. همچنین، از 47 تحقیق مورد بررسی، الگوریتم بهبودیافته کا-میانه در 35 تحقیق بر روی داده های غیرمتنی و در 12 تحقیق بر روی داده های متنی اعمال شده است. سرانجام، نتیجه حاصل از بررسی 6 تحقیق از تحقیقات صورت گرفته نشان داد که حجم داده ها رابطه ای مستقیم با عملکرد الگوریتم بهبودیافته کا-میانه دارد. به عبارت دیگر، این الگوریتم باید به نوعی اصلاح شود که با اعمال بر روی حجم متفاوت داده ها خوشه بندی کارآمد و دقیقی انجام دهد.

    کلید واژگان: خوشه بندی داده، بهبود الگوریتم کا-میانه، خوشه بندی، مرور نظام مند
    Elham Yalveh, Yaghoub Norouzi*, Ashkan Khatir

    Clustering as a process to understand the nature and structure of data plays an important role in organizing data in many areas of science and technology. One of the most widely used and simple algorithms for clustering is K-means. The present study was conducted to systematically reviewing research on improving K-means algorithm on data clustering. This research examines the researches conducted in this field and its role in organizing data in the range of 2010 to 2020 with a new strategy based on the shortcomings of the K-means algorithm. For this purpose, the amount of attention of researchers to eliminate any of the shortcomings of this algorithm in order to improve it in recent years has been compiled in the form of research questions. In this study, with the use of a search strategy for refining and extracting articles, 47 related sources were identified and examined. Findings showed that most researches have been done by overcoming the sensitive shortcomings to initial cluster centers to improve the K-means algorithm. Also, out of a total of 47 studies, the improved K-means algorithm has been applied in 35 studies on non-textual data and in 12 studies on textual data. Finally, the results of a review of six studies showed that the amount of data is directly related to the performance of improved K-means algorithm. In other words, this algorithm must be modified in such a way as to perform efficient and accurate clustering by applying it to different amounts of data.

    Keywords: Data Clustering, K-means Algorithm, Clustering Improvement, Systematic Review
  • نرگس محمدعلیپور، فریبرز درودی *

    خوشه بندی، فرایند سازماندهی عناصر به گروه هایی است که اجزای آن به هم شبیه هستند. یک خوشه، مجموعه عناصری است که با هم مشابهت دارند و با اجزای دیگر خوشه ها ناهمگون می باشند. هدف خوشه بندی، دستیابی سریع و مطمئن به اطلاعات همبسته، و شناسایی ارتباط منطقی میان آنهاست. بنابراین، الگوریتم های خوشه بندی می تواند دربسیاری از حوزه های موضوعی به کار گرفته شود. از آنجا که نتایج خوشه بندی می تواند با تعداد اصطلاح های مورد استفاده تغییر یابد، روش های تجربی متعددی برای تشخیص تعداد تقریبی اصطلاح هایی که می توان انتظار داشت تا توزیع متناسب داده ها را در میان خوشه ها فراهم سازد و حدود بالا و پایین الگوریتم خوشه بندی را تعیین کند، ارائه شده است. یکی از کاربردهای خوشه بندی، سازماندهی اصطلاحنامه هاست. در این مقاله، با بهره گیری از روش مطالعه کتابخانه ای، ضمن بررسی مفهوم خوشه بندی اطلاعات، روش های موثر خوشه بندی اطلاعات و کاربرد آن در ساختار تزاروس (اصطلاحنامه) بیان شده است. از جمله روش های عمده خوشه بندی چهار شیوه خوشه بندی دسته ای، تک پیوندی، ستاره ای، و رشته ای است. نتیجه این مطالعه نشان می دهد که بهره گیری از الگوریتم های متناسب و روش های سودمند خوشه بندی اطلاعات می تواند نقشی مهم در سازماندهی بهینه اصطلاحنامه داشته باشد.

    کلید واژگان: خوشه بندی اطلاعات، تزاروس (اصطلاحنامه)، نظام های بازیابی اطلاعات، خوشه بندی مدارک
    Narges Mohammadalipoor, Fariborz Doroudi

    Clustering is a process of organizing objects into groups whose elements are similar to each other. A cluster is therefore a collection of objects which are similar to each other and dissimilar to the objects belonging to other clusters. The goal of clustering is to quickly access interconnected information and identify logical relationships between them. Clustering algorithms can be applied in many fields. As clustering results would be affected by the number of terms used, various experimental methods are used to find the approximate number of terms expected to produce a balanced distribution of data among clusters, and set upper and lower boundaries for the clustering algorithm. One of the applications of clustering is the organization of thesauri. The main objective of this paper is to have an accurate and appropriate explanation of the information clustering concept and its application in thesaurus structure. This research utilized library study to explain effective information clustering methods and their application in thesaurus structure. Some of the main methods of clustering are cliques clustering, single link, star and string clustering. The findings show that utilization of appropriate algorithms and useful methods of information clustering play an important role in optimum thesaurus organization.

    Keywords: Data clustering, thesaurus, Information Retrieval Systems (IRS), document clustering
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال