جستجوی مقالات مرتبط با کلیدواژه
k-means algorithm
در نشریات گروه پزشکی
تکرار جستجوی کلیدواژه k-means algorithm در مقالات مجلات علمی
-
مقدمهاین پژوهش باهدف بررسی مستندات رشته مهندسی کامپیوتر بازیابی شده از پایگاه Web of Science به منظور انجام خوشه بندی و متن کاوی آن ها صورت گرفته است.روش پژوهشروش این پژوهش از نوع توصیفی - تحلیلی است که به روش پیمایشی انجام شده و رویکرد متن کاوی را مورد نظر قرار داده است. جامعه پژوهش، مدارک حوزه مهندسی کامپیوتر نمایه شده در پایگاه Web of Science بود که در بازه زمانی 2004 تا 2014، 6186 رکورد گزارش شد. داده های جمع آوری شده، با استفاده از نرم افزار هیست سایت و اکسل نسخه 2013 و همچنین نرم افزار رپیدماینر نسخه 7.3 تجزیه و تحلیل شدند.یافته هابرای خوشه بندی پس از پیش پردازش داده ها و اجرای الگوریتم خوشه بندی k-means، 8 خوشه اصلی با عناوین «اینترنت و فناوری»، «امنیت سیستم های اطلاعات سلامت»، «انسان و تعامل با رایانه»، «وب پنهان»، «مدل های کامیپوتری»، «عملکرد سیستم های کامپیوتری»، «شبکه ها و پایگاه های اطلاعاتی»، «الگوریتم ها و روش های کشف دانش» و خوشه اینیز با عنوان «سایر موضوعات» تشکیل شد. به منظور ارزیابی خوشه ها از دو معیار دقت و بازیافت استفاده شد و برای هر دو معیار عدد 0/81 به دست آمد.نتیجه گیریاستفاده از کلماتی که به عنوان کلمات کلیدی در خوشه بندی ها انتخاب شده اند، می تواند به کاربر در صرفه جویی در وقت و بازیابی اطلاعات مرتبط کمک کند.کلید واژگان: متن کاوی، خوشه بندی، الگوریتم k-means، پایگاه Web of ScienceIntroductionThe aim of this study was to evaluate text mining and clustering of computer engineering documents retrieved from the Web of Science database.MethodsThis is a descriptive-analytical study which was conducted in a survey method using text mining approach. The research community was all computer engineering documents indexed in the Web of Science, among which 6016 cases were reported between 2004 and 2016. The collected data were analyzed by HistCite software, Excel version 2013 and RapidMiner version 7.3.ResultsIn order to perform clustering, after preprocessing the data and running K-means (a clustering algorithm), 8 main clusters were established. The clusters were Internet and Technology, Security of Healthcare Information Systems, Human-Computer Interaction, Semantic Web, Computer Models, Computer Systems Performance, Networks & Databases, Knowledge Discovery Algorithms and Other Topics. To evaluate the clusters, two criteria of precision and recall were used and a value of 0.81 was obtained for both criteria.Discussion and ConclusionUsing words selected as keywords in the clustering can help the user save time and retrieve the related information.Keywords: Text mining, Clustering, K-means algorithm, Web of Science Database
نکته
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.