fp-growth algorithm
در نشریات گروه کتابداری و مدیریت اطلاعات-
نشریه مطالعات کتابداری و سازماندهی اطلاعات، سال سی و پنجم شماره 2 (پیاپی 138، تابستان 1403)، صص 39 -66هدف
هدف این مطالعه، تحلیل و بررسی کاربرد فن داده کاوی در سامانه توصیه گر (پیشنهاددهنده) کتابخانه های دیجیتالی و مراکز اطلاعاتی بود. رویکرد داده کاوی در این سامانه، از طریق تحلیل الگوهای رفتاری کاربران کتابخانه های دیجیتال و ارائه پیشنهادهای دقیق، آنان را از مرور داده های غیر مرتبط در حین جستجو بینیاز می سازد که منجر به افزایش درخواست های اطلاعاتی کاربران و جلب و جذب رضایتمندی آنان از ارائه خدمات کتابخانه های دیجیتالی میشود.
روشپژوهش حاضر یک مطالعه تحلیلی از نوع پیمایشی مقطعی و تحلیل محتوا بود. در این روش طی چهار مرحله، داده های موردنیاز، جمع آوری و خروجی آن با استفاده از فن داده کاوی مورد تجزیه وتحلیل قرار گرفت. در مرحله اول، با تحلیل محتوا، سیا هه ای از تعداد تراکنش درخواست های کاربران از کتاب، شامل شناسه کاربران، عناوین نسخ، شماره کد شناسایی نسخ در سامانه کتابخانه دیجیتال (پایگاه نسخ خطی)، سازمان کتابخانه ها، موزه ها و مرکز اسناد آستان قدس رضوی مورد بررسی قرار گرفت و داده ها به صورت ستون کاربر و سطر آیتم (کتاب) مرتب شد. مرحله دوم، داده های خام پیش پردازش شده به ماتریس کاربر-آیتم که همان صفر و یک است، تبدیل شد. مرحله سوم، خروجی داده ها با کمک فناوری داده کاوی و اجرای کاوش قوانین انجمنی و الگوریتم FP-Growth بر روی نرم افزار رپیدماینر پیاده سازی و اجرا شد. خروجی به دست آمده، در این نرم افزار با تغییر درجه پارامترهای پشتیبان (میزان پشتیبانی از تکرار شدن منابع درخواستی) و اطمینان (میزان اعتماد به نتیجه موردنظر) مورد آزمون قرار گرفت. مرحله چهارم، صحت و درستی طرح پیشنهادی سامانه ارائه شد.
یافته هابرونداد این پژوهش نشان داد که قواعد انجمنی با درجه اطمینان بالای 50% بوده و قادر به تعیین الگوهای دسترسی کاربر است که بهترین حالت دسترسی به مجموعه دادههای تولیدشده با تنظیم درجه حداقل پشتیبانی 2% و حداقل اطمینان 95% است که منجر به ایجاد 1081 قوانین جدید با الگوریتم های شرطی (اگر - آنگاه) شد. چنانکه اگر کاربری در زمان جستجوی در نرم افزار کتابخانه دیجیتال موضوعاتی همچون (علم اصول، اجتهاد، سنت و...) را انتخاب نماید، به دلیل سابقه جستجوهای پرتکرار کاربران پیشین با همین موضوعات، از سوی سامانه توصیه گر، آنگاه عناوین مرتبطی با موضوع اصول فقه پیشنهاد خواهد شد. همینطور، اثبات درستی الگوی پیشنهادی نشان داد که مقدم و موخرهای ایجادشده از قوانین جدید با یکدیگر مشابهت موضوعی داشته است.
نتیجه گیریاین مطالعه نشان داد، فنون مختلف داده کاوی با کاربرد قوانین انجمنی و اجرای الگوریتم FP-Growth دارای کارایی و دقت بالا بوده و در تجزیه و تحلیل داده های کتابخانه های دیجیتالی و مراکز اطلاع رسانی برای ایجاد سامانه های توصیه گر به منظور پیش بینی درخواست های کاربران و پیشنهاددهی موثر، مناسب است و از مفاهیم کاربردی آن، فراهم نمودن بستری برای بهبود کیفیت تعامل دوسویه میان کتابداران و کاربران در جهت ارائه خدمات بهینه و سودمند است و همچنین ایجاد فرصت مناسبی برای ارتقاء نگرش و دیدگاه مدیران در جهت تامین منابع اطلاعاتی موافق با نیازهای واقعی کاربران خواهد بود.
کلید واژگان: سامانه توصیه گر، قوانین انجمنی در داده کاوی، کتابخانه دیجیتال آستان قدس رضوی، داده کاوی، کتابخانه دیجیتال، الگوریتم FP-GrowthPurposeThis study aimed to analyze and examine the use of data mining techniques in the recommender system of digital libraries and information centers. By analyzing the behavioral patterns of digital library users and providing detailed suggestions, the data mining approach in this system makes it unnecessary for them to review unrelated data during the search. This not only leads to an increase in users' information requests but also significantly enhances their satisfaction with the provision of digital library services.
MethodThe current research was an analytical study of cross-sectional survey type and content analysis. This method collected the required data in four stages, and its output was analyzed using a data mining technique. Using content analysis, as in the first stage, a list of the number of transactions of user requests for books, including user IDs, manuscript titles, manuscript identification code numbers in the digital library system (manuscript database), the organization of libraries, Museums and Documents Center of Astan Quds Razavi were investigated. The data were arranged as a user column and an item (book) row. In the second step, the preprocessed raw data was further transformed into a user-item matrix, which is zero and one. In the third stage, the data output was implemented and executed using data mining technology and the implementation of association rules and FP-Growth algorithm on RapidMiner software) and confidence (the confidence level in the desired result) were tested. In the fourth stage, the accuracy and correctness of the proposed system plan were presented.
FindingsThe output of this research revealed that the association rules have a confidence level above 50% and can determine the user's access patterns, which is the best way to access the generated datasets by setting the minimum support level of 2% and the minimum confidence level of 95%, leading to 1081 new rules with conditional algorithms (if-then). If a user selects topics such as (the science of principles, Ijtihad, tradition, etc.) during the search in the digital library software, due to the history of repeated searches by previous users with the same topics by the recommender system, then titles related to the subject of principles of jurisprudence will be suggested. Also, the proof of the correctness of the proposed model showed that the first and last ones created from the new laws had thematic similarities with each other.
ConclusionThis study showed that various data mining techniques with the application of association rules and the implementation of the FP-Growth algorithm have high efficiency and accuracy and are suitable for analyzing the data of digital libraries and information centers to create recommender systems in order to predict user requests and make effective suggestions. One of its practical concepts is to provide a platform to significantly enhance the quality of two-way interaction between librarians and users, thereby providing optimal and beneficial services, and also to create a suitable opportunity to improve the attitude and perspective of managers in order to provide information resources that meet the real needs of users.
Keywords: Recommender System, Association Rules In Data Mining, Astan Quds Razavi Digital Library, Data Mining, Digital Library, Fp-Growth Algorithm
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.