نمایه سازی ماشینی مدارک حوزه بازیابی اطلاعات با استفاده از متن کاوی در نرم افزار رپیدماینر

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:

سازگاری کدهای رده بندی و اصطلاحات نمایه سازی از یک اصطلاحنامه مدون با عبارات و کلماتی که به طور خودکار استخراج شده با استفاده از نمایه سازی ماشینی ایجاد می شود. در طراحی نظام نمایه سازی خودکار، کامپیوتر به طور کامل جایگزین انسان می شود. این پژوهش با هدف استخراج کلمات کلیدی و شناسایی گرایش های موضوعی مقالات نمونه آماری در حوزه بازیابی اطلاعات و تخصص موضوعی نویسنده هر مقاله با روش متن کاوی و دسته بندی آنها با استفاده از هم رخدادی واژگان صورت گرفته است. روش این پژوهش از نوع کاربردی است و براساس مدل کریسپ [1] از مدل های فرآیند داده کاوی و الگوریتم های متن کاوی انجام گرفته است. جامعه پژوهش، 313 مقاله حوزه بازیابی اطلاعات نمایه شده در پایگاه نورمگز است. پس از نرمال سازی متن مقالات با نرم افزار ویراستیار، طی متن کاوی مقالات با نسخه 7.1 نرم افزار رپیدماینر، واژگان کلیدی از طریق محاسبه وزن آنها استخراج و داده ها با استفاده از دو الگوریتم کلاسیک دسته بندی یعنی ک.ان.ان.[2] و نایوبیز [3] تجزیه و تحلیل شدند. در پژوهش حاضر، کامپیوتر با کمک ابزارهای متن کاوی نرم افزار رپدماینر، متن ماشین خوان را با استفاده از بسامد واژه ها به طور خودکار نمایه سازی کرده است. بدین منظور با کمک عملگرهای ان-گرام [4] و محاسبه وزن کلمات براساس روش تی.اف ای.دی.اف.[5]، اصطلاحات و مفاهیم کلیدی و تخصص موضوعی نویسنده هر مقاله در قالب 16 دسته بندی استخراج شده است. سرانجام برتری مدل ک.ان.ان. در دسته بندی موضوعات هسته مقالات این پژوهش با دقت 85 درصدی نسبت به مدل نایوبیز تایید شد. مشاهده نتایج محاسبه دقت های ماخوذه مدل ها، گواه کارایی قابل قبول نرم افزار رپیدماینر در نمایه سازی ماشینی متون است. نمایه سازی متون با استفاده از این روش، می تواند به بهبود نتایج بازیابی اطلاعات و جلوگیری از ریزش کاذب اطلاعات در پایگاه های اطلاعاتی کمک کند. 

زبان:
فارسی
صفحات:
349 تا 374
لینک کوتاه:
magiran.com/p2103537 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
دسترسی سراسری کاربران دانشگاه پیام نور!
اعضای هیئت علمی و دانشجویان دانشگاه پیام نور در سراسر کشور، در صورت ثبت نام با ایمیل دانشگاهی، تا پایان فروردین ماه 1403 به مقالات سایت دسترسی خواهند داشت!
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!