اثربخشی بسط پرس وجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN

چکیده:
بسط پرس وجو یکی از روش های موثر در بهبود اثربخشی نتایج بازیابی اطلاعات است. روش بازخورد شبه مرتبط (PRF) فرض می کند که اسناد رتبه بالا از نتایج اولیه بازیابی شده مرتبط به پرس وجو است و تعدادی کلمه مرتبط را از اسناد رتبه بالا برای بسط انتخاب می کند. وجود اسناد نامرتبط در بین اسناد رتبه بالا محققان را به ارائه روش هایی برای انتخاب بهترین اسناد به عنوان منبع برای انتخاب کلمه بسط سوق می دهد که انتخاب بهترین اسناد برای استخراج کلمات مرتبط برای بسط، موضوع مهمی در روش های بسط پرس وجو هست. در این مقاله، از خوشه بندی اسناد شبه بازخورد (CPRF) حاصل از نتایج اولیه، بر اساس شباهت مبتنی بر کلمه برای قرار دادن شبیه ترین اسناد کنار هم استفاده می شود. تعدادی از خوشه ها طبق محتوایشان به عنوان خوشه های بازخورد انتخاب می شوند و از خوشه های بازخورد، اسناد رتبه بالا به عنوان اسناد بازخورد انتخاب می شوند. سپس، یک سند ترکیبی از روی اسناد انتخابی تشکیل می شود و کلمات سند ترکیبی بر اساس تابع رتبه بندی TF-IDF مرتب می شوند. بعد، کلمات رتبه بالا برای بسط انتخاب می شوند. آزمایش های انجام گرفته روی مجموعه داده پزشکی MED نشان می دهد روش پیشنهادی معیار متوسط میانگین دقت (MAP) بالاتری نسبت به روش بازخورد شبه مرتبط (PRF) دارد.
زبان:
فارسی
صفحات:
143 تا 151
لینک کوتاه:
magiran.com/p1528355 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!