بازیابی و رتبه بندی افراد خبره با استفاده از مدل ترجمه مبتنی بر خوشه بندی
استخراج دانش از میان داده های موجود در وب باتوجه به حجم و تنوع بالای آن به یک چالش در حوزه ی بازیابی اطلاعات تبدیل شده است. در این میان، مساله ی بازیابی و رتبه بندی افراد خبره با هدف بازیابی و رتبه بندی افراد خبره در زمینه ی موضوع پرس وجوی کاربر، به عنوان یکی از مهم ترین مسائل موجود در این حوزه توجه بسیاری از پژوهشگران را به خود جلب نموده است. مهم ترین چالش در مسئله ی بازیابی افراد خبره تشخیص میزان ارتباط بین کلمات پرس وجو و سند های نوشته شده توسط نامزد های خبرگی است. یک مشکل اساسی در این حوزه فاصله ی واژگانی میان کلمات پرس وجو و سند های نامزد های خبرگی است. در این مقاله دو مدل ترجمه ی جدید برای مدل سازی فاصله ی واژگانی ارائه شده است. مدل اول یک مدل احتمالاتی مبتنی بر خوشه بندی و مدل دوم مبتنی بر مدل سازی موضوعی است. در هر دو مدل، کلمات پرس وجو به مجموعه ای از کلمات مرتبط با پرس وجو که بیشتر نشان دهنده ی یک زمینه ی خبرگی هستند ترجمه شده است. پس از ترجمه ی کلمات، از یک مدل ترکیب کننده به منظور بازیابی استفاده شده است. مدل های ارائه شده بر روی مجموعه ی آزمون Stack Overflow ارزیابی و تحلیل شده است. نتایج به دست آمده بیانگر افزایش میانگین متوسط دقت روش ارائه شده در مقایسه با سایر روش های بازیابی افراد خبره است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.