بازیابی و رتبه بندی افراد خبره با استفاده از مدل ترجمه مبتنی بر خوشه بندی

پیام:
چکیده:

استخراج دانش از میان داده‌های موجود در وب باتوجه‌‌ ‌به حجم و تنوع بالای آن به یک چالش در حوزه‌ی بازیابی اطلاعات تبدیل شده‌است. در این میان، مساله‌ی بازیابی و رتبه‌بندی افراد خبره با هدف بازیابی و رتبه‌بندی افراد خبره در زمینه‌ی موضوع پرس‌وجوی کاربر، به‌عنوان یکی از مهم‌ترین مسائل موجود در این حوزه توجه بسیاری از پژوهشگران را به خود جلب نموده‌است. مهم‌ترین چالش در مسئله‌ی بازیابی افراد خبره تشخیص میزان ارتباط بین کلمات پرس‌وجو و سند‌های نوشته‌شده توسط ‌نامزد‌های خبرگی است. یک مشکل اساسی در این حوزه فاصله‌ی واژگانی میان کلمات پرس‌وجو و سند‌های نامزد‌های خبرگی است. در این مقاله دو مدل ترجمه‌‌ی جدید برای مدل‌سازی فاصله‌ی واژگانی ارائه شده‌است. مدل اول یک مدل احتمالاتی مبتنی‌بر خوشه‌بندی و مدل دوم مبتنی‌بر مدل‌سازی موضوعی است. در هر دو مدل، کلمات پرس‌وجو به مجموعه‌ای از کلمات مرتبط با پرس‌وجو که بیشتر نشان‌دهنده‌ی یک زمینه‌ی خبرگی هستند ترجمه شده‌است. پس از ترجمه‌ی کلمات، از یک مدل ترکیب‌ کننده‌ به‌منظور بازیابی استفاده شده‌است. مدل‌های ارائه‌شده بر‌روی مجموعه‌ی آزمون Stack Overflow ارزیابی و تحلیل شده‌است. نتایج به‌دست‌آمده بیانگر افزایش میانگین متوسط دقت روش ارائه‌شده در مقایسه با سایر روش‌های بازیابی افراد خبره است.

نوع مقاله:
مقاله پژوهشی/اصیل
زبان:
فارسی
صفحات:
1095 -1106
لینک کوتاه:
magiran.com/p2071525 
روش‌های دسترسی به متن این مطلب
اشتراک شخصی
در سایت عضو شوید و هزینه اشتراک یک‌ساله سایت به مبلغ 300,000ريال را پرداخت کنید. همزمان با برقراری دوره اشتراک بسته دانلود 100 مطلب نیز برای شما فعال خواهد شد!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی همه کاربران به متن مطالب خریداری نمایند!