روش جدید متن کاوی برای استخراج اطلاعات زمینه کاربر به منظور بهبود رتبه بندی نتایج موتور جستجو

نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
یکی از بزرگ ترین مشکلات پیش روی موتورهای جستجو، رفع ابهاماتی است که در جستار کاربران وجود دارد. این ابهامات می تواند دلایل متعددی داشته باشد که از جمله آنها تعدد معانی و مفاهیم مرتبط با یک جستار یا کاربردهای مختلف آن جستار است. اگر موتور جستجو نتواند این ابهام را به شکل صحیح برطرف کند، در ارائه نتایج خود به کاربر دچار اختلال و خطا خواهد شد و نیاز کاربر را برطرف نخواهد کرد. این موضوع نقش مهمی در تعیین میزان کارایی موتور جستجو خواهد داشت. در این مقاله هدف آن است تا با جمع آوری اطلاعات زمینه کاربر در طول زمان، به تفسیر جستار کاربر کمک کرده و درنتیجه آن رتبه بندی نتایج موتور جستجو را بهبود بخشیم. زمینه کاربر به هر اطلاعاتی گفته می شود که به شناخت ویژگی ها و خصوصیات کاربر کمک کند. در این مقاله متن صفحات وبی که کاربر از آن ها بازدید می کند، مورد پردازش قرار می گیرند تا مفاهیم اصلی و کلیدی آن ها استخراج شود. استخراج این مفاهیم (زمینه کاربر) که در سمت کاربر و بر روی سیستم وی اتفاق خواهد افتاد، با افزونه ای خواهد بود که به همین منظور تولید و بر روی مرورگر نصب می شود؛ سپس زمینه کاربر، در ساختاری خاص در سمت کاربر و برای هر کاربر به صورت خصوصی نگهداری می شوند. هنگامی که جستجویی انجام می شود (با توجه به خلاصه ای که موتور جستجو در ازای معرفی هر پیوند ارائه می دهد)، میزان شباهت نتایج موتور جستجو با زمینه کاربر مورد محاسبه قرار گرفته و به ازای هر نتیجه میزان شباهت آن با زمینه کاربر محاسبه می شود؛ سپس آن نتایجی به کاربر پیشنهاد می شوند (در مرورگر پررنگ می شوند) که با زمینه وی تطبیق بیشتری داشته باشند. همان طور که از نتایج آزمایش های پایان مقاله مشهود است، استفاده از زمینه کاربر در رتبه بندی نتایج موتور جستجو تاثیر قابل توجهی دارد. بررسی ها نشان می دهد که در ارائه 10 نتیجه اول مربوط به 30 جستار دارای ابهام، به طور میانگین روش پیشنهادی 43% و موتور جستجوی گوگل 16% از نتایج خود را مرتبط با مفهوم اصلی جستار مورد نظر ارائه کرده اند.
زبان:
فارسی
صفحات:
65 تا 82
لینک کوتاه:
magiran.com/p1788346 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!