بهبود صحت ابهام زدایی نام نویسنده با استفاده از خوشه بندی تجمعی

نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
امروزه کتابخانه های دیجیتال از مهم ترین و سریع ترین منابع پژوهشی در جهان محسوب می شوند. از نقطه نظر مدیریت تجمیع دانش، توانایی جستجوی صحیح، دقیق و سریع مطالب علمی مد نظر کاربر، اهمیت زیادی دارد. پیچیدگی و وجود تشابه در بانک های اطلاعاتی موجب می گردد این منابع در هنگام بهره برداری با چالش ها و ابهامات زیادی مواجه شوند و همین چالش ها دست مایه پژوهش های گسترده ای را در این حوزه شکل داده است. یکی از مهم ترین این چالش ها، وجود ابهام در نام نویسنده است. در این خصوص روش های بسیاری با بهره گیری از روش های خوشه بندی نسبت به حل نام های مبهم مبادرت ورزیده اند. این روش ها تا حدودی توانسته اند مشکل را برطرف کنند، اما همچنان مسئله تکه تکه بودن خوشه ها و خطا در نتایج تولیدی، از معایب روش های موجود است. از سویی تجربه نشان داده که یک روش به تنهایی نتایجی با صحت بالا نمی تواند تولید کند. بدین منظور در این مقاله مدلی جهت حل مشکل ذکر شده ارائه شده است . راهکار پیشنهادی در دو گام، عملیات ابهام زدایی را انجام می دهد. در گام نخست خوشه های اولیه با استفاده از «الگوریتم خوشه بندی سلسله مراتبی تجمعی با پارامترها و توابع اندازه گیری مشابهت مختلف»، تولید می شوند. در گام دوم با بهره گیری از «الگوریتم خوشه بندی تجمعی»، خوشه های تولید شده به گونه ای ترکیب می شوند تا خوشه هایی غنی با درصد کمتری از تکه تکه بودن و صحت بالاتر تولید شوند. در ارزیابی الگوریتم پیشنهادی از «مجموعه دادگان DBLP، تحت معیار K» استفاده شده است. نتایج، بهبود قابل توجهی را در ترکیب خوشه های مذکور نشان می دهند.
زبان:
فارسی
صفحات:
117 تا 128
لینک کوتاه:
magiran.com/p1803988 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!