رویکردی با ناظر در استخراج واژه های کلیدی اسناد فارسی با استفاده از زنجیره های لغوی
واژگان کلیدی، واژگان اصلی و کانونی یک متن و مضمون اصلی مطلب هستند. تهیه این واژگان به روش سنتی نیازمند صرف زمان و هم چنین دانش تخصصی راجع به موضوع متن است. از آن جا که واژگان کلیدی کاربردهای فراوانی در به کارگیری مستندات الکترونیکی دارند، شناسایی روش های خودکار و بهبودیافته برای استخراج این دسته از واژگان همیشه مورد توجه بوده است. رویکرد پژوهش حاضر یک روش باناظر برای استخراج واژگان کلیدی است که در آن با استفاده از زنجیره های لغوی واژگان متن، ویژگی های جدیدی برای هر واژه استخراج شده است. در ایجاد زنجیره های لغوی سعی بر شکل گیری روابط بین معنای واژگان بوده ایم، از این رو در مدل ارائه شده « فارس نت» نقش مهمی در ایجاد آنها ایفا می کند. داده های مورد ارزیابی در این پژوهش مقالات علمی پژوهشی نشریات فارسی هستند. نتایج به دست آمده نشان می دهد که استفاده از روابط معنایی بین واژگان در کنار ویژگی های آماری، عملکرد مناسبی را در استخراج واژگان کلیدی از مقالات نتیجه می دهد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.