تولید کلمات کلیدی متون فارسی با استفاده از یادگیری انتقالی

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
تولید خودکار کلمات کلیدی، نقش مهمی در بسیاری از کاربردهای تحلیلی متن و زبان های طبیعی، به ویژه در دسته بندی و بازیابی سریع متون دارد. بسیاری از روش های کنونی محدود به انتخاب کلماتی هستند که صریحا در متن ذکر شده اند. استفاده از روش های دنباله به دنباله قادر است این نقصان را برطرف کند. البته استفاده از این روش ها معمولا مستلزم وجود پیکره های عظیم است که برای زبان های کم منبع مثل فارسی یک چالش محسوب می شود. در چنین موقعیت هایی، یادگیری انتقالی که در آن یک مدل پیش آموخته بر روی یک وظیفه جدید با مجموعه کوچکتری از داده ها تطبیق داده می شود، می تواند راه گشا باشد. در این مقاله، برآنیم تا با استفاده از یک روش دنباله به دنباله مبتنی بر شبکه های عمیق انتقالی، به تولید کلمات کلیدی برای متون علمی فارسی بپردازیم. در همین راستا، پیکره متنوعی از 70هزار مقاله تخصصی به زبان فارسی و کلمات کلیدی متناظرشان جمع آوری شده است. سپس شبکه انتقالی پیش آموخته MT5 با استفاده از این پیکره،  برای وظیفه تولید کلمات کلیدی، تنظیم و بازآموزی شده است. مدل حاصل، با چندین روش دیگر مقایسه شده است. نتایج این مقایسه حاکی از برتری حداقل 2.71 درصدی آن بر روش های موجود است.
زبان:
فارسی
صفحات:
115 تا 123
لینک کوتاه:
magiran.com/p2503909 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!