سیستم شناسایی و طبقه بندی موجودیت های اسمی در متون زبان فارسی بر پایه شبکه عصبی

چکیده:

شناسایی موجودیت‌های اسمی به عنوان یک وظیفه پایه‌ای در حوزه پردازش زبان طبیعی و به طور کلی زیر مجموعه‌ای از استخراج اطلاعات است. در فرآیند شناسایی موجودیت‌های اسمی به دنبال مکان‌یابی عناصر اسمی در متن و دسته‌بندی آن‌ها به رده‌هایی از پیش تعیین شده از قبیل اسامی اشخاص، سازمان‌ها، مکان‌ها، عبارت‌های زمانی، و غیره هستیم. هرچند پژوهش‌هایی گسترده در توسعه سیستم‌های شناسایی موجودیت‌های اسمی در حوزه زبان انگلیسی درطی سال‌های پیشین انجام گرفته است، متاسفانه با توجه به مشکلات موجود، مانند نبود پیکره‌های متنی نشانه‌گذاری شده استاندارد در زبان فارسی، پژوهش‌های بسیار محدودی در زبان فارسی وجود دارد. در این مقاله با بررسی پژوهش‌های انجام گرفته در دیگر زبان‌ها و با بهره‌گیری از روش‌های تازه در این حوزه همانند استفاده از نمایش بردارهای عددی برای کلمات، به توسعه سیستمی برای شناسایی موجودیت‌های اسمی بر پایه شبکه عصبی پرداخته شده است. نتایج بدست آمده از مدل پیشنهادی نشان دهنده این واقعیت است که استفاده از مدل‌های نمایش بردارهای عددی برای کلمات در زبان فارسی، افزون بر مرتفع کردن مشکل انتخاب ویژگی‌ها، می‌تواند به توسعه سیستمی کارآمد منجر شود که کم‌ترین وابستگی را نیز به دامنه دارد.

نوع مقاله:
مقاله پژوهشی/اصیل
زبان:
فارسی
صفحات:
473 -487
لینک کوتاه:
magiran.com/p2020832 
روش‌های دسترسی به متن این مطلب
اشتراک شخصی
در سایت عضو شوید و هزینه اشتراک یک‌ساله سایت به مبلغ 300,000ريال را پرداخت کنید. همزمان با برقراری دوره اشتراک بسته دانلود 100 مطلب نیز برای شما فعال خواهد شد!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی همه کاربران به متن مطالب خریداری نمایند!