ارائه یک رتبه بند برای خطایاب معنایی با استفاده از ویژگی های حساس به متن

چکیده:
در عصر فناوری، روزانه حجم زیادی از سند های الکترونیکی تولید می شود. ازآنجاکه این سند ها توسط افراد مختلف تولید می-شود، دارای خطاهایی هستند. وجود خطاها باعث کاهش کیفیت سند ها می شود؛ بنابراین وجود ابزارهای خطایاب باعث افزایش کیفیت می شود. یکی از انواع خطاها، خطای معنایی حساس به متن است. همان طور که از نام آن برمی آید، برای تشخیص و تصحیح آن، نیاز به تحلیل اطلاعات موجود در متن است. در این مقاله، یک رتبه بند متمایزگر مستقل از زبان برای خطایاب های معنایی حساس به متن ارائه دادیم و از اطلاعات کل متن برای رتبه بندی استفاده کردیم. موجود بودن جمله های قبلی و بعدی جمله خطادار یکی از پیش نیازهای روش ارائه شده است. این رتبه بندی توسط ویژگی های حساس به متن و یک مدل لگاریتم خطی انجام شده است. برای ارزیابی روش، از دو روش مبنای مختلف که یکی بر اساس مترجم ماشینی آماری و دیگری بر اساس مدل زبانی است، استفاده کرده ایم. به منظور ارزیابی سامانه از دو داده آزمون مختلف در زبان فارسی استفاده شده است. این روش باعث بهبود 17% در بازخوانی تشخیص و تصحیح نسبت به روش مبنای مترجم ماشینی آماری شده است.
زبان:
فارسی
در صفحه:
3
لینک کوتاه:
magiran.com/p1478351 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!