روشی دومرحله ای برای بازشناسی کلمات دست نوشته فارسی به کمک بلوک بندی تطبیقی گرادیان تصویر

چکیده:
در این مقاله یک روش دومرحله ای برای بازشناسی کلمات دست نوشته فارسی ارائه شده است. در مرحله اول برای افزایش دقت و کاهش بار محاسباتی، الگوریتمی برای کاهش کلمات فرهنگ لغت قابل مقایسه با کلمه مورد آزمون ارائه شده است. برای این منظور کلمات موجود در فرهنگ لغت توسط الگوریتم های خوشه بندی، دسته بندی می شوند. خوشه بندی در این مرحله بر اساس ویژگی هایی که شکل کلی کلمه را توصیف می کنند، می باشد. در مرحله دوم یک روش جدید جهت استخراج ویژگی هیستوگرام گرادیان تصویر کلمه پیشنهاد شده است که این روش پیشنهادی تناظر بین نمونه های مختلف تصاویر یک کلمه دست نوشته را بهتر نشان می دهد. با مقایسه بردار ویژگی استخراج شده از کلمه ورودی و بردار ویژگی کلمات نامزد (به دست آمده از مرحله اول) در یک طبقه بند K نزدیک ترین همسایه بهترین نامزد برای کلمه ورودی شناسایی می شود.
نتایج پیاده سازی روش پیشنهادی بر روی پایگاه داده «ایران شهر» نشان می دهد که مرحله کاهش فرهنگ لغت و روش جدید جهت استخراج ویژگی هیستوگرام گرادیان، دقت و سرعت سامانه را به طور قابل ملاحظه ای هم از لحاظ دقت و تا حدودی از لحاظ سرعت بهبود می بخشد.
زبان:
فارسی
در صفحه:
15
لینک کوتاه:
magiran.com/p1478352 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!