بازشناسی برخط زیر-کلمات فارسی بر اساس ویژگی های کدهای زنجیره ای فریمن با استفاده از مدل مخفی مارکوف

چکیده:
در این مقاله سعی بر شناسایی برخط زیر-کلمات فارسی با استفاده از کدهای زنجیره ای فریمن و مدل مخفی مارکوف شده است. کدهای زنجیره ای با استفاده از جهت شکستگی ها، ضمن حفظ جهت حرکت قلم، حجم داده ها را کاهش می دهد. از این رو می تواند به عنوان یک روش موثر در شناسایی برخط زیر-کلمات بکار گرفته شود. پس از شکستن زیر-کلمه به بخش های تشکیل دهنده (بدنه اصلی و ریزحرکات)، با استفاده از کدهای زنجیره ای فریمن، هر بخش به صورت مجزا کدگذاری می شود. از آنجائیکه این کدها به تنهایی جهت شناسایی زیر-کلمه کافی نمی باشند، آنها را با ویژگی های دیگری که از بردارهای افقی و عمودی زیر-کلمات بدست می آیند تلفیق کرده و مجموعه ویژگی های استخراج شده را جهت شناسایی نهایی به طبقه بندی کننده مدل مخفی مارکوف ارسال می کنیم. ساخت مدل با استفاده از الگوریتم Baum-Welch و آموزش برنامه با الگوریتم پیشرو انجام گرفته است. بکارگیری مراحل یاد شده بر روی پایگاه داده ای مشتمل بر 2000 نمونه زیر-کلمه، نرخ شناسایی تا 5/93 درصد را نشان می دهد.
زبان:
فارسی
صفحات:
37 -44
لینک کوتاه:
magiran.com/p1579775 
روش‌های دسترسی به متن این مطلب
اشتراک شخصی
در سایت عضو شوید و هزینه اشتراک یک‌ساله سایت به مبلغ 300,000ريال را پرداخت کنید. همزمان با برقراری دوره اشتراک بسته دانلود 100 مطلب نیز برای شما فعال خواهد شد!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی همه کاربران به متن مطالب خریداری نمایند!