کاهش فضای جستجو در بازشناسی زیرواژگان تایپی فارسی با استفاده از موقعیت نقاط و علائم
در این مقاله با استفاده از روشی ساده، اما کارا سعی شده دامنه جستجوی زیرواژگان به شدت کاهش یابد. در گام آموزش، داده های آموزشی بر اساس موقعیت علائم گروه بندی می شوند، در گروه هایی که تعداد عناصر بیش از ده زیرواژه است، برای کاهش فضای جستجو با توجه به تعداد عناصر گروه، با استخراج ویژگی های ساده ای از پروفایل های افقی و عمودی خوشه بندی صورت می گیرد. در مرحله بازشناسی در نخستین مرحله با تعیین نسبت پهنا به ارتفاع زیرواژه (با علائم و بی علائم) و کد موقعیت نقاط و علائم، دامنه جستجو به زیرواژگانی با این کد موقعیت که در محدوده ای از نسبت های یاد شده باشند، محدود می شود؛ در صورتی که تعداد زیرواژگان محدود شده در این مرحله کمتر از ده باشد، این محدوده پذیرفته و در غیر این صورت در مرحله بعد با استخراج ویژگی های ساده ای از پروفایل های افقی و عمودی فضای جستجو به تعدادی از نزدیکترین خوشه ها به این زیرواژه که شرط نسبت پهنا به ارتفاع را نیز ارضا کنند محدود می شود. با اعمال روش پیشنهادی این مقاله فضای جستجو تا حد قابل قبولی کاهش یافته است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.