بررسی تنوع شیوه نگارش دستنوشته های برخط فارسی به منظور استفاده در بازشناسی آنها
در بازشناسی دست نوشته ها به صورت برخط (یا برون خط)، آگاهی از انواع نوشتن حروف در کلمه ها ضروری است. در این مقاله، پایگاه داده برخط دانشگاه تربیت مدرس را انتخاب کرده ایم -که شامل حدود 10،000 نمونه از 1،000 زیرکلمه پرکاربرد فارسی است- و گروه بندی های متفاوت را از نظر بدنه اصلی و اجزای کوچک زیرکلمه ها معرفی کرده ایم. در بخش دیگر مقاله، به بررسی انواع دستخط می پردازیم و مهم ترین شکل های متفاوت نوشتن حروف را پیدا می کنیم. سپس با توجه به آن ها، زیرکلمه ها را گروه بندی می نماییم. بررسی فراوانی حروفی که به چند شکل نوشته می شوند و تحلیل آن ها از مباحث نهایی این مقاله است. نتایج اولیه بهبود موثر دقت بازشناسی را با انجام گروه بندی بر اساس انواع نوشتن حروف، نشان می دهد.
پایگاه داده ، دست نوشته برخط ، دستخط ، فارسی ، بازشناسی
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.