مروری بر برچسب گذاری واژگانی زبان هایی با صورت نوشتاری لاتین و غیرلاتین: نگاهی مبسوط بر زبان فارسی

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (بدون رتبه معتبر)
چکیده:

مقاله حاضر، به بررسی جامع موضوع برچسب‌گذاری واژگانی صورت نوشتاری زبان‌های لاتین و غیرلاتین به ویژه زبان فارسی می‌‌پردازد. در این نوشتار میزان پیشرفت برچسب‌گذاری واژگانی در بیست و سه زبان گفتاری دنیا، که دارای بیشترین متکلم می‌باشند، مورد بررسی قرار می‌گیرد. برخی از این زبان‌ها مثل زبان‌های عربی، اردو و فارسی از سیستم نوشتاری از راست به چپ پیروی می‌کنند، و در نوع خود با مشکلات و چالش‌هایی در زمینه برچسب‌گذاری واژگانی روبرو هستند. این چالش‌ها می‌تواند منحصر به یک زبان خاص باشد و یا در بین زبان‌های گوناگون مشترک باشند، که به برخی از آن‌ها اشاره خواهیم کرد. در این مقاله، با مروری نقادانه بر مطالعات اخیر در حیطه برچسب‌گذاری واژگانی، چالش‌های پیش روی زبان فارسی مد نظر قرار گرفته شده است. با مرور تحقیقات پیشین و مطالعه ویژگی‌ها، مسایل، چالش‌ها و ابزارهای برچسب‌گذاری واژگانی، این نتیجه حاصل می‌شود که، چالش‌های برچسب‌گذاری واژگانی در زبان فارسی بیشتر در سطح توکن‌سازی و مربوط به شرایط رسم الخط عربی است.

زبان:
انگلیسی
صفحات:
75 تا 90
لینک کوتاه:
magiran.com/p2285008 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!