مروری بر دشواری های زبان فارسی در محیط دیجیتال و تاثیرات آنها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات

چکیده:
هدفهای پژوهش: زبان فارسی، به سبب ویژگی های خاص آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواری هایی روبه‎روست که تاثیری بسزا بر اثربخشی بازیابی اطلاعات می‎گذارد. پژوهش حاضر می‎کوشد تا با بررسی متون و پیشینه های موجود، چالش های نگارش فارسی، تاثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهاد‎های ارائه شده در جهت رفع این دشواری ها را مورد بحث و بررسی قرار دهد.
اهمیت پژوهش: با تحلیل و مرور جامع متونی که درباره چالش های نگارش فارسی در محیطهای دیجیتال نگارش یافته است، می‎توان دانشی را که تاکنون در این باره گرد آمده است به تصویر کشید و کاستی ها و پیشرفتهای به دست آمده در این زمینه را آشکار ساخت.
روش پژوهش: روش پژوهش حاضر، متن‎پژوهی با رویکرد تحلیل محتواست که از روش های پژوهش کیفی به شمار می‎آید. «پاراگراف»، «جمله» و «کلمه» به عنوان واحد تحلیل انتخاب شد، زیرا ممکن بود هر دشواری یا راهکار تنها در یک کلمه یا عبارت مورد اشاره قرار گرفته یا در جمله یا پاراگراف شرح داده شده باشد.
یافته ها: آثار مورد بررسی، بیش از 40 دشواری نگارشی را در رابطه با جستجو و بازیابی اطلاعات فارسی ذکر کرده‎اند. این گونه‎گونی نگارشی به نایکدستی و تطور بسیار در نگارش فارسی می‎انجامد که می‎تواند اثربخشی بازیابی را بویژه از منظر کاهش دقت یا ریزش کاذب و نیز کاهش جامعیت بازیابی، متاثر سازد. در نتیجه، ضروری است در طراحی الگوریتمهای سامانه های جستجو و بازیابی فارسی، به‎هنجارسازی تنوعات و چنددستی های نگارشی و دستوری مد نظر قرار گیرد. تدوین استاندارد نگارش فارسی، استفاده از سیاهه های از پیش تعیین شده، تجهیز پایگاه اطلاعاتی به اصطلاحنامه و فرهنگهای املایی، و تدوین دستنامه یا راهنمای جستجو، از جمله راهکارهای ارائه شده است. این راهکارها با وجود جامع نبودن، کم و بیش اثربخش به نظر می‎رسند.
نتیجه گیری: از آنجا که راهکارهای انسانی، نیازمند مشارکت فعالانه و آموزش نویسندگان متون (تایپیستها و کاربران) است و از روندی بلندمدت و هزینه‎بر برخوردار است، حرکت به سوی راهکارهای خودکارسازی پردازش متن و نمایه‎سازی، ضروری است.
زبان:
فارسی
در صفحه:
59
لینک کوتاه:
magiran.com/p1120326 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!