فهرست مطالب

فصلنامه پردازش علائم و داده ها
سال هشتم شماره 1 (پیاپی 15، بهار و تابستان 1390)

  • تاریخ انتشار: 1391/03/09
  • تعداد عناوین: 7
|
  • محرم اسلامی، وحید مواجی، بهرام وزیرنژاد صفحه 3
    در مقاله حاضر می کوشیم مبنای نظری، نحوه طراحی و عملکرد سامانه تحلیل گر صرفی زبان فارسی با عنوان اختصاری «پارس مورف» را معرفی کنیم. پارس مورف سامانه ای مبتنی بر قواعد صرفی زبان فارسی است که ساخت درونی کلمات فارسی را با توجه به نظام تصریف و نظام واژه سازی زبان تجزیه و تحلیل می کند و مقوله دستوری و نقش هر کدام از اجزای سازنده کلمه را مشخص می کند. پارس مورف با استفاده از یک واژگان حدودا 45000 واژه ای و نیز در چارچوب قواعد صرفی زبان فارسی که بر یک تحقیق جامع زبان شناختی استوار است می تواند واژه های پیچیده و نیز صورت های ممکن تصریفی و حتی واژه های خارج از واژگان را تحلیل کند. دقت نسخه اول پارس مورف حدود 95% است که افزودن اطلاعات نحوی و مسائل مربوط به هم نویسه ها و نیز لحاظ کردن ویژگی های خط فارسی می تواند این دقت را به 100% نزدیک کند. از پارس مورف می توان در مطالعات محض زبانی و نیز پردازش ماشینی زبان فارسی استفاده کرد.
    کلیدواژگان: پارس مورف، تحلیل گر صرفی، زبان فارسی، واژه سازی، تصریف، اشتقاق، ترکیب
  • مرضیه مرتضوی نیا، محمود بی جن خان بی جن خان، پروین سادات فیض آبادی صفحه 9
    این مقاله به پیش بینی روابط زمانی بین رویدادهای فعلی بر اساس حروف ربط زمان دار در متون می پردازد. برای انجام این کار، داده های مربوط به رویدادهای فعلی از پیکره متنی زبان فارسی استخراج و بررسی شدند و روابط زمانی بین رویدادها مشخص شد. با تحلیل داده ها براساس روابط زمانی در چهارچوب طبقه بندی برد و آلن، مشخص شد که حروف ربط زمان دار را می توان در چهار دسته تعینی، اریب دار، شبه تصادفی و تصادفی جای داد. علائم تعینی به طور دقیق روابط زمانی بین رویدادهای مربوطه را پیش بینی کرده و علائم اریب دار با تقریب خوبی یک دسته رابطه را پیش بینی می کنند. علائم شبه تصادفی گرایش به یک نوع رابطه ی زمانی خاص ندارند و علائم تصادفی، به طور تقریبی هر گونه رابطه زمانی را بین رویدادهای مربوطه امکان پذیر می کنند. این پژوهش نشان داد که پیش بینی روابط زمانی برد به وسیله علائم تا حدودی مطلوب تر از پیش بینی روابط آلن می باشد.
    کلیدواژگان: روابط زمانی رویدادها، حرف ربط، رویداد فعلی
  • نوا احسان، هشام فیلی صفحه 17
    یکی از مهمترین موضوعات در پردازش زبان طبیعی و بازیابی اطلاعات یافتن ریشه کلمات می باشد. ریشه کلمه جزئی از کلمه است که پس از حذف وندهای کلمه (پیشوند، پسوند و میانوند) باقی می ماند. یکی از روش های افزایش کارایی سیستم های بازیابی اطلاعات استفاده از ریشه یابی کلمات است. زیرا اشتقاقات مختلف یک کلمه به ریشه آن کلمه تبدیل می شوند. در نتیجه جستجو بر اساس ریشه کلمه انجام خواهد شد و اندازه ساختار ایندکس کاهش می یابد. در این مقاله الگوریتمی برای بدست آوردن ریشه کلمات در زبان فارسی ارائه شده است و سپس نتیجه آن در بازیابی اطلاعات با الگوریتم های متفاوت رتبه بندی مورد ارزیابی قرار گرفته است. الگوریتم ارائه شده با استفاده از قواعد ساختواژی زبان فارسی و استفاده از مجموعه لغات برای جلوگیری از ایجاد ریشه های نادرست به ریشه یابی کلمات می پردازد. تعداد قواعد استفاده شده 43 قانون است. با استفاده از الگوریتم ارائه شده اندازه ساختار ایندکس 5 درصد کاهش یافته است و همچنین میزان میانگین متوسط دقت (mean average precision) در سیستم بازیابی اطلاعات حدود 5 درصد افزایش یافته است.
    کلیدواژگان: ریشه یابی، پردازش زبان طبیعی، بازیابی اطلاعات
  • حمید حسن پور، سکینه اسدی امیری صفحه 25
    در این مقاله روش اتوماتیک جدیدی برای بهبود روشنایی تصویر با تکیه بر اصلاح گاما ارائه شده است. در روش های موجود اصلاح گاما، اغلب ضریب گاما به طور یکنواخت در تمام قسمت های یک تصویر تغییر می یابد. از آنجایی که تغییرات گاما در تصویر ممکن است به صورت غیرخطی انجام گرفته باشد، در این مقاله اصلاح گاما به صورت محلی انجام می گیرد. این روش گاماهای مناسب را برای ناحیه های مختلف از یک تصویر با استفاده از شبکه عصبی MLP تخمین می زند. بدین صورت که ابتدا تعدادی تصویر با گاماهای مشخص را پنجره-گذاری کرده و دو ویژگی میانگین و بافت تصویر که به ترتیب مرتبط با میزان روشنایی و کنتراست تصویر می باشد را از هر پنجره برای آموزش شبکه عصبی استخراج می نماید. به-همین ترتیب پنجره گذاری و استخراج ویژگی را برای تصویر جدید (تصویری که نیاز به اصلاح گاما دارد) نیز انجام می دهد. سپس بردار ویژگی به دست آمده از هر پنجره را به شبکه عصبی آموزش داده شده، اعمال می نماید تا گامای مناسب برای هر پنجره از تصویر جدید تخمین زده شود. در استفاده از این روش، برخلاف روش های موجود، چنانچه بخشی از یک تصویر دارای گامای مناسبی باشد، تغییری در شدت روشنایی آن قسمت انجام نمی گیرد. نتایج حاصل از این روش بر روی تصاویر مختلف نشان می دهد که روش پیشنهادی در مقایسه با سایر روش ها دارای عملکرد مناسب تری است.
    کلیدواژگان: استخراج ویژگی، اصلاح گاما، بهبود روشنایی تصویر، شبکه عصبی
  • ندا داداشی، فاطمه عبدالعلی*، سیدعلی سیدصالحی صفحه 33

    در این مقاله با استفاده از تولید تصاویر مجازی به کمک شبکه های عصبی، مسئله بازشناسی چهره با یک تصویر از هر فرد مورد توجه قرار گرفته است. برای جداسازی اطلاعات شخص از حالت و تخمین مانیفولدهای زیرفضاهای مربوطه، از یک شبکه عصبی تحلیل گر غیرخطی اطلاعات چهره استفاده شده است. به منظور افزایش تعداد نمونه های تعلیم در شبکه طبقه بندی کننده، به کمک مانیفولدهای تخمین زده شده، تصاویر مجازی از چهره های نرمال موجود در پایگاه داده اصلی تولید شده است. با طراحی ساختارهای مختلفی از شبکه های عصبی مصنوعی به منظور استخراج مولفه های زیرفضاهای اطلاعات فرد و حالت، کیفیت چهره های مجازی و درنتیجه درصد صحت بازشناسی در شبکه طبقه بندی کننده بهبود می یابد. برای تخمین بهتر مانیفولدهای اطلاعات شخص و بهبود قدرت تعمیم، یک روش تعلیم برمبنای خوشه-بندی بدون سرپرستی ارائه شده است. با به کارگیری این روش و تعلیم شبکه طبقه بندی کننده به کمک تصاویر مجازی حاصل، درصد صحت بازشناسی %63/83 روی دادگان تست حاصل شده که نسبت به حالت تعلیم شبکه طبقه بندی کننده فقط با تصاویر نرمال دارای بهبود %73/12 است.

    کلیدواژگان: بازشناسی چهره، یک تصویر از هر فرد، تصاویر مجازی، یادگیری مانیفولد، شبکه عصبی، تنوعات حالت
  • آرش پیشرویان، حمیدرضا ابوطالبی، مسعود رضا آقا بزرگی صحاف صفحه 45
    این مقاله کاربرد یکی از الگوریتم های تجزیه به مولفه های مستقل (ICA) در جداسازی ترکیب های لحظه ای سیگنال های گفتار و موسیقی مورد بحث قرار می گیرد. الگوریتم جداساز در حوزه زمان بوده و برای مینیمم سازی اطلاعات متقابل به تخمین تابع رتبه نیاز دارد. برای تخمین تابع رتبه نمونه هایی از سیگنال های ترکیب شده خروجی الگوریتم جداساز باید انتخاب گردد که اثر منابع اولیه در آن وجود داشته باشد. از آن جا که سیگنال های گفتار و موسیقی در بازه هایی از زمان می توانند دارای فواصل سکوت باشند، انتخاب فریمی از سیگنال های ترکیب شده با اثر هر دو منبع اولیه در مساله ما اهمیت پیدا می کند. روش پیشنهادی ما استفاده از پارامتر تفاضل توابع رتبه است که با انتخاب یک حد آستانه می توان فریم بهینه را انتخاب نمود. کارایی الگوریتم جداساز با دو تخمین زن ترکیب های گوسی و حداقل میانگین مربع خطا مقایسه شده است. نتایج شبیه سازی نشان می دهد که اولا روش پیشنهادی عملکرد خوبی را در حذف بازه های سکوت از خود نشان می دهد و ثانیا الگوریتم جداساز با تخمین زن ترکیب های گوسی می تواند به تفکیک بهتر سیگنال ها و زمان پردازش کمتر الگوریتم جداساز منجر شود.
    کلیدواژگان: سیگنال های گفتار و موسیقی، الگوریتم جداساز، تفاضل توابع رتبه، تخمین زن تابع رتبه
  • شقایق نادری، نصر الله مقدم چرکری، احسان الله کبیر صفحه 55
    تغییر شرایط نوری، به خصوص تآثیر نورپردازی های جانبی در تصاویر چهره، یک مانع اصلی در سیستمهای شناسایی چهره محسوب می شود. روش های مختلفی برای حل این مساله پیشنهاد شده اند که با مدلسازی تغییرات نور و یا استخراج ویژگی های پایای تصویر به شناسایی چهره می پردازند. بسیاری از این روش ها به دانش قبلی درباره منبع نور، زاویه نورپردازی و تشخیص ناحیه سایه نیاز دارند. در این مقاله روش جدیدی مبتنی بر تبدیل h-minima برای ناحیه بندی تصویر و اصلاح نورپردازی در تصاویر چهره ارائه می شود. روش پیشنهادی طی چند مرحله به استخراج و اصلاح الگوی سایه می پردازد و در نهایت با استفاده از معیار مبتنی بر گرادیان، بهترین الگوی سایه را برای تصویر مشخص می کند. سپس، الگوی سایه پیشنهادی برای بهبود روش Retinex (که با تفاضل الگوی روشنایی از تصویر اصلی در دامنه لگاریتمی، مولفه انعکاس را به عنوان ویژگی پایا از تصویر استخراج می کند) استفاده می شود. نتایج بدست آمده روی پایگاه های تصویری Yale B و Extended YaleB نشان می دهد که روش پیشنهادی دقت شناسایی در روش Retinex را به نحو مطلوبی افزایش داده و نتایج موثری را در اصلاح نورپردازی تصاویر چهره حتی در سایه های شدید ارائه می دهد.
    کلیدواژگان: اصلاح نورپردازی، بهبود کیفیت تصویر، تبدیل H، minima، شناسایی چهره
|
  • Vahid Mavaji, Bahram Vazirnezhad Page 3
    In this paper, the theoretical foundation, the way of implementation and the uses of Pars Morph, a Persian morphological analyzer is introduced. Pars Morph is a rule-based Persian morphological analysis system, which analyzes the internal structure of word in Persian and determines the grammatical category and function of the word parts. Pars Morph being in link with a lexicon covering about 45000 lexemes and based on morphological rules in Persian can analyze the structure of complex lexemes and their possible inflected forms and even out-of-lexicon words. Accuracy rate of the first version of Pars Morph is about 95% which could be enhanced to 100% by applying the regulations on Persian language homographs, some syntactic features and typical features of Persian script. Pars Morph can be used in pure linguistics studies as well as in automatic analysis of Persian language.
  • Page 9
    This paper involves in prediction of temporal relation between tensed-verb events on the basis of conjunctions in texts. For this purpose, tensed verb event data were extracted from Contemporary Persian Corpus and were examined carefully. The temporal relations between events were identified. After analyzing data on the basis of temporal relation according to Bird’s and Allen’s categorization, it was revealed that temporal conjunctions can be categorized in 4 categories: determined, biased, pseudo random and random. Determined signals can predicate the temporal relation between the events accurately. Biased signals predicate one set of relations with a good estimation, Pseudo random signals doesn’t show any orientation toward any kinds of temporal relation and random signals make almost all kinds of relations possible. The results show that Bird’s prediction on the basis of signals is more desirable than Allen’s.
  • Page 25
    In this paper a new automatic method is presented to enhance the image brightness through gamma correction process. Most of current gamma correction methods apply a uniform gamma correction across the image. Considering the fact that gamma variation for a single image is actually nonlinear, the proposed method does the gamma correction in a local approach. Thus the method is able to estimate appropriate gamma values for different regions of the image using a neural network. After windowing several training images with known gamma values, the mean and texture of each window (responsible for brightness and contrast of the window) are computed to train the neural network. The same features will be extracted from the unknown image to estimate the correct gamma values of the different parts of the image. Unlike other gamma correction methods, the proposed method does not change the gamma values of an image which does not need any brightness enhancement. The experimental results prove its better performance over other gamma correction methods.
  • Seyyedali Seyyedsalehi Page 33

    This paper deals with the problem of face recognition from a single image per person by producing virtual images using neural networks. To this aim, the person and variation information are separated and the associated manifolds are estimated using a nonlinear neural information processing model. For increasing the number of training samples in neural classifier, virtual images are produced for the neutral pose samples in a gallery dataset. By designing various structures of neural networks, the quality of virtually produced images, and consequently the recognition accuracy rate are improved. To obtain person information manifold codes giving better performance in describing the other persons and in generalizing, a learning method based on unsupervised clustering is presented. Applying this learning method and training classifier with virtual images, gives an accuracy rate of 83.63% on test dataset, which shows 12.73% improvement in comparison with training classifier using neutral pose samples.

  • Masoud Reza Aghabozorgi Sahaf Page 45
    In this paper, the application of the Independent Component Analysis In this paper, the application of the Independent Component Analysis technique in speech-music separation is discussed. The separation algorithm is in the time domain. It needs the score function estimation to minimize the mutual information. For estimating score function, sufficient samples of the mixed (speech-music) signals are needed. In other words, these samples must be included both original sources. Since the speech and music signals could contain the silent gaps, the frame selection is important in our problem. Our proposed method for selecting the optimum frame is based on the score function difference. The experimental results show good performance of the proposed method in elimination of the silent gaps. Also they express the separation algorithm based on Gaussian Mixture estimator achieves a better separation performance and less processing time compared to the separation algorithm based on Minimum Mean Square Error estimator.
  • Page 55
    Varying illuminations, especially the side lighting effects in face images, is one of the major obstacles in face recognition systems. Various methods have been presented for face recognition under different lighting conditions witch require previous knowledge about Light source and shadow area. In this paper, a novel approach based on H-minima transform to image segmentation and illumination normalization is proposed. Firstly, shadow area is extracted and modified by multi-stage method. Then, the gradient based criteria used to determine the best pattern of shadow areas. Subsequently, the obtained pattern of shadow areas is used to improve Retinex method in obscure area, obvious area, and all areas of the face image. Experimental results on the Extended Yale B database show that the proposed method significantly improves the performance of Retinex method. Furthermore, it provides the effective results in illumination normalization even in extreme lighting conditions.