فهرست مطالب

پردازش علائم و داده ها - سال نهم شماره 1 (پیاپی 17، بهار و تابستان 1391)

فصلنامه پردازش علائم و داده ها
سال نهم شماره 1 (پیاپی 17، بهار و تابستان 1391)

  • تاریخ انتشار: 1391/07/18
  • تعداد عناوین: 6
|
  • قاسم خادمی، حسین ابراهیم نژاد صفحه 3
    تحلیل و ضبط خودکار حرکت انسان بر اساس تصاویر یا ویدئو به دلیل کاربردهای بسیار زیاد در انیمیشن، نظارت، بیومکانیک، تعامل بین انسان و کامپیوتر، صنعت بازی و سرگرمی از اهمیت بسیاری در بینایی کامپیوتر برخوردار است. در این کاربردها، تخمین حالت سه بعدی انسان از قسمت های اساسی می باشد و بهمین دلیل دقت تخمین بر عملکرد این کاربردها تاثیر زیادی دارد.تخمین حالت سه بعدی انسان از مشاهدات تصویری با توجه به رنج وسیع تغییرات در ظاهر و مفصل بندی انسان، ابعاد بالا در فضای حالت انسان و پدیده خود انسدادی، یک مسئله چالش برانگیز می باشد. در این مقاله، روشی جدید برای تخمین حالت سه بعدی انسان در رشته ویدئویی چنددوربینی معرفی می شود. در روش پیشنهادی، به جای جستجوی مستقیم فضای حالت ابعاد بالای انسان و استفاده از الگوریتم های استنتاج پیچیده، از یک روش جستجوی سلسله مراتبی، توابع هدف جداگانه برای قسمت های مختلف بدن و روش های بهینه سازی مستقیم استفاده شده است. مزایای روش پیشنهادی، ارزش دهی اولیه خودکار، برچسب زنی قسمت های مختلف کانتور بدن و استفاده از توابع هدف جداگانه برای قسمت های مختلف بدن می باشد. نتایج آزمایش، نشان می دهد که روش پیشنهادی می تواند به طور موثری بعنوان یک سیستم بدون نشانه برای تخمین حالت سه-بعدی انسان در رشته ویدئویی چنددوربینی بکار گرفته شود.
    کلیدواژگان: تخمین سه بعدی حالت انسان، ضبط حرکت انسان، مدل مفصل دار، بهینه سازی، تصاویر سایه نما، اسکلت سه بعدی
  • هشام فیلی، حمیدرضا قادر، مرتضی آنالویی، حمیدرضا قادر صفحه 19
    در این مقاله نشان داده ایم که مسئله استخراج باناظر گرامر برای گرامرهای زبان طبیعی، می تواند به عنوان ترکیبی پیچیده از تعداد زیادی مسئله انتخاب مدل تعریف شود. مسائل انتخاب مدل به مسائلی گفته می شود که در آن ها میان مدل هایی با پیچیدگی آماری متفاوت تصمیم گیری می شود. برای ارائه مدل مورد نظر، ابتدا یک مدل بیزی از فرایند شناختی انتخاب مدل را معرفی کرده ایم. این مدل مسئله انتخاب مدل را با تطابق بیشتر با رفتار انسان حل می کند. سپس با استفاده از تعمیم یافته مدل بیزی، که فرایند دریکله است، به همراه مفهوم گرامر های مبتنی بر سابقه، یک مدل بیزی مبتنی بر سابقه برای استخراج باناظر گرامر ارائه کرده ایم. نتایج آزمایشی که بوسیله ی این مدل روی یک پیکره ی استاندارد برای زبان انگلیسی صورت گرفته است، در مقایسه با مدل مرجع طبق معیار F1 به مقدار 9.1% پیشرفت نشان می دهد.
    کلیدواژگان: مدل بیزی از فرایند شناختی انتخاب مدل، گرامرiهای جایگزینی درخت، فرایند دریکله، فرایند رستوران چینی، گرامرهای مبتنی بر سابقه
  • حجت محمدنژاد، منصور ولی صفحه 35
    عملکرد سیستم های بازشناسی گفتار زمانی که گفتار توسط نویز تخریب شده باشد، به شدت کاهش می یابد. یکی از روش های رایج برای مقاوم سازی سیستم های بازشناسی گفتار استفاده از روش دادگان مفقود است در این روش مولفه هایی از نمایش زمانی- فرکانسی گفتار (اسپکتروگرام) که نسبت سیگنال به نویز (SNR) آنها از یک آستانه کمتر است، بعنوان مولفه های نامعتبر یا مفقود برچسب دهی می شوند. این مولفه ها با استفاده از مولفه های معتبر و اطلاعات آماری که نسبت به دادگان تمیز، تخمین زده شده و جایگزین می شوند. در این مقاله الگوی ویژگی های مفقود با دیدگاهی نو به عنوان مسئله جبران سازی دادگان مطرح می شود. به اینصورت که با استفاده از شبکه عصبی دوسویه و انجام یک سری پردازش های غیرخطی و دوطرفه (جلوسو و برگشتی) از دانش نهفته در مدل، ناشی از یادگیری هم-زمان گفتار تمیز و نویزی بهره گرفته، بردارهای بازنمایی گفتار در جهت افزایش صحت بازشناسی آواها بهبود می یابند. در این روش نیازی به شناسایی مولفه های مفقود که یک بحث چالش برانگیز در حوزه بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود است نمی باشد بلکه بازسازی در جهت هرچه شبیه تر شدن تمامی مولفه ها (خواه معتبر باشد خواه نامعتبر) به مولفه های گفتار تمیز صورت می گیرد و این یک برتری بسیار چشمگیری است که در این تحقیق حاصل شده است؛ نتایج مقایسه این دو روش نشان می دهد که با استفاده از روش دادگان مفقود، 2/4 درصد بهبود برای صحت بازشناسی گفتار نویزی با نسبت سیگنال به نویز dB0 حاصل شده درحالیکه با استفاده از روش مبتنی بر شبکه عصبی دوسویه، 5/8 درصد بهبود برای همان نسبت سیگنال به نویز به دست آمده است.
    کلیدواژگان: بازشناسی مقاوم گفتار، دادگان مفقود، شبکه عصبی دوسویه
  • حامد یوسفی، محمود گردشی، محمد سبزی نژاد فراش صفحه 49
  • محمد امین مهرعلیان، کاظم فولادی صفحه 59
    در این مقاله روشی جدید برای بازشناسی برخط حروف مجزای فارسی ارائه شده است که با استخراج چند ویژگی ساده از دنباله نمونه برداری شده از حروف و استفاده از دسته بندی کننده ی ماشین بردار پشتیبان(SVM) نتایج قابل قبولی را ارئه می دهد. الگوریتم پیش پردازش استفاده شده در این کار امکان یکسان سازی ابعاد ویژگی ها به ازای حروف متعدد را فراهم می کند تا در مرحله بعدی به منظور بازشناسی به دسته بندی کننده ارسال شود. فرآیند بازشناسی در دو مرحله صورت می گیرد: در مرحله ی اول بدنه ی اصلی حرف ورودی (اولین حرکت قلم) پس از استخراج ویژگی با استفاده از دسته بندی کننده در قالب یکی از هجده گروه بدنه ی اصلی حروف، طبقه بندی می شود و سپس در مرحله ی دوم، موقعیت، تعداد و شکل سایر حرکت ها مانند نقطه و سرکش (ریزحرکت ها)، نوع حرف نهایی را تعیین می کند. به عنوان نمونه برای تشخیص حرف «ت» ابتدا گروه بدنه ی «ب، پ، ت، ث» تشخیص داده می شود و سپس وجود ریزحرکت «دونقطه» در بالای آن منجر به انتخاب «ت» از این گروه می شود. نهایتا در فرآیند پس پردازش با استفاده از تطبیق اطلاعات مربوط به بدنه ی اصلی و ریزحرکات سیستم به تصحیح خطاهای احتمالی موجود در مراحل قبلی پرداخته و دقت بازشناسی را افزایش می دهد به عنوان مثال اگر در مرحله دسته بندی بدنه حرف «ل» تشخیص داده شود ولی یک نقطه در بالای آن قرار داشته باشد آنگاه سیستم تشخیص خود را به حرف «ن» تغییر خواهد داد. نتایج تجربی این کار پژوهشی که بر اساس مجموعه داده ی Online-TMU صورت گرفته است، متوسط نرخ بازشناسی بدنه ی اصلی را 94% نشان می دهد و با در نظر گرفتن پس پردازش ها بر اساس ریزحرکت ها این نرخ به حدود 98% می رسد.
    کلیدواژگان: بازشناسی برخط حروف فارسی، بازشناسی دست نوشته، دست نویس، ریزحرکت، ماشین بردار پشتیبان (SVM)
  • نیما ملایی، احمد عبدالله زاده، حسین شیرازی صفحه 67
    امروزه تکنیک های استخراج اطلاعات مورد نیاز، از متون نظامی، مورد توجه فرماندهان و مدیران نظامی قرار گرفته که بدلیل تفاوت های ساختاری متون نظامی در مقایسه با متون غیر نظامی، استفاده از روش های متداول موجود بر روی متون نظامی، فاقد کارایی لازم می باشد. در این مقاله ضمن مقایسه ساختار متون نظامی با متن های غیر نظامی، دسته بندی جدیدی از متون نظامی ارایه گردیده و نتایج استخراج اطلاعات در هر گروه با استفاده از سیستم های موجود، مورد بررسی قرار گرفته است. براساس نتایج حاصل از ارزیابی، روشی نوین بر مبنای ترکیب روش استنتاج پوشش و مدل حوزه تصادفی شرطی ارایه گردیده است. ارزیابی کارایی بر روی بستر تهیه شده از گزارش های صحنه نبرد، انجام گردیده است. با بکارگیری روش پیشنهادی بر روی بستر ارایه شده، بهبود کارایی در معیارهای فراخوانی و معیار F نمایش داده شده است. همچنین با مقایسه نتایج حاصل از اجرای این سیستم بر روی متون غیر نظامی، امکان بکارگیری آن برای استخراج اطلاعات از متون غیر نظامی نیز بررسی شده است.
    کلیدواژگان: متن نظامی، استخراج اطلاعات، استنتاج پوشش، مدل حوزه تصادفی شرطی
|
  • Ghassem Khademi Page 3
    Automatic capture and analysis of human motion، based on images or video is important issue in computer vision due to the vast number of applications in animation، surveillance، biomechanics، Human Computer Interaction، entertainment and game industry. In these applications، it is clear that 3D human pose estimation is an essential part. Therefore، its accuracy has a great effect on the performance of these applications. Because of the variation in appearance and articulations of human، self-occlusion and high dimensional state-space of human pose، 3D human pose estimation from image observations is a challenging problem. In this paper، a new method of 3D human pose estimation from multi-view video sequence is introduced. In the proposed method، instead of seeking directly over the high dimensional states-space of human pose and employing the complex inferring algorithms، a hierarchical search method with distinct objective function for each part of the body and direct optimization methods is employed. Advantages of the proposed method are: automatic initialization، labeling of parts of the body contour and using separate objective function for different parts of the body. Experimental results demonstrate that the proposed method can be effectively used as a marker-less system to estimate 3D human pose in a multi-view sequence.
    Keywords: 3D human pose estimation, human motion capture, articulated model, Optimization, Silhouette Images, 3D skeleton
  • Heshaam Faili, Hamidreza Ghader, Morteza Analoui Page 19
    In this paper، we show that the problem of grammar induction could be modeled as a combination of several model selection problems. We use the infinite generalization of a Bayesian model of cognition to solve each model selection problem in our grammar induction model. This Bayesian model is capable of solving model selection problems، consistent with human cognition. We also show that using the notion of history-based grammars will increase the number and decrease the complexity of model selection problems in our grammar induction model. This results in the induction of a better grammar which leads to 9. 1 points increase in F1 measure، for parsing the section 22 of Penn treebank in comparison with a similar model that does not use history-based grammar induction techniques.
    Keywords: Bayesian model of cognition, tree substitution grammars, Dirichlet process, Chinese restaurant process, history, based grammars
  • Hojat Mohammadnejad Page 35
    Performance of speech recognition systems is greatly reduced when speech corrupted by noise. One common method for robust speech recognition systems is missing feature methods. In this way، the components in time - frequency representation of signal (Spectrogram) that present low signal to noise ratio (SNR)، are tagged as missing and deleted then replaced by remained components and statistical information of clean speech. In this article a new approach of missing features method based on compensation are proposed. A Bidirectional Neural Network (BNN) was developed and implemented in order to modify unreliable components in input feature vectors and improve the overall recognition accuracy. Distorted components in feature vectors were estimated in accordance with the latent knowledge in the hidden layer of the neural network. This knowledge is obtained by training with clean and noisy speech، simultaneously and is mostly induced by reliable and less influenced components by the irrelevant variations in speech signal. In this approach، there is no need to identify missing components that is a challenging issue in the field of robust speech recognition based on missing feature method because reconstruction is done on all components (whether reliable or unreliable)، in order to become more similar to the clean speech component. This point is a very significant advantage that has been achieved in this article. Comparing the results of these two methods shows that using Missing feature methods، 4. 2% improvement were obtained in the accuracy of speech recognition for noisy signal by SNR=0dB، whereas improvement value increased to 8. 5%، using bidirectional neural network for the same signal to noise ratio.
    Keywords: Bidirectional Neural Network, Missing Feature Methods, Robust Speech Recognition, Vector Taylor Series
  • Kazim Fouladi Page 59
    In this paper a new method for the online recognition of handwritten Persian characters has been proposed which uses a set of simple features and Support Vector Machine (SVM) as a classifier. The task of preprocessing allows us to equalize feature vectors from different characters. This algorithm is implemented in two steps. In the first step، input character is classified into one of eighteen groups of main strokes of characters and in the second step، position، number، and the shape of sub-strokes determine character type. For example to recognize the character ‘ت’، in the first step the character will be classified to group of letters ‘ب، پ، ت، ث’ based on main stroke shape and then classification is done using information of the sub-strokes. In the final step، post processing، we rectify previous step results employing unmatched conditions between main stroke and sub-strokes. Consider a main stroke «ل» with a point at the top of that in this situation post processing step will change result to letter «ن». The experimental results -which is based on Online-TMU database- show that the recognition rate of the main strokes of the characters is 94% which reaches to 98% using the information of sub-strokes.
    Keywords: Online Persian Character Recognition, Handwriting Recognition, Support Vector Machine (SVM)
  • Nima Molai Page 67
    Military Information Extraction techniques are interested for military managers and commanders. But usual information extraction techniques cannot be used for that domain، because military corpus has special structure that differs from non-military corpus. In this paper the military documents structure is compared with non-military documents structure. Moreover a new classification is proposed for military documents. IE system effects are also surveyed for each class. Then a new composite approach is proposed according to the experimental results. The new approach is based on Wrapper Induction and CRF Model. Test bed is also prepared from battlefield reports to evaluate the proposed system. The improvement is shown based on tow metrics namely Recall and F-Measure. The usefulness of the proposed system is also demonstrates.
    Keywords: Military Document, Information Extraction (IE), Conditional Random Field (CRF), Wrapper Induction (WI)