Magiran | فصلنامه پردازش علائم و داده ها، سال نهم شماره 1 (پیاپی 17، بهار و تابستان 1391)

انتخاب همه

تخمین چنددوربینی حالت سه بعدی انسان با برازش افکنش مدل اسکلت سه بعدی مفصل دار در تصاویر سایه نما

قاسم خادمی، حسین ابراهیم نژاد صفحه 3

تحلیل و ضبط خودکار حرکت انسان بر اساس تصاویر یا ویدئو به دلیل کاربردهای بسیار زیاد در انیمیشن، نظارت، بیومکانیک، تعامل بین انسان و کامپیوتر، صنعت بازی و سرگرمی از اهمیت بسیاری در بینایی کامپیوتر برخوردار است. در این کاربردها، تخمین حالت سه بعدی انسان از قسمت های اساسی می باشد و بهمین دلیل دقت تخمین بر عملکرد این کاربردها تاثیر زیادی دارد.تخمین حالت سه بعدی انسان از مشاهدات تصویری با توجه به رنج وسیع تغییرات در ظاهر و مفصل بندی انسان، ابعاد بالا در فضای حالت انسان و پدیده خود انسدادی، یک مسئله چالش برانگیز می باشد. در این مقاله، روشی جدید برای تخمین حالت سه بعدی انسان در رشته ویدئویی چنددوربینی معرفی می شود. در روش پیشنهادی، به جای جستجوی مستقیم فضای حالت ابعاد بالای انسان و استفاده از الگوریتم های استنتاج پیچیده، از یک روش جستجوی سلسله مراتبی، توابع هدف جداگانه برای قسمت های مختلف بدن و روش های بهینه سازی مستقیم استفاده شده است. مزایای روش پیشنهادی، ارزش دهی اولیه خودکار، برچسب زنی قسمت های مختلف کانتور بدن و استفاده از توابع هدف جداگانه برای قسمت های مختلف بدن می باشد. نتایج آزمایش، نشان می دهد که روش پیشنهادی می تواند به طور موثری بعنوان یک سیستم بدون نشانه برای تخمین حالت سه-بعدی انسان در رشته ویدئویی چنددوربینی بکار گرفته شود.

کلیدواژگان: تخمین سه بعدی حالت انسان، ضبط حرکت انسان، مدل مفصل دار، بهینه سازی، تصاویر سایه نما، اسکلت سه بعدی

چکیده مشاهده متن زبان: فارسی
یک مدل بیزی برای استخراج باناظر گرامر زبان طبیعی

هشام فیلی، حمیدرضا قادر، مرتضی آنالویی، حمیدرضا قادر صفحه 19

در این مقاله نشان داده ایم که مسئله استخراج باناظر گرامر برای گرامرهای زبان طبیعی، می تواند به عنوان ترکیبی پیچیده از تعداد زیادی مسئله انتخاب مدل تعریف شود. مسائل انتخاب مدل به مسائلی گفته می شود که در آن ها میان مدل هایی با پیچیدگی آماری متفاوت تصمیم گیری می شود. برای ارائه مدل مورد نظر، ابتدا یک مدل بیزی از فرایند شناختی انتخاب مدل را معرفی کرده ایم. این مدل مسئله انتخاب مدل را با تطابق بیشتر با رفتار انسان حل می کند. سپس با استفاده از تعمیم یافته مدل بیزی، که فرایند دریکله است، به همراه مفهوم گرامر های مبتنی بر سابقه، یک مدل بیزی مبتنی بر سابقه برای استخراج باناظر گرامر ارائه کرده ایم. نتایج آزمایشی که بوسیله ی این مدل روی یک پیکره ی استاندارد برای زبان انگلیسی صورت گرفته است، در مقایسه با مدل مرجع طبق معیار F1 به مقدار 9.1% پیشرفت نشان می دهد.

کلیدواژگان: مدل بیزی از فرایند شناختی انتخاب مدل، گرامرiهای جایگزینی درخت، فرایند دریکله، فرایند رستوران چینی، گرامرهای مبتنی بر سابقه

چکیده مشاهده متن زبان: فارسی
روشی جدید در بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود با استفاده از شبکه عصبی دوسویه

حجت محمدنژاد، منصور ولی صفحه 35

عملکرد سیستم های بازشناسی گفتار زمانی که گفتار توسط نویز تخریب شده باشد، به شدت کاهش می یابد. یکی از روش های رایج برای مقاوم سازی سیستم های بازشناسی گفتار استفاده از روش دادگان مفقود است در این روش مولفه هایی از نمایش زمانی- فرکانسی گفتار (اسپکتروگرام) که نسبت سیگنال به نویز (SNR) آنها از یک آستانه کمتر است، بعنوان مولفه های نامعتبر یا مفقود برچسب دهی می شوند. این مولفه ها با استفاده از مولفه های معتبر و اطلاعات آماری که نسبت به دادگان تمیز، تخمین زده شده و جایگزین می شوند. در این مقاله الگوی ویژگی های مفقود با دیدگاهی نو به عنوان مسئله جبران سازی دادگان مطرح می شود. به اینصورت که با استفاده از شبکه عصبی دوسویه و انجام یک سری پردازش های غیرخطی و دوطرفه (جلوسو و برگشتی) از دانش نهفته در مدل، ناشی از یادگیری هم-زمان گفتار تمیز و نویزی بهره گرفته، بردارهای بازنمایی گفتار در جهت افزایش صحت بازشناسی آواها بهبود می یابند. در این روش نیازی به شناسایی مولفه های مفقود که یک بحث چالش برانگیز در حوزه بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود است نمی باشد بلکه بازسازی در جهت هرچه شبیه تر شدن تمامی مولفه ها (خواه معتبر باشد خواه نامعتبر) به مولفه های گفتار تمیز صورت می گیرد و این یک برتری بسیار چشمگیری است که در این تحقیق حاصل شده است؛ نتایج مقایسه این دو روش نشان می دهد که با استفاده از روش دادگان مفقود، 2/4 درصد بهبود برای صحت بازشناسی گفتار نویزی با نسبت سیگنال به نویز dB0 حاصل شده درحالیکه با استفاده از روش مبتنی بر شبکه عصبی دوسویه، 5/8 درصد بهبود برای همان نسبت سیگنال به نویز به دست آمده است.

کلیدواژگان: بازشناسی مقاوم گفتار، دادگان مفقود، شبکه عصبی دوسویه

چکیده مشاهده متن زبان: فارسی
ارائه یک حمله ی SPA موفق به پیاده سازی AES روی میکروکنترلر PIC

حامد یوسفی، محمود گردشی، محمد سبزی نژاد فراش صفحه 49

مشاهده متن زبان: فارسی
بازشناسی برخط حروف مجزای دست نویس فارسی بر اساس تشخیص گروه بدنه اصلی با استفاده از ماشین بردار پشتیبان

محمد امین مهرعلیان، کاظم فولادی صفحه 59

در این مقاله روشی جدید برای بازشناسی برخط حروف مجزای فارسی ارائه شده است که با استخراج چند ویژگی ساده از دنباله نمونه برداری شده از حروف و استفاده از دسته بندی کننده ی ماشین بردار پشتیبان(SVM) نتایج قابل قبولی را ارئه می دهد. الگوریتم پیش پردازش استفاده شده در این کار امکان یکسان سازی ابعاد ویژگی ها به ازای حروف متعدد را فراهم می کند تا در مرحله بعدی به منظور بازشناسی به دسته بندی کننده ارسال شود. فرآیند بازشناسی در دو مرحله صورت می گیرد: در مرحله ی اول بدنه ی اصلی حرف ورودی (اولین حرکت قلم) پس از استخراج ویژگی با استفاده از دسته بندی کننده در قالب یکی از هجده گروه بدنه ی اصلی حروف، طبقه بندی می شود و سپس در مرحله ی دوم، موقعیت، تعداد و شکل سایر حرکت ها مانند نقطه و سرکش (ریزحرکت ها)، نوع حرف نهایی را تعیین می کند. به عنوان نمونه برای تشخیص حرف «ت» ابتدا گروه بدنه ی «ب، پ، ت، ث» تشخیص داده می شود و سپس وجود ریزحرکت «دونقطه» در بالای آن منجر به انتخاب «ت» از این گروه می شود. نهایتا در فرآیند پس پردازش با استفاده از تطبیق اطلاعات مربوط به بدنه ی اصلی و ریزحرکات سیستم به تصحیح خطاهای احتمالی موجود در مراحل قبلی پرداخته و دقت بازشناسی را افزایش می دهد به عنوان مثال اگر در مرحله دسته بندی بدنه حرف «ل» تشخیص داده شود ولی یک نقطه در بالای آن قرار داشته باشد آنگاه سیستم تشخیص خود را به حرف «ن» تغییر خواهد داد. نتایج تجربی این کار پژوهشی که بر اساس مجموعه داده ی Online-TMU صورت گرفته است، متوسط نرخ بازشناسی بدنه ی اصلی را 94% نشان می دهد و با در نظر گرفتن پس پردازش ها بر اساس ریزحرکت ها این نرخ به حدود 98% می رسد.

کلیدواژگان: بازشناسی برخط حروف فارسی، بازشناسی دست نوشته، دست نویس، ریزحرکت، ماشین بردار پشتیبان (SVM)

چکیده مشاهده متن زبان: فارسی
روش پیشنهادی برای استخراج اطلاعات مورد نیاز از متون نظامی

نیما ملایی، احمد عبدالله زاده، حسین شیرازی صفحه 67

امروزه تکنیک های استخراج اطلاعات مورد نیاز، از متون نظامی، مورد توجه فرماندهان و مدیران نظامی قرار گرفته که بدلیل تفاوت های ساختاری متون نظامی در مقایسه با متون غیر نظامی، استفاده از روش های متداول موجود بر روی متون نظامی، فاقد کارایی لازم می باشد. در این مقاله ضمن مقایسه ساختار متون نظامی با متن های غیر نظامی، دسته بندی جدیدی از متون نظامی ارایه گردیده و نتایج استخراج اطلاعات در هر گروه با استفاده از سیستم های موجود، مورد بررسی قرار گرفته است. براساس نتایج حاصل از ارزیابی، روشی نوین بر مبنای ترکیب روش استنتاج پوشش و مدل حوزه تصادفی شرطی ارایه گردیده است. ارزیابی کارایی بر روی بستر تهیه شده از گزارش های صحنه نبرد، انجام گردیده است. با بکارگیری روش پیشنهادی بر روی بستر ارایه شده، بهبود کارایی در معیارهای فراخوانی و معیار F نمایش داده شده است. همچنین با مقایسه نتایج حاصل از اجرای این سیستم بر روی متون غیر نظامی، امکان بکارگیری آن برای استخراج اطلاعات از متون غیر نظامی نیز بررسی شده است.

کلیدواژگان: متن نظامی، استخراج اطلاعات، استنتاج پوشش، مدل حوزه تصادفی شرطی

چکیده مشاهده متن زبان: فارسی

انتخاب همه

Multi-view based 3D Human Pose Estimation by Fitting the Projection of 3D Articular Skeleton Model in Silhouette Images

Ghassem Khademi Page 3

Automatic capture and analysis of human motion، based on images or video is important issue in computer vision due to the vast number of applications in animation، surveillance، biomechanics، Human Computer Interaction، entertainment and game industry. In these applications، it is clear that 3D human pose estimation is an essential part. Therefore، its accuracy has a great effect on the performance of these applications. Because of the variation in appearance and articulations of human، self-occlusion and high dimensional state-space of human pose، 3D human pose estimation from image observations is a challenging problem. In this paper، a new method of 3D human pose estimation from multi-view video sequence is introduced. In the proposed method، instead of seeking directly over the high dimensional states-space of human pose and employing the complex inferring algorithms، a hierarchical search method with distinct objective function for each part of the body and direct optimization methods is employed. Advantages of the proposed method are: automatic initialization، labeling of parts of the body contour and using separate objective function for different parts of the body. Experimental results demonstrate that the proposed method can be effectively used as a marker-less system to estimate 3D human pose in a multi-view sequence.
Keywords: 3D human pose estimation, human motion capture, articulated model, Optimization, Silhouette Images, 3D skeleton

Abstract View Paper Original: Persian
A Bayesian Model for Supervised Grammar Induction

Heshaam Faili, Hamidreza Ghader, Morteza Analoui Page 19

In this paper، we show that the problem of grammar induction could be modeled as a combination of several model selection problems. We use the infinite generalization of a Bayesian model of cognition to solve each model selection problem in our grammar induction model. This Bayesian model is capable of solving model selection problems، consistent with human cognition. We also show that using the notion of history-based grammars will increase the number and decrease the complexity of model selection problems in our grammar induction model. This results in the induction of a better grammar which leads to 9. 1 points increase in F1 measure، for parsing the section 22 of Penn treebank in comparison with a similar model that does not use history-based grammar induction techniques.
Keywords: Bayesian model of cognition, tree substitution grammars, Dirichlet process, Chinese restaurant process, history, based grammars

Abstract View Paper Original: Persian
New Approach in Robust Speech Recognition Based on Missing Feature using Bidirectional Neural Network

Hojat Mohammadnejad Page 35

Performance of speech recognition systems is greatly reduced when speech corrupted by noise. One common method for robust speech recognition systems is missing feature methods. In this way، the components in time - frequency representation of signal (Spectrogram) that present low signal to noise ratio (SNR)، are tagged as missing and deleted then replaced by remained components and statistical information of clean speech. In this article a new approach of missing features method based on compensation are proposed. A Bidirectional Neural Network (BNN) was developed and implemented in order to modify unreliable components in input feature vectors and improve the overall recognition accuracy. Distorted components in feature vectors were estimated in accordance with the latent knowledge in the hidden layer of the neural network. This knowledge is obtained by training with clean and noisy speech، simultaneously and is mostly induced by reliable and less influenced components by the irrelevant variations in speech signal. In this approach، there is no need to identify missing components that is a challenging issue in the field of robust speech recognition based on missing feature method because reconstruction is done on all components (whether reliable or unreliable)، in order to become more similar to the clean speech component. This point is a very significant advantage that has been achieved in this article. Comparing the results of these two methods shows that using Missing feature methods، 4. 2% improvement were obtained in the accuracy of speech recognition for noisy signal by SNR=0dB، whereas improvement value increased to 8. 5%، using bidirectional neural network for the same signal to noise ratio.
Keywords: Bidirectional Neural Network, Missing Feature Methods, Robust Speech Recognition, Vector Taylor Series

Abstract View Paper Original: Persian
The Recognition of Online Handwritten Persian Characters Based on their Main Bodies Using SVM

Kazim Fouladi Page 59

In this paper a new method for the online recognition of handwritten Persian characters has been proposed which uses a set of simple features and Support Vector Machine (SVM) as a classifier. The task of preprocessing allows us to equalize feature vectors from different characters. This algorithm is implemented in two steps. In the first step، input character is classified into one of eighteen groups of main strokes of characters and in the second step، position، number، and the shape of sub-strokes determine character type. For example to recognize the character ‘ت’، in the first step the character will be classified to group of letters ‘ب، پ، ت، ث’ based on main stroke shape and then classification is done using information of the sub-strokes. In the final step، post processing، we rectify previous step results employing unmatched conditions between main stroke and sub-strokes. Consider a main stroke «ل» with a point at the top of that in this situation post processing step will change result to letter «ن». The experimental results -which is based on Online-TMU database- show that the recognition rate of the main strokes of the characters is 94% which reaches to 98% using the information of sub-strokes.
Keywords: Online Persian Character Recognition, Handwriting Recognition, Support Vector Machine (SVM)

Abstract View Paper Original: Persian
WI&CRF: A new approach to extract the required information from military documents

Nima Molai Page 67

Military Information Extraction techniques are interested for military managers and commanders. But usual information extraction techniques cannot be used for that domain، because military corpus has special structure that differs from non-military corpus. In this paper the military documents structure is compared with non-military documents structure. Moreover a new classification is proposed for military documents. IE system effects are also surveyed for each class. Then a new composite approach is proposed according to the experimental results. The new approach is based on Wrapper Induction and CRF Model. Test bed is also prepared from battlefield reports to evaluate the proposed system. The improvement is shown based on tow metrics namely Recall and F-Measure. The usefulness of the proposed system is also demonstrates.
Keywords: Military Document, Information Extraction (IE), Conditional Random Field (CRF), Wrapper Induction (WI)

Abstract View Paper Original: Persian

به جمع مشترکان مگیران بپیوندید!

فهرست مطالب

فصلنامه پردازش علائم و داده ها
سال نهم شماره 1 (پیاپی 17، بهار و تابستان 1391)

فصلنامه پردازش علائم و داده ها

Signal and Data Processing

به جمع مشترکان مگیران بپیوندید!

فهرست مطالب

فصلنامه پردازش علائم و داده ها سال نهم شماره 1 (پیاپی 17، بهار و تابستان 1391)

فصلنامه پردازش علائم و داده ها

Signal and Data Processing

فصلنامه پردازش علائم و داده ها
سال نهم شماره 1 (پیاپی 17، بهار و تابستان 1391)