فهرست مطالب

پردازش علائم و داده ها - سال دوازدهم شماره 4 (پیاپی 26، زمستان 1394)

فصلنامه پردازش علائم و داده ها
سال دوازدهم شماره 4 (پیاپی 26، زمستان 1394)

  • تاریخ انتشار: 1395/01/07
  • تعداد عناوین: 9
|
  • سید مجتبی مروستی زاده، حسین قانعی یخدان صفحات 3-15
    چکیده: با وجود روش های مقاوم سازی داده ها در برابر خطا که در طرف فرستنده روی داده های ویدئو اعمال می شوند، بروز خطا در حین انتقال داده های ویدئویی از کانال های مخابراتی اجتناب ناپذیر است. اختفای خطا، شیوهای موثر جهت ارتقای کیفیت ویدئوهای آسیب دیده در طرف گیرنده است. در این مقاله، یک الگوریتم انطباق مرزی ترکیبی و سریع جهت تخمین دقیق تر بردارهای حرکت آسیب دیده ویدئوی دریافتی ارائه می شود. الگوریتم پیشنهادی، اختفای خطا را برای هر ماکروبلاک آسیب دیده مطابق با فهرست اولویت اختفای خطا انجام می دهد. در روش ارائه شده، اعوجاج مرزی برای هر پیکسل از هر مرز ماکروبلاک نامزد با استفاده از معیار انطباق مرزی ترکیبی پیشنهادشده محاسبه می شود؛ سپس با توجه به صحت هریک از مرزهای مجاور ماکروبلاک آسیب دیده، وزن خاصی به آن ها در فرایند تطبیق، داده می شود. در نهایت، فهرست اولویت اختفای خطا به روز رسانی شده و بردار حرکت نامزد با کمترین اعوجاج مرزی به عنوان بردار حرکت ماکروبلاک آسیب دیده انتخاب می شود. نتایج تجربی نشان می دهد که الگوریتم پیشنهادی بدون افزایش قابل ملاحظه زمان محاسبات، ضمن بهبود کیفیت ویدئوهای بازسازی شده، مقدار متوسط PSNR برای دنباله های مختلف آزمون بیش ازdB 8/1 در مقایسه با روش های مرجع افزایش می دهد.
    کلیدواژگان: اختفای خطای زمانی، تخمین بردار حرکت، الگوریتم انطباق مرزی ترکیبی، ماکروبلاک
  • حمید رجبی، منوچهر نحوی صفحات 17-31
    در جوامع توسعه یافته یا در حال توسعه تعداد افراد سالمند رو به افزایش است. این افراد به علت کهولت سن و ناتوانی جسمی به طورمعمول در معرض اتفاقات خطرناکی از جمله افتادن هستند که این امر لزوم مراقبت از این افراد را نشان می دهد. یکی از روش های مراقبت، نظارت هوشمند ویدئویی است که قادر است در هنگام وقوع حادثه ، مراقبان را با سرعت زیادی مطلع کند. این مقاله با استفاده از روش ردیابی نوینی بر پایه الگوریتم اصلاح شده کانتور، افراد را ردیابی و افتادن آن ها را در دنباله های ویدئویی آشکار می کند. از مزایای روش ارائه شده، آشکار سازی افتادن در شرایط به نسبه واقعی و در حضور چندین شئ است. شبیه سازی ها نشان میدهد که الگوریتم ارائه شده با دقت و سرعت بالایی قادر است افتادن را در دنباله های ویدئویی شناسایی و آشکار کند.
    کلیدواژگان: آشکارسازی افتادن، الگوریتم کانتور، ماشین بینایی، ردیابی، سامانه های هوشمند مراقبت
  • آقا محمد صادق نعمتی نیا، ترانه اقلیدس، علی پاینده صفحات 33-42
    حملات حدس و تعیین از جمله حملات عام به سامانه های رمز جریانی است. این حملات به دو دسته حملات حدس و تعیین اقتضایی و اکتشافی تقسیم بندی می شوند. مزیت روش اکتشافی نسبت به روش اقتضایی در قدرت تحلیل و ارائه الگوریتمی برای دسته بزرگی از رمزهای جریانی با فرض یکسان بودن اندازه متغیرها است. در این مقاله از معادلات فرعی علاوه بر معادلات اصلی به عنوان ورودی حمله حدس و تعیین اکتشافی برای حمله به سامانه های رمز جریانی TIPSY و SNOW 1.0 استفاده شده است. بر اساس مفهوم پایه حدس تعداد حدس ها در حمله اکتشافی و بهبودیافته به سامانه TIPSY، شش مورد است؛ اما پیچیدگی حمله حدس و تعیین اکتشافی بهبود یافته از O(2102) به O(296) کاهش یافته است. این پیچیدگی با پیچیدگی حمله اقتضایی برابر است؛ ولی حمله پیشنهادی، اندازه پایه حدس را از هفت به شش بهبود داده است. همچنین، در حمله حدس و تعیین به SNOW 1.0 پیچیدگی حمله اکتشافی با پایه حدس با اندازه شش و اقتضایی با اندازه هفت به ترتیب O(2202) و بوده O(2224) است که در حمله پیشنهادی به پایه حدس با اندازه پنج و پیچیدگی از مرتبه O(2160) کاهش یافته است.
    کلیدواژگان: رمز جریانی، حمله حدس و تعیین، رمز جریانی SNOW 1، 0، رمزجریانی TIPSY، پیچیدگی محاسباتی حمله
  • بهرام وزیرنژاد، فاطمه سلطانزاده، محسن مهدوی، مهدی مرادی صفحات 43-52
    در مقاله حاضر سامانه ای هوشمند ، جهت ویرایش و خطایابی املایی متون فارسی معرفی شده است. هدف از طراحی و ایجاد این سامانه، ویرایش متون فارسی برای کاربردهای پردازش زبان طبیعی است. این سامانه بر مبنای یک رویکرد مهندسی قابل توسعه، از سه زیرسامانه تشکیل شده است: ویرایش گر متن فارسی معیار، خطایاب املایی خودکار زبان فارسی و ستاک یاب واژگان زبان فارسی. این سه بخش با یکدیگر در تعاملند؛ بدین شکل که ابتدا ستاک واژه های متن شناسایی می شود و در صورت عدم وجود ستاک در فهرست واژه های زبان، واژه مذکور به عنوان واژه ای نادرست شناسایی خواهد شد ؛ سپس خطایاب خودکار فهرستی از واژه های جایگزین را پیشنهاد خواهد کرد. در زیرسامانه ویرایش گر، متن موجود ویرایش شده و متنی یک پارچه که منطبق بر معیارهای مصوب فرهنگستان زبان و ادب فارسی است، به کاربر ارائه خواهد شد. نتایج ارزیابی نشان دهنده دقتی بسیار خوب در حدود 95% در ستاک یابی کلمات، 92% در ویرایش و 96% در خطایابی املایی زبان فارسی است.
    کلیدواژگان: پردازش زبان طبیعی، خطایاب املایی خودکار، ویرایش گر متن فارسی معیار، ستاک یاب
  • سمیه احمدخانی، پیمان ادیبی صفحات 53-65
    در این مقاله ابتدا مدل با نظارت روش ترکیبی تحلیل مولفه اصلی احتمالاتی 1(SPPCAMM) ارائه شده است؛ سپس با در نظر گرفتن جریمه نگاشت در یادگیری مدل پیش گو، روشی برای شناسایی چهره با استفاده از یک رویکرد کاهش بعد بدون اتلاف ارائه شده است. در روش پیشنهادی ابتدا یک خمینه زیربنایی محلی خطی با استفاده از مدل ترکیبی تحلیل مولفه اصلی احتمالاتی بانظارت از نمونه داده ها به دست می آید؛ سپس دسته بند ماشین بردار پشتیبان با اعمال جریمه نگاشت به عنوان مدل پیش گوی مذکور با استفاده از این خمینه محلی خطی آموزش داده می شود. بدین ترتیب از مزایای کاهش بعد در مدل پیش گو استفاده می شود؛ و در عین حال جلوی از دست رفتن اطلاعات مفید گرفته می شود. برای آموزش و ارزیابی روش پیشنهادی، از پایگاه داده های چهره شناخته شده استفاده شده است. روش استخراج ویژگی گابور بر روی تصاویر به کار گرفته شده است. نتایج آزمایش ها نشان می دهد که روش پیشنهادی نسبت به بسیاری از روش های معمول که کاهش بعد را انجام داده و سپس دسته بند را آموزش می دهند، و همچنین نسبت به روش جریمه نگاشت مبتنی بر مدل های کاهش بعد خطی و غیرخطی، دقت بیشتری دارد.
    کلیدواژگان: کاهش بعد بدون اتلاف، مدل ترکیبی، تحلیل مولفه اصلی احتمالی، بانظارت، جریمه نگاشت
  • فروزان فصاحت، پدرام پیوندی صفحات 67-81
    بهعلت منعطف بودن ساختار منسوج، تعیین موقعیت نخ در تصویر آن با استفاده از روش های معمول در پردازش تصویر با خطای زیادی همراه بوده است و در این زمینه، ارائه یک روش انطباق پذیر با خصوصیات تصویر منسوج جهت استخراج پارامترهای آن مورد توجه است. در این راستا استفاده از الگوریتم های فرا ابتکاری جهت تطبیق الگوریتم استخراج پارامترهای ساختاری با شرایط تصویر، کاربردی به نظر می رسد. در این مطالعه، با کاربرد ترکیبی از روش های پردازش سیگنال، خوشه بندی فازی و الگوریتم ژنتیک، یک روش نوین برای پیش پردازش و تشخیص بافت ساختاری تصاویر منسوجات ارائه شده است. نتایج نشان می دهد که روش پیشنهادی قادر به تشخیص صحیح موقعیت نخ در تصاویر منسوجات دولایه با طرح رنگ نایکنواخت با دقت میانگین بیش از 73 درصد است. در تصاویر منسوجات تک لایه با بافت نامتراکم و طرح رنگ یکنواخت، این میزان به طور میانگین بیش از 84 درصد می باشد.
    کلیدواژگان: الگوریتم ژنتیک، تبدیل موجک، الگوریتم خوشه بندی فازی (FCM)، پردازش تصویر، تصویر پارچه، موقعیت نخ
  • مهدی مرادی، محمد بحرانی صفحات 83-94
    با گسترش روز افزون استفاده از اینترنت، شاهد تبادل هزاران گیگابایت اطلاعات متنی در فضای مجازی هستیم. فضای سایبر این امکان را به اشخاص می دهد که هویت حقیقی خود را مخفی کنند و با هویت ساختگی جدیدی وارد آن شوند. از این رو اهمیت حفظ امنیت این فضا، کنترل بر محتوای تولید شده توسط کاربران و شناسایی مشخصات تولیدکنندگان محتوا هر روز پررنگتر می شود. موضوع مورد بررسی در این پژوهش که مربوط به حوزه شناسایی نویسنده است، شناسایی خودکار جنسیت نویسنده متن فارسی است. به منظور شناسایی جنسیت، با توجه به مطالعات زبان روان شناختی صورت گرفته، 48 ویژگی روان شناختی و سبک شناسی تعریف شد. دو پیکره متنی جهت آموزش طبقه بندها تهیه و سپس برای شناسایی جنسیت، سه الگوریتم یادگیری ماشینی مختلف (ماشین بردار پشتیبان، بیز ساده و درخت تصمیم) طراحی شد. نتایج اعتبارسنجی متقابل ده تایی نشان داد که بیش ترین دقت مربوط به طبقهبند درخت تصمیم با دقت %8/73 است.
    کلیدواژگان: تشخیص جنسیت، شناسایی نویسنده، متن کاوی
  • فاطمه سلطان زاده، محمد بحرانی، محرم اسلامی صفحات 95-115
    هدف مقاله حاضر ارائه روشی خودکار جهت تبدیل درخت تجزیه نحوی وابستگی به درخت تجزیه نحوی مبتنی بر دستور ساخت سازه ای معادل در زبان فارسی است. برای نیل بدین هدف، الگوریتمی قاعده مند جهت این نوع تبدیل طراحی شده است. به منظور دستیابی به درخت تجزیه نحوی ساخت سازه ای مناسب برای جملات زبان فارسی، دستور زبان فارسی مورد مطالعه قرار گرفته و قوانین خاص زبان فارسی استخراج و به الگوریتم مذکور افزوده شده است. نتایج حاصل از ارزیابی پژوهش، بیانگر این است که الگوریتم طراحی شده برای تبدیل ساختارها به F1 معادل با 05/96 درصد دست یافته است؛ سپس، الگوریتم مذکور بر روی پیکره وابستگی زبان فارسی با حدود سی هزار جمله اعمال و دادگان درخت نحوی ساخت سازه ای معادل حاصل شده است. علاوه بر این، تجزیه گر نحوی استنفورد بر روی پیکره ساخت سازه ای حاصل آموزش داده شده و تجزیه گر نحوی ترکیبی زبان فارسی با F1 معادل با 01/86 درصد به دست آمده است.
    کلیدواژگان: تبدیل، دستور وابستگی، دستور ساخت سازه ای، پردازش زبان طبیعی، دادگان درخت نحوی، زبان فارسی
  • بابک مسعودی، سعید راحتی صفحات 117-125
    ابهام زدایی از واژگان مبهم و دارای معانی متعدد، موضوع مهمی در حوزه پردازش زبان های طبیعی است. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی با استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با به کار بردن روش های مدل سازی موضوع به دست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوع های موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله (LDA) برای این منظور استفاده کرده ایم. نتایج آزمایش ها برای پانزده واژه مبهم پر تکرار در زبان فارسی که از پیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقت حدود 97% را نشان می دهد که بیان گر تاثیر این روش در یافتن معنی مناسب واژگان مبهم است.
    کلیدواژگان: تخصیص پنهان دریکله، چند معنایی، رفع ابهام معنایی، مدل سازی موضوع
|
  • Seyed Mojtaba Marvasti-Zadeh, Hossein Ghanei-Yakhdan Pages 3-15
    Despite error resilient methods that are applied on video data in transmitter side¡ occurring error along video data transferring for communication channels is inevitable. Error concealment is a useful method for improving the quality of damaged videos on the receiver side. In this paper¡ a fast and hybrid boundary matching algorithm is presented for more accurate estimating of damaged motion vectors (MVs) from received video. According to the preference list of error concealment¡ the proposed algorithm performs the error concealment for each damaged macroblock (MB). In the presented method¡ the boundary distortion is calculated for each pixel from each candidate MB''s boundary with use of proposed hybrid boundary matching criterion. Then¡ depending on the accuracy of each adjacent boundary from damaged MB¡ a special weight is given to them through match process. Finally¡ the list of error concealment preference is updated and the candidate MV with the lowest boundary distortion is selected as the MV of damaged MB. Experimental results show that the proposed algorithm increases the average of PSNR for different test sequences more than 1.8 dB in comparison with reference methods and without significant increasing in calculation time and with improving the quality of reconstructed videos.
    Keywords: Temporal Error Concealment, Motion Vector Estimation, Hybrid Boundary Matching Algorithm, Macroblock
  • Hamid Rajabi, Manoochehr Nahvi Pages 17-31
    The population of elderly people has growing trend in the developed or developing countries. Since the elderly are mainly associated with disability, this group of people exposed to dangerous events such as falling down. It is therefore needed to take care of these people against dangerous events. Intelligent video monitoring is a approach that may be able to give quick notification to the caregivers. For this purpose, in this paper,an approach using a novel tracking method based on modified contour algorithm is presented. The new method is able to conduct tracking and falling down detection in a realistic conditions in the presence of multiple motions. Simulations indicate that the proposed algorithm is able to identify the fall-down event with high accuracy and speed.
    Keywords: fall detection algorithm, contour, machine vision, tracking, intelligent surveillance systems
  • Mohammad Sadegh Nemati Nia, Taraneh Eghlidos, Ali Payandeh Pages 33-42
    Guess and determine attacks are general attacks on stream ciphers. These attacks are classified into ad-hoc and Heuristic Guess and Determine (HGD) attacks. One of the Advantages of HGD attack algorithm over ad-hoc attack is that it is designed algorithmically for a large class of stream ciphers while being powerful. In this paper, we use auxiliary polynomials in addition to the original equations as the inputs to the HGD attack on TIPSY and SNOW 1.0 stream ciphers. Based on the concept of guessed basis, the number of guesses in both HGD attack and the improved one on TIPSY is six, however the attack complexity is reduced from O(2102)to O(296). This amount is equal to that of ad-hoc attack, but the size of the guessed basis is improved from seven to six. Also, the complexity of GD attack on SNOW 1.0 of heuristic one with the guessed basis of size 6 and ad-hoc attack with the guessed basis of size 7areO(2202) and O(2224), respectively. However, the complexity and the size of guessed basis of the improved HGD attack are reduced to O(2160) and 5, respectively.
    Keywords: Stream Cipher, Guess, Determine attack, TIPSY, SNOW 1.0, Computational Complexity
  • Bahram Vazirnejad, Fatemeh Soltanzadeh, Mohsen Mahdavi Mazdeh, Mehdi Moradi Pages 43-52
    In this paper, we will introduce an intelligent system to edit and spell check Persian texts. The goal is editing and preprocessing Persian texts for natural language processing tasks. This system is based on an expandable and engineering approach and is composed of three subsystems: Persian text editor, spell checker and stemmer. These parts interact with each other to edit texts. To do this, the stemmer subsystem process each word in the text; if the subsystem could not find a stem in the lexicon, the word will be recognized as an incorrect word. Then, the spell checker provides a list of suggestions to correct the wrong word. Subsequently, the editor subsystem edits the text based on the standards of the Academy of Persian Language and Literature. Our evaluation shows nearly 92%, 95% and 96% precision numbers for editor, stemmer and spell checker subsystems, respectively.
    Keywords: Natural Language Processing, automatic spell checking, text editor, stemmer
  • Somaye Ahmadkhani, Peyman Adibi Pages 53-65
    In this study, first a supervised version for probabilistic principal component analysis mixture model (SPPCAMM) is proposed. Then, considering projection penalty in learning of a predictive model, a method for face recognition using a dimensionality reduction without loss framework is proposed. In the proposed method, first a locally linear underlying manifold of data samples is obtained using supervised probabilistic principal component analysis mixture model. Then, a support vector machine with projection penalty is trained as the mentioned predictive model using this locally linear underlying manifold. In this way, the benefits of dimensionality reduction are used in the predictive model, while using the projection penalty idea, the loss of useful information is prevented. To train and evaluate the proposed method, well-known face databases are used. Gabor feature extraction method is applied on the face images. The experimental results show that the proposed method has the most average classification accuracy compared to many traditional methods, and also compared to the projection penalty idea used for linear and non-linear kernel-based dimensionality reduction techniques.
    Keywords: Lossless Dimensionality Reduction, Mixture Model, Probabilistic Principal Component Analysis, Supervised, Projection Penalty
  • Foruzan Fasahat, Pedram Payvandy Pages 67-81
    Flexibility of woven fabric structure has caused many errors in yarn location detection using customary methods of image processing. On this line, proposing an adaptive method with fabric image properties is concentrated to extract its parameters. In this regards, using meta-heuristic algorithms seems applicable to correspond extraction algorithm of structural parameters to the image conditions. In this study, a new method is proposed for woven fabric image preprocessing and structural texture detection applying compound methods of signal processing, fuzzy clustering and genetic algorithm. Results indicate that proposed method is capable of detecting exact yarn location with mean precision of more than 73 percent in double-layered fabric images with uneven color pattern. In one-layered fabric images with low density weave and invariable color pattern, the mean precision is more than 84 percent.
    Keywords: Genetic Algorithm, Wavelet Transform, Fuzzy c, means (FCM) clustering, Image Processing, Fabric Image, Yarn Location
  • Mehdi Moradi, Mohammad Bahrani Pages 83-94
    communities, cyberspace is vulnerable to attacks, false information and deception. It becomes increasingly important to design an efficient method to trace identity in this community. In order to investigate the problem of gender identification, we propose 48 features, and design three machine learning algorithms. The results of study showed that AD tree classifier had accuracy up to 73.8%.
    Keywords: Gender identification, author identification, text mining
  • Fatemeh Soltanzadeh, Mohammad Bahrani, Moharam Eslami Pages 95-115
    In this paper, an automatic method in converting a dependency parse tree into its equivalent phrase structure one is introduced for the Persian language. In the first step, a rule-based algorithm is designed. Then, Persian specific dependency-to-phrase structure conversion rules merge to the algorithm. Subsequently, the Persian dependency treebank with about 30,000 sentences is used as an input for the algorithm and an equivalent phrase structure treebank is extracted. Finally, the statistical Stanford parser is trained using the resulting treebank. Experimental results show a F1 of 96.05% for the conversion algorithm and an F1 of 86.01% for Persian factored model parser.
    Keywords: Conversion, Dependency Grammar, Phrase Structure Grammar, Natural Language Processing, Treebank, Persian.
  • Babak Masoudi, Saeed Rahati Ghouchani Pages 117-125
    Word sense disambiguation is the task of identifying the correct sense for the Word in a given context among a finite set of possible senses, and plays an important role in many natural language processing applications such as machine translation, document classification, and information retrieval.
    In this paper we proposed to use LDA topic model for disambiguating Farsi homograph words with new features. A topic model is a statistical model for extract topics from documents of a corpus. We use Latent Dirichlet Allocation (LDA) that is an unsupervised technique.
    The system achieved 97% precision for 4 high frequently Farsi homograph words.
    Keywords: Latent Dirichlet Allocation (LDA), Topic model, Word sense disambiguation