فهرست مطالب

پردازش علائم و داده ها - سال دوازدهم شماره 1 (پیاپی 23، بهار 1394)

فصلنامه پردازش علائم و داده ها
سال دوازدهم شماره 1 (پیاپی 23، بهار 1394)

  • تاریخ انتشار: 1394/04/15
  • تعداد عناوین: 6
|
  • سیده زهره سیدصالحی، سیدعلی سیدصالحی صفحه 3
    یادگیری منیفلد یکی از روش های کاهش بعد مطرح به منظور استخراج ساختار غیرخطی داده با ابعاد بالاست. تاکنون روش های زیادی به این منظور ارائه شده اند. در تمام این روش ها یک منیفلد به عنوان منیفلد جاسازی شده در داده استخراج می شود. در حالی که در خیلی از مسائل مربوط به دنیای واقعی یک منیفلد به تنهایی بیان گر ساختار داده نیست. در این راستا بر مبنای تحقیقات قبلی، یک روش کاهش بعد غیرخطی مبتنی بر شبکه های عصبی عمیق ارائه شده است که قادر به استخراج توام منیفلدهای جاسازی شده در داده است. در مدل شبکه عصبی تفکیک کننده منیفلدهای غیرخطی، برخلاف روش معمول استخراج منیفلد با شبکه های عصبی که به صورت بدون سرپرستی صورت می گیرد، از برچسب داده در جهت شکل گیری منیفلدها به صورت غیرمستقیم استفاده می شود. با توجه به ساختار عمیق این مدل نشان داده شده است که با بهره گیری از روش های پیش تعلیم می توان به طور معناداری عملکرد آن را بهبود بخشید؛ همچنین در راستای استخراج بهتر منیفلدها و حفظ تمایز درون منیفلدی برای طبقات مختلف، توابع معیار آن بهبود داده شده است. این مدل برای استخراج منیفلدهای حالت های احساسی و هویت افراد از دادگان چهره CK+، مورد استفاده قرار گرفته است. با بهره گیری از پیش تعلیم لایه به لایه و بهبود توابع معیار، نرخ بازشناسی حالت برای تصاویر مجازی از %29/ 24 به %07/ 75 و درصد صحت بازشناسی هویت با یک تصویر از هر فرد با غنی سازی دادگان تعلیم طبقه بند KNN توسط این تصاویر مجازی، از %62/ 90 به %07/ 97 نسبت به مدل اولیه بهبود داشته است.
    کلیدواژگان: شبکه عصبی، یادگیری منیفلد، تمایز درون منیفلدی، الگوهای مجازی، ساختار عمیق، تفکیک منیفلدها
  • افسانه معدنی، نسرین تاج صفحه 17
    شبکه IMS توسط ETSI به عنوان هسته شبکه های نسل آینده تعیین شده است. ساختار هسته این شبکه از دید پیام های کنترلی و پروتکل های ارتباطی باعث شده امنیت به عنوان یک قابلیت ضروری برای نیازمندی های آن درآید. پیام های کنترلی این شبکه توسط پروتکل SIP منتقل می شود که یک پروتکل لایه کاربرد است. به دلیل اجباری بودن احراز هویت کاربر در زمان ثبت نام و به دلیل اضافه شدن سرآیند های سیگنالینگ، این شبکه امن تر از شبکه های رایجی نظیر VOIP است، هرچند آسیب پذیری های متفاوتی اضافه شده است که منجر به حملات بر روی سرورها می شود. این پژوهش بررسی بر روی سرورهای اصلی (x-CSCF) این شبکه را مبتنی بر تهدید، آسیب پذیری و تحلیل اثر حمله بر دسترس پذیری و محرمانگی انجام می دهد. این کار با استفاده از یک روش تحلیل آسیب پذیری (TVRA) انجام شده است که مبتنی بر احتمال وقوع حمله و آسیب ناشی از آن است. تهدید به دلیل وجود ضعف ایجاد شده و سبب آسیب می شود. پس از شناخت سرمایه های سامانه، نقاط ضعف ها و آسیب پذیری تجهیزات و کاربردها، شاخص های امنیتی به دست می آید که در تولید و پیاده سازی امن سرورها حایز اهمیت هستند و سبب کاهش هزینه و ارتقای امنیت است. مدل سازی از طریق تعریف و یافتن تابعی با متغیرهای (سرمایه منطقی/ نقطه ضعف/ موقعیت/ تهدید و حمله/ هدف امنیتی نقض شده) انجام شد که ارتباط این متغیرها تمهیدات پیش گیرانه امنیتی را روشن کرد. حملات رایج سرورها براساس مدل سازی گروه بندی و به ترتیب فراوانی وقوع در جدول مرتب شد. نتایج مدل سازی نشان می دهد که مهم ترین روش های سیگنالینگ شامل روش دعوت و ثبت نام هستند که نقش اساسی در رخ دادن حملات سیلاب سازی و نقض دسترسی دارند و رمزنگاری ارتباط سرور P-CSCF (مهم ترین سرور ارتباطی با کاربر) جلوی بسیاری از حملات ناشی از شنود را می گیرد. از بین سرورهای سه گانه SIP، این سرور نقش کلیدی در ارتقای امنیت و کاهش زمان پردازش در ارتباط ها را بر عهده دارد.
    کلیدواژگان: مدل سازی امنیتی TVRA، حملات سیلاب سازی سرورهای IMS SIP، معماری و شبکه IMS، تحلیل آسیب پذیری
  • حسین پورقاسم صفحه 33
    ردیابی خودرو یکی از چالش های مهم در سیستم های حمل و نقل هوشمند جهت تخمین موقعیت خودرو در قاب بعدی از یک دنباله متوالی تصاویر از ویدئوهای نظارتی است. در این مقاله، یک الگوریتم ردیابی خودرو مبتنی بر ویژگی با استفاده از الگوریتم تخمین زننده ویژگی Kanade-Lucas-Tomasi (KLT) گسترش یافته است. در این الگوریتم، برای جایگزینی خودروها با ویژگی های ردیابی شده، یک الگوریتم گروه بندی دومرحله ای سلسله مراتبی ادغام و تقسیم پیشنهاد می شود. در الگوریتم گروه بندی پیشنهادی با تعریف معیارهایی همچون معیارهای فاصله، گستردگی و همچنین آنالیز حباب نتایج گروه بندی اولیه حاصل شده از الگوریتم خوشه بندی K-means اصلاح می شود. علاوه براین، جهت تصحیح عملکرد الگوریتم تخمین زننده ویژگی KLT و همچنین استفاده مناسب تر از نتایج گروه بندی الگوریتم پیشنهادی، یک الگوریتم کارآمد تطبیق گروه های ویژگی براساس نقشه ادغام و تقسیم جهت تطبیق گروه ویژگی های ردیابی شده از یک قاب به قاب بعد پیشنهاد می شود. در این الگوریتم تطبیق سعی شده است که با استفاده از ویژگی های منطبق شده بین دو قاب، خودروهای متناظر در آن دو قاب به درستی تطبیق داده شوند. الگوریتم ردیابی پیشنهادی بر روی ویدئوهای آزمایشی متفاوتی با شرایط نورپردازی متفاوت همچون روز، شب و وجود سایه ارزیابی می شود. نتایج حاصل نشان می دهد که الگوریتم ردیابی پیشنهادی اکثر چالش های مهم ردیابی خودرو در کاربردهای عملیاتی سامانه های حمل و نقل هوشمند را پوشش می دهد.
    کلیدواژگان: الگوریتم گروه بندی دومرحله ای سلسله مراتبی ادغام و تقسیم، الگوریتم تطبیق گروه ها مبتنی بر نقشه ادغام و تقسیم، الگوریتم ردیابی مبتنی بر ویژگی، سامانه حمل و نقل هوشمند
  • غلامعلی منتظر، محمد شایسته فر صفحه 47
    یکی از مهم ترین زیرسامانه های حمل و نقل هوشمند، سامانه تشخیص و شناسایی پلاک خودرو است. دشواری تشخیص و شناسایی صحیح پلاک خودرو در شرایط مختلف محیطی موجب شده تا پژوهش در این زمینه پژوهشی هم چنان ادامه داشته باشد. مسئله تشخیص پلاک خودرو را می توان به سه زیر مسئله «جایابی پلاک»، «استخراج نویسه های پلاک» و «شناسایی نویسه ها» تقسیم کرد. در این مقاله تلاش شده به کمک قواعد فازی، الگوریتم های جایابی پلاک خودروهای ایرانی و شناسایی نویسه های آن بهبود یابد. جایابی پلاک با لبه یابی، تحلیل ریخت شناسانه و استفاده از قواعد فازی و شناسایی نویسه ها با استفاده از ماشین بردار پشتیبانی فازی انجام شده است. با آزمایش الگوریتم یادشده بر روی پنجاه تصویر صحت جایابی پلاک خودرو 90 درصد و صحت شناسایی نویسه ها 94 درصد به دست آمد که در مقایسه با روش های مرسوم توانمندی چشمگیری دارد.
    کلیدواژگان: پلاک خودرو، شناسایی الگو، ماشین بردار پشتیبانی، نظریه فازی
  • پوریا اعتضادی فر، حسن فرسی صفحه 57
    با توجه به پیشرفت فناوری در دهه های اخیر، ارسال و دریافت ویدئو از طریق کانال های مخابراتی بی سیم با استقبال گسترده ای روبه رو شده است. بدین منظور روش های بسیاری جهت بالابردن کیفیت ویدئویی ارسالی ارائه شده اند.یکی از مواردی که کیفیت فایل های ویدئویی را کاهش می دهد، وجود خطا در مقادیر بردارهای حرکت است. در صورت ایجاد خطا در مقادیر بردارهای حرکت، تصاویر ایجادشده مقداری نسبت به حالت قبلی خود جابه جا می شوند و کیفیت فریم دریافتی را به صورت قابل توجهی پایین می آورند. در این مقاله به منظور مقابله با این مشکل و همچنین بالابردن PSNR، از افزایش نرخ کدگذاری کانال در یک نرخ ارسال ثابت استفاده می شود. در روش پیشنهادی، ابتدا با استفاده از پنجره ای با اندازه 8×8 جستجو در فریم مورد نظر شروع می شود. پس از اتمام جستجو بلوک هایی که در همسایگی یکدیگرند و دارای مقدار حرکت صفر (بدون حرکت) هستند با یکدیگر ترکیب می شوند و این امر منجر به ساخته شدن بلوکی با ابعاد بزرگ تر می شود. همچنین بلوک هایی که دارای مقدار حرکت برابر بوده اند نیز با یکدیگر ترکیب و به دو روش مختلف به گیرنده ارسال می شوند. آزمایش های انجام شده نشان می دهند که روش پیشنهادی بدون افزایش حجم اطلاعات ارسالی برای هر فریم، توانسته است فریم های ویدئویی را نسبت به خطاهای کانال مقاوم تر سازد. در انتها نتایج به دست آمده با چندین نرخ ارسال برای منبع و چندین SNR برای کانال با نتایج به دست آمده از روش های متداول مقایسه شده است. پس از مقایسه روش پیشنهادی با روش های متداول، این نتیجه به دست آمد که با مقاوم سازی بردارهای حرکت، با استفاده از افزایش نرخ کدگذاری در بردار های همسایه دارای مقدار یکسان، می توان کیفیت فریم های ویدئویی دریافت شده را در حد قابل قبولی افزایش داد.
    کلیدواژگان: ترکیب بلوک ها، کدگذاری فریم های ویدئویی، نرخ بیت متغیر، کدگذاری کانال
  • مسعود گراوانچی زاده، علی فلاح، میرعلی اعتراف اسکویی صفحه 79
    در این مطالعه، نرخ تشخیص همخوان های موجود در ساختار هجایی «واکه- همخوان- واکه»، در آزمون های شنوایی و دو مدل میکروسکوپی ادراک گفتار مورد بررسی قرار می گیرد. چنین ساختار هجایی در زبان فارسی و ترکی آذری وجود ندارد؛ با وجود این، نتایج آزمون های شنوایی نشان می دهد که شنونده آذری یا فارسی زبان در شرایط بدون نوفه، قادر به تشخیص صحیح همخوان ها هستند. برای این پژوهش که در آن هدف، تشخیص صحیح آواها و نه کلمات بامعنی است، استفاده از این دادگان صوتی فاقد معنی مناسب است، چون با استفاده از این دادگان، دانش زبانی شنوندگان در پیش بینی کلمات نادیده گرفته میشود. نتایج آزمون های شنوایی با نتایج دو مدل میکروسکوپی که بر پایه دستگاه شنوایی انسان است، مقایسه می شود. تفاوت دو مدل در مرحله نهایی استخراج ویژگی به منظور استفاده در شناساگر خودکار گفتار DTW است. در مدل میکروسکوپی اول، در مرحله پایانی استخراج ویژگی، از فیلتر 8 هرتز و در مدل دوم، از فیلتربانک مدولاسیون استفاده می شود. در ادامه، نرخ تشخیص صحیح آواها در مقادیر مختلف سیگنال به نوفه با استفاده از معیارهای فاصله اقلیدسی و لگاریتمی با یکدیگر مقایسه می شود. در این تحقیق، نرخ تشخیص همخوان ها برای شنونده آذری زبان مورد بررسی قرار گرفته است. در کنار جنبه تجربی این مطالعه، نو آوری این مقاله در بررسی دو معیار فاصله مختلف برای مدل هلوب و نیز مقایسه مستقیم دو مدل میکروسکوپی در پیش بینی میانگین نرخ تشخیص و نیز نرخ تشخیص تک تک همخوان ها است.
    کلیدواژگان: قابلیت فهم، ادراک گفتار، مدل میکروسکوپی، بردار ویژگی، نرخ تشخیص آوا، معیار فاصله، شناساگر خودکار گفتار
|
  • Seyyede Zohreh Seyyedsalehi, Seyyed Ali Seyyedsalehi Page 3
    Manifold learning is a dimension reduction method for extracting nonlinear structures of high-dimensional data. Many methods have been introduced for this purpose. Most of these methods usually extract a global manifold for data. However، in many real-world problems، there is not only one global manifold، but also additional information about the objects is shared by a large number of manifolds. In this context، based on previous researches، this paper proposes a nonlinear dimension reduction method based on the deep neural network that extract simultaneously manifolds embedded in data. In nonlinear manifold separator model، unlike unsupervised learning of bottleneck neural network، data labels are indirectly used for manifold learning. Given the deep structure of the model، it has been shown that using pre-training methods can significantly improve its performance; moreover، to improve within-manifold discrimination for different classes، its standard functions have been improved. This paper makes use of the model for extracting both expression and identity manifolds for facial images of the CK+ database. In comparing early and improved models، it is shown that the facial expression recognition rate from 24. 29% to 75. 07% and the face recognition rate by a single image of each person by enriching dataset from 90. 62% to 97. 07% were improved.
    Keywords: Neural network, Manifold learning, Within, manifold discrimination, Virtual patterns, Deep structure, Manifold separation
  • Afsaneh Madani, Nasrin Taj Page 17
    IMS (IP Multimedia Subsystem) network is considered as an NGN (Next Generation Network) core networks by ETSI. Decomposition of IMS core network has resulted in a rapid increase of control and signaling message that makes security a required capability for IMS commercialization. The control messages are transmitted using SIP (Session Initiation Protocol) which is an application layer protocol. IMS networks are more secure than typical networks like VoIP according to mandatory of user authentication in registration time and added SIP signaling headers. Also different vulnerabilities have been occurred that lead to SIP servers attacks. This paper studies the main SIP servers of IMS (x-CSCF) based on ETSI Threat، Vulnerability and Risk Analysis (TVRA) method. This method is used as a tool to identify potential risks to a system based upon the likelihood of an attack and the impact that such an attack would have on the system. After identifying the assets and weaknesses of IMS SIP servers and finding out the vulnerabilities of these hardware and software components، some security hints that can be used for secure deployment of IMS SIP servers are proposed. Modeling shows the effects of server weaknesses and threats that reduces availability. Any designed system has some assets with weaknesses. When threats have accrued based on weaknesses، the system will vulnerable. Vulnerability analysis optimizes costs and improves security.
    Keywords: TVRA Security Modeling, IMS SIP Servers Flooding attacks, IMS architecture, network Vulnerability assessment
  • Hossein Pourghassem Page 33
    Vehicle tracking is an important issue in Intelligence Transportation Systems (ITS) to estimate the location of vehicle in the next frame. In this paper، a feature-based vehicle tracking algorithm using Kanade-Lucas-Tomasi (KLT) feature tracker is developed. In this algorithm، a merge and split-based hierarchical two-stage grouping algorithm is proposed to represent vehicles from the tracked features. In the proposed grouping algorithm، with defining measures such as distance، spread and also blob analysis، initial grouping results formed by K-means clustering algorithm are refined. Moreover، to modify the performance of KLT tracker and also optimized utilization from grouping results obtained by proposed algorithm، an effective group matching algorithm based on a merging and splitting scheme is employed to match the tracked groups from a frame to the next frame. The proposed tracking algorithm is evaluated on different test videos with various illumination conditions such as day، night and shadow. The obtained results show that our proposed tracking algorithm covers the most challenges of tracking in the ITS applications.
    Keywords: Merge, split hierarchical two, stage grouping algorithm, Group matching algorithm based on merge, split schemes, Feature, based tracking algorithm, Intelligence transportation system
  • Gholam Ali Montazer, Mohammad Shayestehfar Page 47
    License plate recognition is one of the most important applications in intelligent transportation systems. Difficulty of correct detection and identification of the car plates in different environment conditions makes researchers try new approaches to better solve the problem. License plate recognition problem is divided into three sub problems: «Plate Location»، «Character Segmentation»، and «Character Identification». In this paper we have tried to improve location and identification of Iranian license plate with fuzzy rules. License locating has been done with edge detection، morphological operations and using fuzzy rules and characters have been identified by fuzzy support vector machine. By applying the algorithm on 50 images، 90% of plates were located and 94% of characters were identified successfully. This shows superiority of our algorithm over non-fuzzy approaches.
    Keywords: license plate, pattern recognition, support vector machine (SVM), fuzzy theory
  • Pouriya Etezadifar, Hassan Farsi Page 57
    Due to progress of technology speedily during recent decades، video transmission and receipt through wireless communication channel has found high demands. This causes that several methods have been reported to improve the quality of transmitted video frames. Presence of transmission error in motion vector values is a factor which degrades the quality of the synthesized video. If this error occurs، then the location of the synthesized image blocks changes compared to their original position and therefore the quality of the synthesized video is considerably affected. In this paper، to overcome to this problem and also to increase PSNR، channel coding rate for motion vector values increases while transmission rate is maintained. In the proposed method، search procedure is started in current frame using a window with length of 8*8. When the search is completed، the blocks which are located in neighbor of each other without any movement are combined together and therefore a block with larger size is constructed. In addition، the movement blocks are combined together and transmitted in two different methods. Experimental results show that the proposed method is able to provide more robustness for video frames against channel errors without increasing the transmission rate. At the end، the obtained results are compared to those reported by state-of-art methods for different source coding rates and SNRs. The obtained results show that the quality of the synthesized video considerably improves by providing more robustness for motion vector values through increasing coding rate for the neighbor vectors having similar values.
    Keywords: Block combination, video frame coding, variable bit rate, channel coding
  • Masoud Geravanchizadeh, Ali Fallah, Mir Ali Eteraf Oskouei Page 79
    In this study، recognition rates of consonants available in vowel-consonant-vowel structure in hearing tests and two microscopic models will be investigated. Such a syllable structure doesn’t exist in Farsi and Azerbaijani languages، but since the goal is only recognition of middle phoneme، according to hearing tests، listeners are able to properly recognize phonemes in clean speech conditions. Inasmuch as these syllable structures are meaningless، it will be suitable for our purpose that is only determination of recognition rates of phonemes not meaningful words. Using this corpus، listeners’ linguistic knowledge in prediction of words is disregarded. Results of hearing tests are compared with two microscopic models based on human auditory system. Difference between two models is at the final stage of feature extraction that in first model، a 8 Hz filter and in the second model a modulation filterbank is used. Correct recognition rates of phonemes in different signal to noise ratios and two distance metrics for speech recognizer، will be compared. In this study recognition rates of consonants for listeners with Azerbaijani native language have been studied. Beside the empirical aspect of the paper، the innovations of this work lies in the study of using two different distance measures for Holube’s model and also direct comparison of two microscopic models in prediction of overall recognition rates and recognition rate of each consonant.
    Keywords: Intelligibility, Speech perception, Microscopic model, Feature vector, Phoneme recognition rate, Distance measure, Automatic Speech Recognizer