فهرست مطالب

نشریه ماشین بینایی و پردازش تصویر
سال دوم شماره 1 (بهار و تابستان 1394)

  • تاریخ انتشار: 1394/05/30
  • تعداد عناوین: 6
|
  • مریم افضلی *، عمادالدین فاطمی زاده، حمید سلطانیان زاده صفحات 1-9
    تصویربرداری تشدید مغناطیسی تانسور انتشار (DTMRI) یک روش غیرتهاجمی برای بررسی ساختار ماده سفید مغز است. در این روش، تابع انتشار مولکول های آب گوسی فرض می شود اما در نواحی از مغز که فیبرها با هم تقاطع دارند این فرضیه صادق نیست. تصویربرداری انتشار با رزولوشن زاویه ای بالا در تعداد زیادی جهت انتشار (HARDI)، امکان بررسی دقیق ریزساختارهای ماده سفید مغز را فراهم می کند. این روش می تواند تقاطع فیبرها را در هر واکسل نشان دهد. برای کاربردهایی مثل آنالیز گروهی یا ساخت اطلس، انطباق تصویر یکی از گام های اساسی است. تصاویر HARDI دارای اطلاعات جهتی مفیدی از ساختار فیبرهاست بنابراین انطباق آن ها پیچیده تر از تصاویر اسکالر است. در این مقاله یک الگوریتم انطباق براساس بردارهای ویژگی استخراج شده از روی تابع توزیع جهت فیبرها (ODF) ارائه می شود. معیار شباهت hammer برای تطبیق بردارهای ویژگی به کار می رود و روش thin-plate spline برای انطباق مکانی اسکلت و همسایه ها استفاده می شود. سپس تصحیح جهت روی ODFها اعمال می گردد. سرانجام، روش پیشنهادی براساس اختلاف در جهت انتشار غالب، مورد ارزیابی قرار می گیرد. نتایج نشان می دهد که استفاده از اسکلت به عنوان نقاط نشانه در انطباق، به همراستایی دقیق داده های HARDI کمک می کند و خطای انطباق در مقایسه با روش های قبلی، تا حدودی کاهش می یابد.
    کلیدواژگان: تصویربرداری انتشار با رزولوشن زاویه ای بالا، تصویربرداری q، ball، تابع توزیع جهتی، انطباق، جهت انتشار غالب
  • محمدعلی زارع چاهوکی* صفحات 11-22
    بازیابی تصویر مبتنی بر محتوی، به معنای بازیابی تصاویر با استفاده از ویژگی های سطح پایین همچون رنگ، بافت و شکل می باشد. در این نوع بازیابی، شکاف معنایی به معنای اختلاف در تفسیر تصاویر، بین انسان و الگوریتم کامپیوتری می باشد. در این حوزه، نگاشت غیرصحیح ویژگی های سطح پایین تصویر به معانی سطح بالا، سبب می شود تا شکاف معنایی افزایشیابد. در بازیابی تصویر، چنانچه با تغییر در بافت، رنگ و یا شکل تصویر، از نظر انسان معنای تصویر تغییری نکند، ولی به دلیل تغییر غیر پیوسته در بردار ویژگی های سطح پایین تصویر، بازیابی تصاویر مشابه در تمامی موارد به درستی انجام نمی پذیرد. در این مقاله جهت همسو سازی نسبت تغییرات در فضای ویژگی متناسب با فضای معنا، از رویکرد کاهش ابعاد بردارهای ویژگی به صورت غیر خطی استفاده می شود. کاهش ابعاد بردارهای ویژگی به صورت غیرخطی که یادگیری منیفلد نیز نامیده می شود به معنای جستجوی ساختارهایی با ابعاد کم است که به صورت ذاتی و غیرخطی در مشاهدات با ابعاد بالا وجود دارد. نوآوری اصلی ارائه شده در این مقاله، استخراج یک فضای ویژگی از چند فضای ویژگی می باشد که با دو روش ارائه شده، اثر منفی نویز در دقت یادگیری منیفلد کاهش می یابد. در ارزیابی دو روش پیشنهادی، از دادگان های بخش B از MPEG-7 و Fish استفاده شده است که نتایج تجربی بیان گر موثر بودن روش های پیشنهادی می باشد.
    کلیدواژگان: بازیابی تصویر مبتنی بر محتوی، بازیابی شکل، استخراج غیرخطی ویژگی ها، کاهش ویژگی ها، یادگیری منیفلد
  • عفت یاحقی*، امیر موافقی، نورالدین محمدزاده صفحات 23-31
    رادیوگرافی صنعتی یکی از مهمترین روش های آزمون های غیر مخرب برای شناسائی عیوب جوشکاری مانند ترک می باشد. تشخیص دقیق عیب های ترک (تفسیر فیلم) به دقت و مهارت شخص پرتوکار و کیفیت فیلم های پرتونگاری بستگی دارد. بسیاری از تصاویر تهیه شده به روش پرتونگاری صنعتی وضوح کافی را ندارند. در نتیجه روش هایی مورد نیاز است که بتوان این عیب ها را با دقت بیشتری بررسی کرد. ترک ها بعلت شکل ظاهری و کوچک بودن پهنای آنها نسبت به طولشان، ترکیب فرکانسی خاصی نسبت به سایر عیوب جوشکاری دارند. بنابراین با روش های تحلیلی پردازش تصویر بر اساس فرکانس و زمان می توان سیگنال های آنها را تجزیه و تحلیل کرد. در این تحقیق با استفاده از دو روش تجزیه مد تجربی و تبدیل موجک که مبتنی بر مشخصات زمانی و فرکانسی سیگنال ها هستند نواحی و شکل ترک در جوش مشخص و مقایسه شده اند. در هر دو روش با ترکیب وزنی مولفه های بدست آمده از تجزیه تصاویر، تصاویری ساخته شده اند و عیوب ترک در آنها بررسی شده است. نتایج حاصل از بکارگیری هر دو روش نشان می دهند روش تجزیه مد تجربی نسبت به روش تبدیل موجک در شناسایی عیوب ترک مناسب تر است و در این تصاویر هر چند کنتراست کاهش یافته ولی شکل و محل ترک ها واضح تر شده اند.
    کلیدواژگان: عیب ترک، رادیوگرافی صنعتی، پردازش تصویر، روش تجزیه مد تجربی، تبدیل موجک
  • مهدی خوش باطن*، سید محمد رضوی، ناصر مهرشاد صفحات 33-43
    نیاز روزافزون به تشخیص هویت در کاربردهای گوناگون، لزوم طراحی سیستم های خودکار مبتنی بر پردازش تصویر را توجیه می کند. در این تحقیق، روش جدیدی برای بازشناسی برون خط امضاء ارائه شده است. روش بهینه ی ارائه شده برای استخراج ویژگی، نسبت به تغییرات مقیاس و چرخش پایدار می باشد. برای مقایسه این ویژگی ها نیز از یک معیار شباهت جدید مبتنی بر تعداد نقاط منطبق استفاده شده است. علاوه بر این، در مرحله پس پردازش از یک فیلتر تطابق مختصاتی ابتکاری، کارآمد و موثر با هزینه محاسباتی کم استفاده شده است که با الگوریتم استخراج ویژگی هم خوانی دارد. این فیلتر یک مقدار آستانه روی تفاوت مختصات دکارتی نقاط دو بلوک متناظر تصویر اعمال می کند. پیاده سازی سیستم پیشنهادی شامل ویژگی های بهینه پایدار به تغییرات مقیاس و چرخش، استفاده از معیار شباهت جدید معرفی شده ی مناسب برای این ویژگی ها و پس پردازش با استفاده از فیلتر مختصاتی پیشنهاد شده، روی بانک های اطلاعاتی معتبر GPDS960 (برون خط) و SVC2004 (برخط تبدیل شده به برون خط) نشان دهنده بهبود کارایی سیستم تشخیص هویت پیشنهادی است. همچنین پارامترهای سیستم پیشنهادی به صورت خودکار و تنها یک بار با استفاده از الگوریتم وراثتی انتخاب شده و برای هر بانک اطلاعاتی شخصی سازی می گردد.
    کلیدواژگان: بازشناسی برون خط امضاء، الگوریتم وراثتی، ویژگی محلی بهینه شده، فیلتر تطابق مختصاتی، معیار شباهت، بیومتریک
  • امین محمدیان *، حسن آقایی نیا، فرزاد توحیدخواه صفحات 45-56
    تشخیص خودکار، پیوسته و غیرتهاجمی درد و شدت آن جهت ارزیابی و مدیریت درد در مراکز بالینی لازم است. به همین منظور راه حلی پیشنهاد شده که به کد کردن واحدهای کنشی چهره مرتبط با درد می پردازد و معادل رویکرد مبتنی بر توصیف چهره است. اما بروز این جلوه ها در چهره افراد مختلف متنوع است. یکی از عوامل ایجاد تنوع را می توان سبک هر فرد در بروز جلوه دانست. بازشناسی این جلوه ها در عمل نیازمند سامانه هایی است که مستقل از فرد آموزش دیده باشند. در این سامانه ها، تنوعات بین فردی عامل ایجاد فاصله بین توزیع نمونه های آموزش و آزمون است که نتیجه آن کاهش تعمیم دهی روش یادگیرنده است. در این مقاله در راستای کاهش فاصله بین این دو توزیع، نگاشت و بردار انتقال سبک برای بهبود تشخیص درد و شدت آن به کار گرفته شده اند. نتایج بر روی دادگان UNBC-McMaster که از نوع خودانگیخته است بررسی شده است. نتایج نشان داد که روش های انتقال سبک پیشنهادی قادر اند در شرایطی که داده تطبیق مناسب یا محدود از فرد جدید در دسترس باشد، کارآیی بازشناسی را افزایش دهند.
    کلیدواژگان: تشخیص جلوه های درد در چهره، انتقال سبک، تشخیص شدت درد، تعمیم دهی
  • سمانه بهرامی*، محمد صنیعی آباده صفحات 57-74
    حاشیه نویسی خودکار تصاویر به ایجاد خودکار برچسب های متنی مطابق با محتوای بصری تصاویر دلالت دارد. اگرچه در دهه گذشته تحقیقات فراوانی در این زمینه انجام گرفته است اما وجود برچسب های متعدد و وجود شکاف معنایی میان این برچسب ها و ویژگی های سطح پایین بصری باعث کاهش دقت و کارایی این سامانه ها شده است. در این پژوهش یک روش حاشیه نویسی با استفاده از خوشه بندی دو سطحی بر مبنای ویژگی های کاهش یافته با الگوریتم وراثتی و نیز معانی پیشنهاد شده است. خوشه بندی باعث می شود تصاویر مشابه به هم از لحاظ بصری و نیز تصاویر مرتبط به هم از جهت معنایی در کنار هم قرار گرفته و حاشیه نویسی شوند. این کار علاوه بر تسریعحاشیه نویسی، کارایی قابل قبولی برای یک سامانه حاشیه نویسی نیز داشته است. برای ارزیابی روش، دو دادگان شناخته شده Corel5k و IAPR TC-12 انتخاب شده اند. نتایج به دست آمده روی این دو دادگان عملکرد قابل قبول روش پیشنهادی را در مقایسه با دیگر روش ها نشان می دهد.
    کلیدواژگان: حاشیه نویسی خودکار تصاویر، خوشه بندی دو سطحی، الگوریتم وراثتی
|
  • Maryam Afzali *, Emad Fatemizadeh, Hamid Soltanian, Zadeh Pages 1-9
    Diffusion Tensor Imaging (DTI) is a common method for the investigation of brain white matter. In this method, it is assumed that diffusion of water molecules is Gaussian and so, it fails in fiber crossings where this assumption does not hold. High Angular Resolution Diffusion Imaging (HARDI) allows more accurate investigation of microstructures of the brain white matter; it can present fiber crossing in each voxel. HARDI contains complex orientation information of the fibers. Therefore, registration of these images is more complicated than the scalar images. In this paper, we propose a HARDI registration algorithm based on the feature vectors that are extracted from the Orientation Distribution Functions (ODFs) in each voxel. Hammer similarity measure is used to match the feature vectors and thin-plate spline (TPS) based registration is used for spatial registration of the skeleton and its neighbors. A re-orientation strategy is utilized to re-orient the ODFs after spatial registration. Finally, we evaluate our method based on the differences in principal diffusion direction and we will show that utilizing the skeleton as landmark in the registration results in accurate alignment of HARDI data.
    Keywords: High angular resolution diffusion imaging (HARDI), Q, ball imaging, Orientation distribution function (ODF), Registration, Principal diffusion direction (PDD)
  • Mohammad Ali Zare Chahooki* Pages 11-22
    Content based image retrieval (CBIR) means image retrieval by low level features such as color, texture and shape. In this way, semantic gap is defined as the difference of image interpretation between human and computer algorithm. In this domain, incorrect mapping of low-level features to high-level semantics leads to widening in semantic gap. In image retrieval it is possible to texture, color, and shape of image are changed but the concept is not transitioned in human mind. However, in most cases, feature vector of image is moved in feature space and therefore image is not correctly retrieved. The purpose of this paper is reducing the dimensions of feature vectors by a non-linear approach, learning the manifold space and developing a new feature vector to coincide distances in semantic and feature space domains.So, the continuity between the instances of a semantic at the semantic space is kept in feature space. The main innovation of this paper is extraction of one feature space from multiple ones. In the proposed manner, adverse effect of noise in manifold learning is decreased. Experiments are done on MPEG-7 Part B and Fish datasets and results show effectiveness of proposed methd.
    Keywords: Content based image retrieval (CBIR), Non, linear feature extraction, Feature reduction, Manifold learning
  • Effat Yahaghi *, Amir Movafeghi, Noureddin Mohammadzadeh Pages 23-31
    Industrial radiography (RT) is one of the most important non-destructive testing (NDT) methods for the welding defects (e.g. cracks) identification. In the radiography film interpretation, the precise detection of the cracks depends on the interpreter person’ capabilities and skills as well as the image quality of the films.Industrial radiography films often suffer from the low image quality. Therefore, there is a need for accuracy increasing of the defect detection in these type of the radiography images. Cracks have the specific frequency domain feature due to the shape, i.e. very narrow width in comparison with its length. Different frequency and time based image processing techniques can be implemented for the analyzing of the cracks defects. In this research, a wavelet based method and an empirical mode decomposition (EMD) method were used and compared for the detection and analyzing of the welding crack zone. In both methods final image was created as a combination of the original image decomposition components. Then the crack defects have been surveyed in the processed images. The EMD method showed the better results in the crack detection in the comparison of the proposed wavelet method. Although the contrast of the processed images were decreased with EMD method, but also the location and the shape of the cracks clearly appeared.
    Keywords: Crack defect, Industrial radiography, Image processing, Empirical mode decomposition, Wavelet Transform
  • Mahdi Khoshbaten *, Seyed Mohammad Razavi, Naser Mehrshad Pages 33-43
    In this study, a new method is presented for offline signature recognition. To compare the features, a new similarity measure is introduced based on the number of matched features. In addition, in the post-processing step, an innovative, efficient and effective coordinate matching filter is used that has low computational cost and is consistent with the feature extraction algorithm. This filter applies a threshold on Cartesian coordinate difference between the two blocks on the corresponding images. The implementation of the proposed system includes optimized features that are invariant to scaling and rotation changes. Using the new similarity criteria for matching these features, and post-processing routine using the proposed coordinates filter, applied on the GPDS960 (Offline) and SVC2004 (online converted to online) database, improved efficiency of the proposed identification system. Also proposed system parameters are selected and personalized automatically only once by using a genetic algorithm for each database.
    Keywords: Offline signature recognition, genetic algorithms, Optimized local features, Coordinate matching filter, Similarity criteria, Biometrics
  • Mohammad Aminian *, Hassan Aghaeinia, Farzad Towhidkhah Pages 45-56
    Automatic, continuous, non-invasive detection of pain and it’s intensity in clinical settings is needed to assess and manage pain. Therefore, a solution is proposed which deals with the coding of the facial action units associated with pain action based approach to describe the face. Expressions of painvaried in different faces. One of the factors that can create a variety of expression is style of the individual. These expression recognition requires a system that is person independent. In this system, interpersonal variations increase distance between training and test sample distribution, resulting in the loss of generalization of learning. In this paper, in order to reduce the distance between the two distributions, style transfer vector and mapping are proposed to improve pain and its intensity.Results of methods are investigated on the spontaneous UNBC-McMaster database. The results show that style transfer methodsimprove the recognition performance with a sufficient and small amount of adaptation data.
    Keywords: Expressions of pain, Style transfer, Improvement
  • Samaneh Bahrami *, Mohammad Saniee, Abadeh Pages 57-74
    Automatic image annotation refers to automatically assignment of textual labels according to visual content of images. Althoughin the last decade great deal of research has been done in this area, Butbecause of numerous labels and semantic gap between the labels and the low-levelvisualfeatures, the accuracy and efficiency of these systems is reduced. In this study, an annotation method is proposed using two-level clustering based on featureswhich are reduced with genetic algorithm and as well as semantics. Clustering makes visual similar images and also semantic related images be placed next toeach otherandbe annotated. This leads to fast annotation and also has an acceptable performance for an annotation system. To evaluate the proposed method, two well-known datasets, Corel5k and IAPR TC-12 are selected. The results show acceptable performance of the proposed method in comparison with other methods.
    Keywords: Automatic image annotation, Two, level clustering, Genetic Algorithm