فهرست مطالب

نشریه ماشین بینایی و پردازش تصویر
سال هشتم شماره 4 (زمستان 1400)

  • تاریخ انتشار: 1400/11/19
  • تعداد عناوین: 7
|
  • محمدرضا رضاییان* صفحات 1-11

    تصویربرداری از پدیده تبادل شیمیایی به روش تشدید مغناطیسی  با استفاده از فرآیند انتقال اشباع، امکان تشخیص غیر تهاجمی برخی از بیماریها از طریق دانش پردازش تصویر را میسر کرده است. عموما از رشته پالس تصویربرداری شامل یک پالس اشباع کننده الکترومغناطیسی مستطیلی با دو پارامتر قابل تنظیم دامنه و عرض استفاده می شود. انتقال اشباع به پارامترهایی از جمله زمان های استراحت، نرخ تبادل شیمیایی، غلظت عامل کنتراست و ویژگی های پالس اشباع کننده بستگی دارد. در این میان نرخ تبادل و غلظت عامل کنتراست به دلیل وابستگی به برخی از شاخص های بالینی از جمله pH، دما و مصرف گلوکز تاثیر گذارترند، لذا مطالعاتی برای اندازه گیری آنها انجام شده است.این دو پارامتر از طریق یک تابع هدف معتبر تحت عنوان انتقال مغناطیس شوندگی غیر متقارن، منطبق با عامل های پارامگنتیک در یک روش تحلیلی با استفاده از داده های پارامتری برگرفته از بافت بدن و داده های حاصل از آزمایشات تجربی، کمی سازی می شوند. دقت تابع هدف با اندازه گیری خطای نسبی حاصل از مجذوراختلاف مربعات داده های برگرفته از تابع هدف و داده های واقعی نویززدا شده (حدود 2 درصد) ارزیابی می شود. با استفاده از عرض پالس بهینه در قالب یک رابطه بسته و بیشینه تابع هدف، نرخ تبادل و غلظت عامل کنتراست به صورت همزمان تعیین می شوند.

    کلیدواژگان: انتقال اشباع، بهینه سازی، عامل کنتراست پارامگنتیک، پردازش طیف اسپکتروسکوپی Z، نرخ تبادل شیمیایی
  • مریم فتحی احمدسرائی، اعظم باستان فرد*، امینه امینی صفحات 13-36

    جهت تشخیص بیماری های شناختی و شخصیتی افراد از دست خط، نحوه ترسیم نقاشی و یا الگوها می توان استفاده کرد. خودکارسازی آزمون های روانشناسی سبب تشخیص زود هنگام بیماری شده و از تشدید بیماری و عواقب جبران ناپذیری جلوگیری می کند. خودکارسازی آزمون های ترسیمی روانشناسی نیازمند بررسی مجموعه داده های آزمون های ترسیمی روانشناسی، بررسی الگوریتم های طبقه بندی تصاویر به عنوان مهم ترین مرحله و در آخر بررسی نحوه امتیازدهی به آزمون ها مطابق با استانداردهای تعیین شده، می باشد. در این پژوهش به بررسی کامل مطالعات انجام شده اخیر در زمینه مجموعه داده های آزمون های ترسیمی و دست نویس، انواع روش های طبقه بندی آزمون های ترسیمی، روش های امتیازدهی به آزمون ها و چالش های پیش رو پرداخته شده است. تا کنون چنین پژوهش جامعی بر روی مجموعه داده ها، الگوریتم های طبقه بندی و تشخیص خودکار در آزمون های ترسیمی روانشناسی انجام نشده است. همچنین مقایسه جامعی از نحوه جمع آوری مجموعه داده ها، رویکردهای طبقه بندی آزمون های ترسیمی، روش های مقایسه آزمون ها با استانداردها، مزایا و معایب هر روش ارایه شده است. چالش های پیش رو در مراحل تشخیص خودکار در آزمون های ترسیمی روانشناسی نیز بحث شده است. هدف این پژوهش شناسایی روش های سریع، دقیق، بار پردازشی کم و قابلیت اطمینان بالا است. در این پژوهش با مقایسه روش های ارایه شده این نتیجه برداشت می شود که در طبقه بندی تصاویر و تشخیص بیماری روانی، الگوریتم های شبکه های عصبی دقت بالاتری نسبت به الگوریتم های یادگیری ماشین دارد اما کندتر عمل می کند.

    کلیدواژگان: مجموعه داده، طبقه بندی داده ها، تشخیص خودکار اختلالات روانی، پردازش تصویر در آزمون های ترسیمی
  • مهرداد نباهت، فرزین مدرس خیابانی*، نیما جعفری نویمی پور صفحات 37-50
    در اغلب تحلیل های  پردازش تصویر کاهش قابل توجه نویزتصویر، بسیار مهم است. نویزهای مختلفی می تواند باعث خرابی تصویر شود که از معروفترین آن ها نویز گاوسی می باشد. روش های مختلفی برای کاهش نویز تصویر وجود دارد از جمله روش های مبتنی بر تبدیلات، روش های مبتنی بر فیلتر و روش های غیر محلی. در اغلب روش های ارایه شده فقط یک معیار (از جمله نسبت سیگنال به نویز) برای کاهش نویز تصویر در نظر گرفته می شود و حتی برخی از روش ها کیفیت تصویر و جزییات ساختاری تصویراز جمله خطوط و لبه های تصویر را حفظ نمی کنند. بنابراین در این مقاله با استفاده از روش تاپسیس به رتبه بندی فیلترهای مختلف رفع نویز گاوسی با توجه به معیارهای متفاوت که در ارزیابی کیفیت تصویر اثر گذارند، می پردازیم. در واقع می خواهیم بدانیم با توجه به درجه ی انحراف معیار نویز گاوسی از چه فیلتر رفع نویزی استفاده شود که هم زمان دارای هر یک از معیارهای مد نظر باشد.نتایج محاسباتی روش پیشنهادی روی تصاویر با درجه انحراف های مختلفی از نویز گاوسی بررسی شده و در نتیجه فیلتر متناسب با آن درجه از نویز گاوسی برای کاربرد مشخص می شود.
    کلیدواژگان: کاهش نویز تصویر، نویز گاوسی، روش تاپسیس، پردازش تصویر
  • شیما کاشف*، حسین نظام آبادی پور، الهام شعبانی نیا صفحات 51-85

    در سال های اخیر موفقیت شبکه های عصبی کانولوشنی ژرف در تشخیص و بازشناسی اشیا سبب جلب توجه بسیاری از حوزه های مختلف یادگیری ماشین، از جمله حوزه بازشناسی نوری نویسه ها، به این مقوله شده است. یکی از چالش های مهم این حوزه، استخراج ویژگی های متمایزکننده و حاوی اطلاعات است. غالب روش هایی که در سال های گذشته در بازشناسی نوری حروف مطرح شدند، مبتنی بر ویژگی های دستی هستند که توانایی تعمیم پذیری محدودی دارند. امروزه به کمک شبکه های کانولوشنی می توان استخراج ویژگی را به صورت خودکار و با کارایی فوق العاده ای به ماشین سپرد و بازشناسی حروف جدا، ارقام و لیگاتورها را بادقت بالایی انجام داد.  همچنین، ساختارهایی بر مبنای ترکیب شبکه های کانولوشنی و بازگشتی  پیشنهاد شده اند، که می توانند بدون نیاز به جداسازی حروف، بازشناسی را انجام دهند. این رویکرد در سال های اخیر مورد توجه زیاد محققان بینایی ماشین قرار گرفته است؛ چرا که به کمک این شبکه ها می توان به شکل مستقل از زبان، بازشناسی را تنها با توجه به مجموعه آموزشی انجام داد. هدف از این مقاله، مروری بر کارهای انجام شده با  این رویکرد نوین در حوزه بازشناسی نوری نویسه ها است. در ادامه، پس از بیان مسئله و مروری مختصر بر روش های قبل، روش های مبتنی بر الگوریتم های ژرف و ویژگی های آن ها با تفصیل بیشتری ارزیابی می شوند. از آنجا که تاکید این مقاله روی تحقیقات بازشناسی نوری حروف در رسم الخط های پیوسته، نظیر فارسی، عربی و اردو است، کارهای انجام شده در این حوزه ها نیز در بخشی جداگانه مرور می شوند. همچنین، ضمن معرفی مجموعه های داده معروف برای کاربردهای مختلف و مروری بر معیارهای ارزیابی روش های بازشناسی نوری حروف، مهم ترین نرم افزارهای اختصاصی و بسته های نرم افزاری متن بازی که برای بازشناسی حروف استفاده می شوند، معرفی خواهند شد.

    کلیدواژگان: بازشناسی نوری نویسه ها، الگوریتم های یادگیری ژرف، پایگاه های داده، رسم الخط فارسی، عربی و اردو
  • امین محمدیان*، حسن آقائی نیا، فرزاد توحیدخواه صفحات 87-98
    ظاهر بروز واحدهای کنشی و  درد  در چهره ممکن است به طور قابل توجهی برای افراد مختلف متفاوت باشد. بنابراین توزیع احتمال داده های آموزشی و داده فرد جدید در حالتیکه لازم است مدل یادگیرنده مستقل از داده شخص جدید آموزش دیده باشد، متفاوت است. در این کار با فرض اینکه سبک افراد در بروز حالات علت تنوعات بین فردی است، روش‏هایی برای افزایش توانایی تعمیم مدل بازشناسی جلوه‏ های کنشی چهره ارایه شده است. این روش‏ ها بر اساس  مفهوم انتقال سبک یا تعدیل اثر سبک عمل می‏ کنند. تفاوت روش پیشنهادی این است که در مقایسه با روش‏هایی که از نگاشت برای انتقال سبک استفاده می کنند، الگوریتم‏ هایی را پیشنهاد داده است که در حین سادگی کارآیی مناسب داشته باشند. آزمایش هایی بر روی پایگاه داده UNBC-McMaster انجام شده تا نتایج روش‏های پیشنهادی با کارهای قبل مقایسه شوند. نتایج نشان می دهد که این رویکرد می تواند در حین داشتن سرعت مناسب، به طور موثر نرخ شناسایی درد و واحدهای کنشی را در چهره بهبود دهد. بطوریکه بهترین متوسط نرخ بازشناسی واحدهای کنشی 96.84 (با معیار AUC) بوده و همان روش در شرایط داده تطبیق کم و داده تطبیق مناسب به ترتیب دارای نرخ بازشناسی درد  87.30 و  93.26 (با معیار AUC) بوده است.
    کلیدواژگان: بینایی ماشین، بازشناسی ژست و رفتار چهره، رفتار خودانگیخته چهره، تابع انتقال سبک
  • عطیه السادات میرمعینی، حسن ختن لو*، وحید پورامین، الهام علیقارداش صفحات 99-110
    در سال های اخیر علاقه مندی به حسگرهای کینکت به دلیل قیمت پایین و کاربردهای گسترده در حال افزایش است. این ابزار می تواند با بهره گیری از دادگان اسکلتی و بدون استفاده از نشانگرها، وضعیت استقرار بدن انسان را برآورد کند. مسدود شدن بدن انسان با دیگر اشیا و حرکت سریع مقابل کینکت از معضلات اساسی برآورد موقعیت مفاصل است. در این پژوهش دو گام برای حل چالش موجود در نظر گرفته شده است. نخست، راهکاری بر مبنای مدل های اندازه گیری جهت تعیین درجه ی اعتبار مفاصل استخراج شده از حسگر کینکت ارایه شده که به عنوان ویژگی اثرگذار به همراه موقعیت مفاصل در کلاس بند بیشینه-حاشیه در نظر گرفته شده است. در گام دوم براساس میزان اعتبار هریک از مفاصل، تصمیم گیری شده و مفاصل از دست رفته تشخیص داده می شوند. سپس با استفاده از الگوریتم های بخش بندی بدن انسان مبتنی بر شبکه یادگیری عمیق، اعتبار بخشی مفاصل صورت می گیرد. نتایج نشان می دهد انتخاب ویژگی های مناسب در گام اول جهت مقایسه فریم های متوالی نسبت به روش های موجود، بهبود قابل توجهی در دقت کلاس بند دارد. همچنین گام دوم نیز با اعمال اعتبار بخشی به دادگان تاثیر زیادی بر افزایش دقت روش هایی دارد که از دادگان اسکلتی حسگر کینکت به عنوان ویژگی های ورودی بهره می برند
    کلیدواژگان: حسگر کینکت، موقعیت مفاصل، دادگان اسکلتی، سنجش اعتبار، مفاصل از دست رفته
  • حدیث بی آبی، سامان آبدانان مهدی زاده*، هادی اورک، محمدرضا صالحی سلمی صفحات 111-127

    آب نقش مهمی بر رشد و سلامت گیاهان دارد. تامین این ماده حیاتی نه تنها بر عملکرد محصول کشاورزی، بلکه بر کیفیت و کنترل فرآیندهای فیزیولوژیکی آن ها تاثیر می گذارد. بنابراین کمبود آب سبب اثرات منفی در رشد و نمو گیاهان می شود. در این پژوهش با هدف تشخیص نیاز آبی گیاه، مجموعه ای از تصاویر گیاه لیلیوم تحت شرایط تنش خشکی جهت استخراج ویژگی های رنگی و مورفولوژی بررسی و بر اساس این ویژگی سامانه هوشمندی به منظور تشخیص نیاز آبی گیاه طراحی و ساخته شد. پس از بررسی پارامترهای استخراج شده از تصاویر با توجه به نتایج آنالیز آماری در سطح احتمال 5% و روش انتخاب ویژگی پی درپی پیشرو مناسب ترین ویژگی ها به منظور پیش بینی محتوای رطوبت گیاه انتخاب و عمل طبقه بندی با ماشین بردار پشتیبان (SVM) با کرنل های مختلف صورت پذیرفت.در نهایت نشان داده شد که دقت طبقه بند برای سه کرنل خطی، سیگمویید و RBF به ترتیب با 6، 9 و 9 ویژگی برابر با 19.81، 04.81 و 12.83 درصد بود. بدین ترتیب نتایج نشان داد که سامانه پیشنهاد شده از توانایی مناسبی جهت تشخیص سطوح تنش و کنترل میزان آب مورد نیاز برخوردار است.

    کلیدواژگان: پردازش تصاویر دیجیتال، سامانه هوشمند آبیاری، طبقه بند بردار پشتیبان
|
  • MohamadReza Rezaeian * Pages 1-11

    Imaging of the chemical exchange phenomenon by magnetic resonance method using saturation transfer process has made it possible to non-invasively diagnose some diseases through image processing knowledge. Imaging pulses consisting of a rectangular electromagnetic saturating pulse with two adjustable parameters of amplitude and width are commonly used. Saturation transfer depends on parameters such as rest times, chemical exchange rate, contrast agent concentration, and saturation pulse properties. Among these, the exchange rate and concentration of the contrast agent are much more effective due to their dependence on some clinical indicators such as pH, temperature and glucose consumption, so studies have been performed to measure them. The title asymmetric magnetization transfer is quantified in accordance with paramagnetic factors in an analytical method using parametric data derived from body tissue and data from experimental experiments. The accuracy of the objective function is evaluated by measuring the relative error resulting from the square of the difference between the squares of the denoised data taken from the objective function and the actual data (approximately 2%). Using the optimal pulse width in the form of a closed relation and the maximum objective function, the exchange rate and the concentration of the contrast agent are determined simultaneously.

    Keywords: Saturation transfer, optimization, paramagnetic contrast agent, Z spectroscopic spectrum processing, chemical exchange rate
  • Maryam Fathi Ahmadsaraei, Azam Bastanfard *, Amineh Amini Pages 13-36

    Handwriting, drawing, or patterns can be used to detect cognitive and personality disorders. Automating psychological tests can help to detect mental disorders early and prevent it from getting worse and with irreversible consequences. Automation of psychological drawing tests requires reviewing datasets of psychological drawing tests, reviewing image classification algorithms as an essential step, and finally reviewing the scoring of tests according to the standards. In this study, the recent researches in the field of datasets of drawing and handwritten tests, various methods of classification of drawing tests, scoring techniques to the tests and challenges ahead have been thoroughly investigated. So far, no such comprehensive research has been conducted on datasets, classification algorithms, and automatic detection in psychological drawing tests. Also, a comprehensive comparison of how datasets are collected, drawing test classification methods, test comparison techniques with the standards, advantages, and disadvantages of each method is presented. Challenges in the process of automatic diagnosis in psychological drawing tests are also discussed. This study aims to identify fast, accurate methods with low processing load and high reliability. In this study, by comparing the presented methods, it is concluded that in classifying images and detecting mental disorders, neural network algorithms have higher accuracy than machine learning algorithms, but are slower.

    Keywords: Dataset. data classification, automatic detection of mental disorders, image processing in drawing tests
  • Mehrdad Nabahat, Farzin Modarres Khiyabani *, Nima Jafari Navimipour Pages 37-50
    Image noise removal is very important in most image processing analysis. Among various noises that can damage the image, Gaussian noise is one of the most notable. There are several ways to reduce image noises, including transformation-based methods, filter-based methods, and non-local methods.In most of the methods, only one criterion (i.e. signal-to-noise ratio) is used to reduce the image noise, and even some methods do not retain image quality and structural details of the image such as lines and edges.In this paper, the TOPSIS method was used to rank different filters of Gaussian noise filtering based on various criteria that influence the evaluation of image quality.In fact, regarding the standard deviation degree of the Gaussian noise, it was intended to know what kind of noise removal filter which contains the considered criteria should be used. The computational results of the proposed method were evaluated on different images with various standard deviation of Gaussian noise, and consequently, the filter has been specified corresponding to the degree of Gaussian noise for the application.
    Keywords: Image noise removal, Topsis algorithm, Gaussian noise, image processing
  • Shima Kashef *, Hossein Nezamabadi-Pour, Elham Shabaninia Pages 51-85

    In recent years, the success of deep convolutional neural networks in object recognition has attracted the attention of many different areas of machine learning, including the field of optical character recognition, to this category. One of the major challenges in this area is to extract distinctive and informative features. Most of the methods proposed in the optical recognition of letters in recent years are based on hand-crafted features that have limited generalizability. Today, with the help of convolutional networks, feature extraction can be left to the machine automatically and with high efficiency. Also, structures based on the combination of convolutional and recursive networks have been proposed, which can perform recognition without the need for letter separation. This approach has received a great deal of attention from machine vision researchers in recent years; since, with the help of these networks, recognition can be done independently of the language and only according to the training set. The purpose of this article is to review the work done with this new approach in the field of optical character recognition. To this end, after stating the problem and a brief overview of the previous methods, methods based on deep learning algorithms and their characteristics are evaluated in more detail. Since the emphasis of this article is on research on optical recognition of letters in continuous scripts, such as Persian, Arabic and Urdu, the work done in these areas is also reviewed in a separate section. Also, while introducing famous datasets for different applications and reviewing the evaluation criteria of optical character recognition methods, the most important software and open source packages that are used for optical character recognition will be introduced.

    Keywords: optical character recognition, Deep learning algorithms, Datasets, Farsi, Arabi, Urdu scripts
  • Amin Mohammadian *, Hassan Aghaeinia, Farzad Towhidkhah Pages 87-98
    The appearance of facial Action Units (AUs) and painful expression may significantly vary for different people. Thus the probability distribution of both test and training data is not the same for person-independent facial behavior recognition. Some researchers have proposed methods to bring the performance of a person-independent system closer to a person-dependent one. Subject style is the cause of inter-personal variations. With this in mind, we propose methods to increase the generalization ability of facial AUs and pain detection through style transfer functions. We conducted extensive experiments on spontaneous UNBC-McMaster database to compare supervised methods. The results show that our approach can effectively perform the task of pain and AUs detection. So that the best average recognition rate of action units was 96.84 (with AUC criterion) and the same method in terms of low adaptation data and appropriate adaptation data had pain recognition rates of 87.30 and 93.26 (with AUC criterion), respectively.
    Keywords: computer vision, Facial behavior, gesture recognition, Spontaneous facial behavior, Style transfer function
  • Atiye Mirmoini, Hassan Khotanlou *, Vahid Pouramin, Elham Alighardash Pages 99-110
    Applying Kinect sensorsare increasing in recent years due to low price and wide applications. This device can estimate the posture of the human body by utilization of skeletal data and without using any marker. Obstruction of the human body by other objects and rapid movement in front of the Kinect are the main problems in estimating the position of the joints. Two steps are considered in this study to solve the existing challenge.In the first step, a solution based on measurement models has been proposed to determine the reliability of joint position that extracted from Kinect, which is considered as an effective feature associated with the joint position in the Max-Margin classifier. Then, based on the reliability of each joint, a decision is made and the missing joints are identified. Finally, the joints are accredited using human body segmentation algorithms based on a deep learning network. The results show that selection of appropriate features in the first step to verify consecutive frames compared to existing approaches,has a significant improvement in the accuracy of the classification. The second phase also has a supreme impact on the accuracy of the methods that use the Kinect sensor skeletal data as input features by applying validation.
    Keywords: Kinect Sensor, Joint Position, Skeletal Data, Missed Joint, Max-margin Classifier
  • Hadis Biabi, Saman Abdanan Mehdizadeh *, Hadi Orak, Mohammadreza Salehi Salmi Pages 111-127

    Water plays an important role in the growth and health of plants. The supply of this vital material affects not only agricultural yields, but also the quality and control of their physiological processes. Therefore, water scarcity has a negative effect on the growth of plants. In this research, in order to detect the plant's water requirement, a series of images of lilium plant under drought stress conditions were investigated to extract the color and morphological features and based on them, an intelligent system was designed to recognize the plant's water status. After analyzing the parameters extracted from the imagesusing statistical analysis at 5% probability level and the sequential forward feature ranking method, the most suitable features were selected to predict the moisture content of the plant; Furthermore, the classification was carried out using the support vector machine (SVM) with different kernels. Finally, it was shown that the classification accuracy for the linear kernels, sigmoeid, and RBF was with 6, 9, and 9 features, respectively, were 81.19, 81.04 and 83.12%, respectively. The results showed that the proposed system had the ability to determine the levels of stress and control the amount of water needed

    Keywords: Digital Image Processing, intelligent irrigation system, Support Vector Machine