فهرست مطالب

نشریه ماشین بینایی و پردازش تصویر
سال نهم شماره 2 (تابستان 1401)

  • تاریخ انتشار: 1401/03/10
  • تعداد عناوین: 6
|
  • فهیمه رمضانخانی، مهدی یزدیان دهکردی* صفحات 1-17
    سیستم تشخیص خویشاوندی با تجزیه و تحلیل تصاویر چهره دو فرد، خویشاوندی یا عدم خویشاوندی آن دو را مشخص می کند. برای تشخیص رابطه خویشاوندی ویژگی های مختلف را می توان از تصویر چهره دو فرد استخراج نمود. در این مقاله با بررسی ویژگی های بافت، رنگ و ادغام موثر این ویژگی ها و همچنین بررسی چند طبقه بندی کننده مختلف، یک سیستم کارا برای تشخیص روابط خویشاوندی نسل اول (پدر - پسر، پدر - دختر، مادر - پسر و مادر - دختر) ارایه شده است. در این راستا دو رویکرد پیشنهادی بررسی شده است: (1) ادغام ویژگی های موثر و بررسی طبقه بندی کننده مختلف برای تشخیص خویشاوندی و (2) استفاده از متریک یادگیری NRML به منظور تولید بردار ویژگی متمایز کننده جهت افزایش کارایی تشخیص خویشاوندی. روش های پیشنهادی برای دو پایگاه داده KinFaceW-I و KinFaceW-II در حالت های مختلف تحلیل و ارزیابی شده اند. نتایج ارزیابی ها نشان می دهد، ادغام ویژگی ها و استفاده از متریک NRML به خوبی توانسته است عملکرد سیستم تشخیص خویشاوندی را بهبود دهد. علاوه بر دو رویکرد پیشنهادی، استخراج ویژگی از کل تصویر و همچنین به صورت بلوکی از تصویر، بررسی شده و نتایج آن ارایه شده است. نتایج به دست آمده حاکی از آن است که استخراج ویژگی به صورت بلوکی می تواند در بهبود نتیجه نهایی تشخیص خویشاوندی موثر واقع شود.
    کلیدواژگان: تشخیص خویشاوندی، متریک یادگیری، متریک NRML، استخراج ویژگی، ادغام ویژگی، آنالیز چهره
  • مریم اسدی، عبدالله چاله چاله* صفحات 19-32

    هدف از طراحی و ساخت خودروهای بدون راننده حذف عامل انسانی به منظور کاهش تلفات، هزینه ها و  نیز افزایش ایمنی خودرو با جایگزینی تجهیزات هوشمند است. امروزه با بهره مندی از فناوری های هوش مصنوعی و یادگیری ماشین شاهد پیشرفت های چشم گیری در صنعت حمل و نقل هوشمند به ویژه خودروهای تمام خودکار هستیم که با استفاده از حسگرهای پیشرفته و تکنیک بینایی ماشین قادر به تجزیه و تحلیل اطلاعات محیط پیرامون خود هستند. از چالش های مطرح در طراحی سیستم این نوع از خودروها، شناسایی درست سایر وسایل نقلیه ی اطراف مسیر حرکت خودرو است. در این مقاله، برای شناسایی خودروهای اضطراری یک روش مبتنی بر یادگیری عمیق ارایه شده است که فرایندهای استخراج ویژگی و طبقه بندی درآن به صورت همزمان انجام می شود. شبکه عمیق مورد استفاده در این پژوهش شبکه پیچشی می باشد. در شبکه های عصبی پیچشی دستیابی به نتایج قابل قبول وعملکرد مناسب، مستلزم در اختیار داشتن حجم عظیمی از داده ها برای آموزش شبکه می باشد. با توجه به محدود بودن تعداد تصاویر موجود در مجموعه داده مورد استفاده در این پژوهش و به منظور افزایش دقت شناسایی، از فرایند یادگیری انتقالی و شبکه پیش آموزش دیده  VGG16 نیز استفاده شده است. برای این تحقیق دو مجموع داده جدید ایجاد و در کنار دو مجموعه داده دیگر مورد آزمایش قرار گرفت. روش پیشنهادی با  چهار روش دیگر نیز مورد مقایسه قرار گرفت و نتایج به دست آمده نمایانگر کارایی بسیار خوب روش پیشنهادی است.

    کلیدواژگان: خودروهای بدون راننده، خودروهای اضطراری، یادگیری عمیق، پردازش تصویر
  • اسمعیل خالقی، هادی سلطان زاده*، معصومه قلی زاده صفحات 33-45
    اختلال در راه رفتن یک مشکل شایع در جامعه است که می تواند به عنوان یک آسیب، زندگی فرد را محدود کند. تشخیص صحیح و سریع این اختلال می تواند به روند بهبود و درمان کمک کند، ازاین رو همواره پژوهش هایی انجام شده است که بر مبنای آن پزشک بتواند یک برنامه درمانی مناسب برای بیمار در نظر بگیرد. در این پژوهش از یک حسگر کینکت که قابلیت شناسایی 25 نقطه از نقاط آناتومیکی بدن فرد را دارد به منظور دریافت و ثبت داده استفاده شده است، بر مبنای اطلاعات سه بعدی به دست آمده از 25 نقطه، تعداد 8 ویژگی استخراج شد که نتایج نشان داده است تعداد 7 ویژگی استخراج شده، تفکیک پذیری بهتری داشتند. راهکار موردنظر بر مبنای سیستم فازی تعریف شده که یک گروه پزشکی به عنوان خبره در این سیستم همکاری می نمایند. تعداد شرکت کنندگان 90 نفر می باشد که در گام اول از مجموع داده های 50 نفر بیمار حرکتی و 40 نفر افراد سالم، از داده ی 45 نفر برای استخراج  قواعد فازی بر مبنای نظرات خبرگان استفاده شد همچنین برای اینکه در ساخت مدل بایاس کمتری اتفاق بیوفتد از روش k-fold در دسته بندی داده ها استفاده شده است.در گام دوم از داده ی 45 نفر دیگر برای ارزیابی سیستم پیشنهادی استفاده گردید. خروجی های حاصل از صحت سنجی سیستم فازی نشان می دهد که بر مبنای 7 ویژگی تعریف شده و قواعد ساخته در سیستم فازی، دقت، گزارش شده 95 درصد است.
    کلیدواژگان: شناسایی، اختلال در راه رفتن، حسگر کینکت، سیستم فازی
  • جواد آسلیمی ضامنجانی، محمدحسین شکور*، محسن رحمانی صفحات 47-66

    الگوی دودویی محلی یک توصیفگر پرکاربرد در استخراج ویژگی از تصاویر بافتی است. شبکه های عصبی عمیق کانولوشن نیز از بهترین ابزار طبقه بندی با دقت بسیار بالابه شمار می رود. نوآوری اول این پژوهش ارایه یک ساختار برای ترکیب ویژگی های الگوی دودویی محلی و شبکه عصبی عمیق کانولوشن برای طبقه بندی تصاویر بافتی نویزدار است که دقت بسیار بالایی را برای طبقه بندی تصاویر بافتی نویزدار فراهم می کند. این روش از دو ابزار استخراج ویژگی تشکیل شده است. در یک ابزار، با استفاده از الگوی دودویی محلی کامل ویژگی های محلی تصاویر بافتی، در قالب هیستوگرام سه بعدی استخراج می شود. در ابزار دوم ویژگی های بافتی با استفاده از شبکه عصبی عمیق کانولوشن DenseNet-121 کاهش داده می شود. این بخش که در فرآیند ترکیب ویژگی ها بکارگرفته شده است، با استفاده از شبکه عصبی کانولوشن کم عمق، ابعاد هیستوگرام سه بعدی را ، برای ترکیب با ویژگی های عمیق، به صورت قابل توجهی کاهش می دهد. دقت مدل پیشنهادی، روی مجموعه های داده نویزی Outex، CUReT و UIUC با نویز گوسی، نویز نقطه ای و نویز   فلفل نمکی با شدت های مختلف، ارزیابی شده است و دقت طبقه بندی روش پیشنهادی برای مقادیر مختلف نویز، بهبودی بین 3 تا 15 درصد داشته است.

    کلیدواژگان: طبقه بندی تصاویر بافتی، تصاویر بافتی نویزدار، شبکه عصبی عمیق، الگوی دودویی محلی
  • سبحان افروز، فرحناز مهنا* صفحات 67-79
    یکی از مسایل مطرح در علم پزشکی که توجه بسیاری از محققان را به خود جلب کرده، جداسازی کبد از تصاویر توموگرافی کامپیوتری است. زیرا اولین مرحله در فرآیند تشخیص بیماری ها و تومورهای کبدی، داشتن تصویری مناسب از کبد بخش بندی شده در این تصاویر می باشد. هدف از این مقاله ارایه الگوریتمی خودکار برای بخش بندی کبد در تصاویر سی تی است. تحقیقات گذشته نشان داده است استفاده از ویژگی بافت نتایج مطلوب تری را در این بخش بندی حاصل می کند. الگوریتم پیشنهادی این مقاله مبتنی بر تحلیل بافت بااستفاده از لبه یاب Kirsch، انتقال میانگین، و خوشه بندی K-means به بخش بندی کبد می پردازد. نتایج پیاده سازی الگوریتم  پیشنهادی بر روی 400 تصویر سی تی بیمارستان میلاد تهران حاوی کبد و ارگان های جانبی، میانگین معیار Dice را 96 ٪  نشان داده است. همچنین در بررسی عملکرد الگوریتم پیشنهادی بر روی پایگاه داده ی Sliver07، میانگین معیار Dice برابر با 86/96 ٪ به دست آمده است. لذا الگوریتم پیشنهادی می تواند به عنوان اولین مرحله در فرآیند تشخیص تومورها و بیماری های کبدی مورداستفاده قرار گیرد.
    کلیدواژگان: بخش بندی خودکار کبد، تصویربرداری سی تی، لبه یاب Kirsch، انتقال میانگین، خوشه بندی K-Means
  • داور گیوکی*، عذرا دالوند، همایون رستگار صفحات 81-95
    شناسایی پلاک خودرو یک جزء اساسی از سیستم های مختلف حمل و نقل هوشمند است که همیشه انتظار می رود دقیق و کارآمد انجام گیرد. رشد بی رویه تعداد خودرو ها، منجر به بروز مشکلات زیادی برای تشخیص خودرو در زمینه های مختلف از جمله کنترل ترافیک،  مدیریت پارکینگ، عوارضی بزرگراه ها و غیره شده است. با استفاده از یک سیستم خودکار جهت تشخیص شماره پلاک خودرو، می توان تا حدود زیادی بر این مشکلات فایق آمد. یکی از بهترین روش های ارایه شده که تا به امروز کارایی بسیار بالایی در تشخیص پلاک دارد، استفاده از شبکه های عصبی پیچشی (CNN) است. در این پژوهش سعی بر این است که کارایی این شبکه ها برای تشخیص پلاک خودروهای ایرانی روی دادگانی جمع آوری شده در این مقاله، مورد ارزیابی قرار گیرد طوری که در نهایت بتوان روشی خودکار برای تشخیص و بازشناسی پلاک خودروهای فارسی ارایه شود. در روش پیشنهادی ابتدا پلاک خودرو مکان یابی می شود،  سپس حروف و اعداد آن جداسازی و استخراج می شوند و در نهایت با استفاده از شبکه پیچشی الکس نت نویسه ها دسته بندی می شوند. از نوآوری های پژوهش می توان به جمع آوری دادگانی با 5000 تصویر از خودروهای ایرانی، استفاده از انتقال یادگیری (Transfer Learning) برای تشخیص پلاک خودروهای ایرانی و بازشناسی توامان حروف و ارقام فارسی اشاره کرد. کارایی روش پیشنهادی روی دادگان جمع آوری شده با دقت 70 درصد داده های آموزش و 30 درصد داده های آزمون به دقت 98/2 درصد رسیده است.
    کلیدواژگان: تشخیص پلاک خودرو، شبکه پیچشی الکس نت، انتقال یادگیری، یادگیری عمیق
|
  • Fahimeh Ramazankhani, Mahdi Yazdian-Dehkordi * Pages 1-17
    The kinship Verification system analyzes the facial features of two people to determine whether they are related or not. To identify the kinship, different features can be extracted from the faces. In this paper, to evaluate a kinship verification system for the first-generation kinship (father-son, father-daughter, mother-son, and mother-daughter), texture and color features are tested, and feature fusion, as well as examining several different classifiers is considered. In this regard, two proposed approaches have been proposed: (1) fusing effective features and evaluate different classifiers for kinship verification and (2) using NRML metric learning to generate a distinctive feature vector to increase kinship verification efficiency. The proposed methods for the two databases KinFaceW-I and KinFaceW-II have been analyzed and evaluated in different cases. The results of the evaluations show that the fusion of features and the use of NRML metric learning have been able to improve the performance of the kinship verification system. In addition to the two proposed approaches, feature extraction from the whole image as well as image blocks is proposed and the results are presented. The results indicate that using the block-wise method for feature extraction can be effective in improving the final kinship verification results.
    Keywords: Kinship Verification, metric learning, NRML metric learning, Feature Extraction, Feature fusion, facial analysis
  • Maryam Asadi, Abdolah Chalechale * Pages 19-32

    The purpose of design and building autonomous cars is to eliminate the human factor in order to reduce losses and costs and also increase safety by replacing smart equipment. Todays, using artificial intelligence and machine learning, we are witnessing significant advances in the intelligent transportations, especially fully automated vehicles, which are able to analyze environmental information using advanced sensors and machine vision techniques. One of the challenges in designing such systems is a correct identification of other vehicles around the route of the vehicle. In this paper, a deep learning-based method for identifying emergency vehicles is presented in which feature extraction and classification processes are performed simultaneously. The deep network used in this research is a convolutional network. In Convolutional Neural Networks (CNN), achieving acceptable results and proper performance requires having a huge amount of data for network training. Due to the limited number of images in the data set used in this study and in order to increase the identification accuracy, transfer learning process and VGG16 pre-trained network have been used. Two new datasets were created for this study and furthermore two other known datasets were also examined. The proposed method was compared with four other known methods from the literature, where the final results showed supremacy of the proposed approach.

    Keywords: Driver-less cars, Emergency cars, Deep Learning, image processing
  • Esmaeil Khaleghi, Hadi Solatanzadeh *, Masoume Gholizadeh Pages 33-45
    Gait disorder is an issue in human society that can limit a person's life activity as an injury. Correct and rapid diagnosis of this disorder can help the healing process. Therefore, research has always been done to identify this disorder, based on which the physician can consider an appropriate treatment plan for the patient.Many recent studies have used different wearable and non-wearable sensors for identification. In the present study, Kinect sensor, which can identify 25 points of anatomical points of a person's body, was used to receive and record data, the identification method is defined based on the Fuzzy System defined by a medical team consisting of specialists and knee surgeons as experts in this system. The number of participants is 90, which is given from the data of 45 people in the training step and construction of the fuzzy system based on the opinions of experts, and in the second step from the data of another 45 people to evaluate the system as input. The outputs of the fuzzy system validation show that based on 7 defined features and rules made in the fuzzy system, the accuracy, precision, and recall are reported are 95%, 92.14%, and 89.26%, respectively.
    Keywords: recognition, gait disorder, Kinect Sensor, Fuzzy Systems
  • Javad Asalimi Zamenjani, MohammadHossein Shakoor *, Mohsen Rahmani Pages 47-66

    Local binary pattern is one of the most popular descriptor that widely used in feature extraction of texture images. Deep convolutional neural network is also one of the best classification methodthat provides very high accuracy. In this research, by combining the features that produced by these two methods, a structure for noisy texture classification is proposed, which provides a very high classification rate. This method is based on two extracted features. The first part uses completed local binary pattern features and in the second part the features of texture images are extracted by using the DenseNet-121 convolution deep neural network. Another motivation of this research related to feature reduction, which significantly reduces the dimensions of extracted features. It employs a shallow convolution neural network to convert the extracted features into lower number of new features. The accuracy of the proposed method has been evaluated on noisy Outex, CUReT and UIUC datasets. The classification accuracy of the proposed method for different level of noise has increased significantly compared to many advanced methods and has improved between 3 and 25%.

    Keywords: Classification of texture images, Noisy texture images, Deep Neural Network, Local binary pattern
  • Sobhan Afrooz, Farahnaz Mohanna * Pages 67-79
    One of the issues in medical science, which has attracted the attention of many researchers, isliver segmentation from computer tomography images. Because the first step in the process of diagnosis of liver illnesses and its tumors is, having an appropriate image of the segmented liver in these images. The purpose of this paper is to provide an automated algorithm for liver segmentation in the CT images. Previous research has shown that the use of texture feature results in more favorable results in liver segmentation. The proposed algorithm of this paper is based on texture analysis to liver segmentation using the Kirsch edge detector, Mean shift, and k-means clustering. Results of the implementation of the proposed algorithm on 400 images of Milad hospital in Tehran containing liver and its lateral organs, showed the average of Dice criterion of 96%. Also, in the performance of the proposed algorithm on the sliver07 database, the average of Dice criterion is equal to 96.86%. Therefore, the proposed algorithm can be used as the first step in the process of diagnosis of liverillnesses and its tumors.
    Keywords: Automatic liver segmentation, CT Imaging, Kirsch edge detector, Mean shift, K-means Clustering
  • Davar Giveki *, Ozra Dalvand, Homayon Rastegar Pages 81-95
    License Plate Detection is an essential part of smart transportation systems which is always ‎expected to be accurate and efficient. The exponential growth of the number of vehicles has led ‎to many problems for vehicle detection in different fields such as traffic control, parking lot, toll ‎highways and so. Using an automatic system for plate number detection of the vehicle, a large ‎number of problems can be solved. One of the best methods for overcoming this problem is using ‎a convolutional neural network approach. They have shown impressive performance in various ‎computer vision tasks. In this work, we tried to introduce a new dataset of Iranian cars' plates. ‎Then using transfer learning and Alexnet, we have proposed a new approach for detection and ‎classifying the plate numbers. We conducted comprehensive experiments on the new dataset. The ‎experimental results show that the proposed method has achieved to 97.35% accuracy.‎
    Keywords: License plate recognition, Alexant Convolutional network, Transfer learning, Deep Learning