فهرست مطالب

ماشین بینایی و پردازش تصویر - سال نهم شماره 4 (زمستان 1401)

نشریه ماشین بینایی و پردازش تصویر
سال نهم شماره 4 (زمستان 1401)

  • تاریخ انتشار: 1401/04/12
  • تعداد عناوین: 6
|
  • بهرام رشیدی* صفحات 1-14
    در این مقاله ما از ویژگی سیگنال های بیومتریک اثر انگشت برای تولید کلیدهای رمزنگاری تصادفی استفاده می کنیم. مهم ترین ویژگی این روش استفاده از ویژگی های منحصر به فرد اثرانگشت در تولید کلید تصادفی می باشد. حریم خصوصی کلید بیومتریک تولید شده به صورت تصادفی و پیچیدگی الگوریتم تولید کلید، جنبه های اصلی حاکم بر امنیت کلید است. در روش پشنهادی ابتدا ویژگی های منحصر به فرد اثر انگشت که شامل نقاط مینوشیا می باشد از تصویر اثرانگشت استخراج می شوند. سپس برای افزایش ویژگی های آماری و پیچیدگی، فاصله اقلیدوسی تمام نقاط مینوشیا نسبت به یکدیگر حساب شده و در یک ماتریس ذخیره می شوند. در مرحله بعد داده های این ماتریس بعد از نرمالیزه شدن به اعداد 8-بیتی توسط عملیات جایگشت جابجا می شوند. سپس برای افزایش سطح امنیت و قابلیت تصادفی بودن از عمل غیر خطی S-box 8-بیتی استفاده شده در رمز قالبی AES استفاده شده است. بدین صورت که داده های 8-بیتی هر یک جداگانه به S-box اعمال می شوند و نتیجه ذخیره می شود. در نهایت داده های بدست آمده از بایت کم ارزش تا بایت پر ارزش در دسته های 128-بیتی یا 192-بیتی یا 256-بیتی می توانند به عنوان کلید در سیستم های رمزنگاری مورد استفاده قرار گیرند. آنالیزهای آماری که روی کلیدهای تولید شده صورت گرفته نشان دهنده ویژگی تصادفی بودن قابل قبول کلیدها می باشد. بنابراین ساختار پیشنهادی برای تولید کلید تصادفی می تواند در رمزنگاری سیگنال های دیجیتال با حجم زیادی از داده مانند تصویر و صدا استفاده شود.
    کلیدواژگان: اثر انگشت، کلید رمزنگاری تصادفی، سیستم رمزنگاری قالبی، مولد تولید کلید
  • رحمان سروش، یاسر بالغی* صفحات 15-30

    در دهه های اخیر، تکنیک های مختلفی در حوزه بینایی کامپیوتر، برای طبقه بندی و شناسایی صحنه ها در فضاهای مختلف، بر روی تصاویر طیف مریی ارایه شده است. در این مقاله، ابتدا یک پایگاه داده تصویری چند طیفی، شامل زوج تصاویر طیف مریی رنگی  و فروسرخ  ایجاد می شود. سپس با تجزیه تصاویر طیف مریی و فروسرخ، به وسیله تبدیل موجک  و استفاده از یک روش وزن دهی مبتنی بر آموزش شبکه های عصبی پیچشی ژرف، همجوشی تصاویر انجام می شود. همچنین این رویکرد، با چندین روش همجوشی دیگر و با استفاده از معیارهای ارزیابی کمی، مقایسه می شود. در نهایت، با استفاده از معماری های مبتنی بر شبکه های عصبی پیچشی ژرف  آموزش دیده ، تصاویر صحنه های مختلف، طبقه بندی می شوند. برای آموزش این شبکه ها بر روی مجموع تصاویر این پایگاه داده کوچک، از رویکرد یادگیری انتقالی، استفاده می شود تا طبقه بندی صحنه، با کمترین هزینه محاسباتی انجام گیرد. نتایج تجربی نشان می دهند که روش پیشنهادی، در طبقه بندی صحنه، که به صورت همجوشی تصاویر چهارکاناله (RGB-IR) صورت گرفته است، کارآمد بوده و ضمن داشتن معیارهای کمی همجوشی بالاتر، منجر به عملکرد بهتر، در مقایسه با سایر رویکردهای همجوشی تصاویر چندطیفی و با دقت طبقه بندی 96.67% می شود.

    کلیدواژگان: شناسایی صحنه، تصاویر چندطیفی، همجوشی، شبکه های عصبی پیچشی ژرف، یادگیری انتقالی، تبدیل موجک
  • ویدا اسماعیلی، محمود محصل فقهی* صفحات 31-41

    بیماری کروناویروس 2019 یا کووید-19، یک بیماری حاد تنفسی با قدرت انتقال ویروس بالا است که موجب نرخ بالای مرگ و میر در سراسر جهان شده است. اگرچه تشخیص سریع این بیماری می تواند نقش حیاتی در بهبود بیمار داشته باشد، اما انجام آزمایش های رادیوگرافی توسط کادر درمان فرآیند زمان بری است. بنابراین، استفاده از تصاویر اولتراسوند و روش های یادگیری عمیق توصیه می شود. تکنیک اولتراسوند بدون اشعه است و می تواند در بخش های اطفال و مراقبت های ویژه برای بیماران خاص مورد استفاده قرار گیرد. با این حال، تصاویر آن دارای نویز است که عملکرد روش های یادگیری عمیق را تحت تاثیر قرار می دهد. به همین منظور، در این مقاله، ما روش الگوی باینری محلی یکنواخت را که در مقابل نویز مقاوم است با روش یادگیری عمیق ترکیب می کنیم. ابتدا الگوی باینری محلی یکنواخت بر روی دو صفحه ی زمانی محاسبه می شود تا ویژگی های مربوط به تظاهرات کووید-19 در تصاویر متوالی اولتراسوند استخراج شود و سپس، ماتریس به دست آمده به عنوان ورودی شبکه ی کانولوشنی داده می شود. با توجه به آزمایش های انجام شده، روش پیشنهادی عملکرد بهتری در مقایسه با سایر روش های پیشرفته دارد. نتایج نشان می دهد که دقت شناسایی کووید-19 از روی داده های اولتراسوند با استفاده از روش پیشنهادی 98.5 درصد است.

    کلیدواژگان: تشخیص کووید-19، تصاویر اولتراسوند، یادگیری عمیق
  • جبرئیل رنجبر، حسین ابراهیم نژاد* صفحات 43-55
    تناظریابی اشیاء هم خانواده به طور گسترده در بسیاری از برنامه ها مانند تشخیص و ردیابی اشیاء مورد نظر استفاده می شود. در این مقاله، ما یک روش کارآمد برای جستجوی اشیاء هم خانواده ارایه می کنیم. روش پیشنهادی در واقع یک نسخه بهبود یافته از روش BBS می باشد که علاوه بر دارا بودن ویژگی های مثبت این روش از قبیل مقاوم بودن در برابر شلوغی پس زمینه، انسداد، تغییر مقیاس، تغییر زاویه و تغییر شکل، به دلیل استفاده از ویژگی های موجک هار در برابر تغییرات شدت روشنایی مقاوم عمل نموده و دقت بیشتری در عمل تطبیق بدست می دهد. ماهیت روش پیشنهادی، بر اساس تعداد جفت نقاطی که بهترین تطابق را دارند، بنا شده است و دارای ویژگی های منحصر به فردی می باشد که با تفکیک ویژگی های مستخرج از بافت تصویر باعث می شود عمل تطبیق نسبت به حالت عادی با دقت انجام گیرد و حساسیت کمتری به تغییرات شدت نور داشته باشد. ما با در نظر گرفتن اکثر موانع موجود در امر تناظریابی، روشی را ارایه داده ایم که از پس بسیاری از چالش ها بر می آید. در مرحله ارزیابی، با به چالش کشیدن عمل تناظریابی در مجموعه تصاویر استاندارداز اشیا هم خانواده شامل پایگاه داده BBS و سایر تصاویر ورزشی، حیوانات، اشیا، صحنه های فیلم و تصاویر MRI، نتایج آزمایش برتری روش پیشنهادی را در مقایسه با سایر روش های موجود نشان می دهد
    کلیدواژگان: تشخیص و شناسایی هدف مورد نظر، تناظریابی اشیای هم خانواده، تناظریابی تصاویر، بهترین تطابق، آنالیز موجک هار
  • مهسا هدایتی پور*، یاسر شکفته، محسن ابراهیمی مقدم صفحات 57-78

    لب خوانی یا فرآیند بازشناسی دیداری گفتار روش تشخیص گفتار از روی حرکات لب گوینده است. در سال های اخیر علاقه به لب خوانی خودکار رو به افزایش بوده و تحقیقات بسیاری در این زمینه انجام شده است و همچنان به عنوان یک موضوع تحقیقی پیشرو مطرح است. در این مقاله مروری بر تحقیقات انجام شده در زمینه لب خوانی خودکار ارایه شده است. فهرستی از پایگاه داده های مورد استفاده با در نظر گرفتن خصوصیاتی نظیر تعداد گوینده، محتوای گفتار و کیفیت تصاویر ارایه شده است. در این مقاله، تحقیقات متنوع لب خوانی در زمینه تشخیص اعداد، حروف، کلمات و جملات و روش های سنتی استخراج ویژگی و دسته بندی تا روش های جدید مبتنی بر یادگیری عمیق مرور شده اند. بعلاوه فعالیت های لب خوانی زبان فارسی شامل پایگاه داده های فراهم شده و تحقیقات مرتبط با جامعیت بیشتر معرفی شده است.

    کلیدواژگان: لب خوانی، بازشناسی دیداری گفتار، استخراج ویژگی، یادگیری ماشینی، یادگیری عمیق، شناسایی الگو
  • وجیهه سادات وطن پور، سید محمود سخایی*، یاسر بالغی، الهام سادات بنی مصطفوی صفحات 79-91

    سرطان پستان شایع ترین نوع سرطان در جمعیت زنان جهان است. تشخیص زودهنگام و درمان موثر با هدف کاهش مرگ و میر ناشی از این بیماری، از طریق روش های غربالگری انجام می شود. تصویربرداری فراصوت (اولتراسوند) به دلیل ماهیت غیرتهاجمی و مزایای آن نسبت به سایر روش های تشخیصی، از مهم ترین و موثرترین روش های شناسایی و تشخیص این بیماری است. به منظور بهبود عملکرد تشخیص، سیستم های تشخیص کمک رایانه ای معرفی شدند. در این پژوهش یک سیستم تمام خودکار شناسایی و تشخیص سرطان پستان ارایه شده است که متشکل از چهار مرحله اصلی است: پیش پردازش تصویر در دو گام جهت برجسته تر کردن نواحی کم پژواک (هایپواکو) و با هدف انتخاب نقطه بذر و ناحیه مطلوب و همچنین حذف نویز با استفاده از فیلتر میانگین های غیر محلی، قطعه بندی با بهره گیری از اطلاعات مکانی و فرکانسی تصویر و بهبود آن با استفاده از الگوریتم بهینه سازی ژنتیک، استخراج مجموعه ای شامل 21 ویژگی مبتنی بر شکل و مرز و در نهایت طبقه بندی با ا ستفاده از طبقه بند ماشین بردار پشتیبان به منظور تفکیک توده ها به دو گروه خوش خیم و بدخیم. نتایج ارزیابی های صورت گرفته بر روی تصاویر پایگاه های داده مختلف میزان دقت بیش از 95/5 % را نشان داد.

    کلیدواژگان: سرطان پستان، فراصوت، خوش خیم و بدخیم، ویژگی شکل و مرز، طبقه بندی
|
  • Bahram Rashidi * Pages 1-14
    In this paper, we use the feature of fingerprint biometric signals to generate random cryptographic keys. The most important feature of this method is the use of unique fingerprint features in the production of random keys. The privacy of the randomly generated biometric key and the complexity of the key generation algorithm are key aspects of key security. In the proposed method, first the unique fingerprint features, which include Minosia dots, are extracted from the fingerprint image. Then, to increase the statistical properties and complexity, the Euclidean distance of all the points of Minosia relative to each other is calculated and stored in a matrix. In the next step, the data of this matrix is ​​moved to 8-bit numbers by permutation operation after normalization. Then, to increase the level of security and the ability to be random, the non-linear operation of the 8-bit S-box used in the AES format password is used. 8-bit data is applied to the S-box separately and the result is stored. Finally, data from low-byte to high-value bytes in 128-bit or 192-bit or 256-bit categories can be used as keys in cryptographic systems. Statistical analyzes performed on the generated keys show the acceptable randomness of the keys. Therefore, the proposed structure for generating a random key can be used in encrypting digital signals with large volumes of data such as image and sound.
    Keywords: fingerprint, Random Encryption Key, Format Encryption System, Key Generator
  • Rahman Soroush, Yasser Baleghi * Pages 15-30

    In recent decades, various techniques in the field of computer vision have been proposed to classify and identify scenes in different spaces on visible spectrum images. Recently, improvements in various areas of machine vision using complementary features in visible and infrared images have been reported by researchers. This approach can also work for the subject of scene recognition. In this paper, we first create a multispectral image database, including pairs of color-visible and infrared spectrum images. Then, the images are fused by wavelet transform and using a weighting method based on training the deep convolutional neural networks. This approach is also compared with several other fusion methods using quantitative evaluation criteria. Finally, images of different scenes are classified using architectures based on deeply trained convolutional neural networks. Transfer learning approach is also used to classify the scene with the least computational cost. Experimental results show that the proposed method has been effective in scene classification, which is done by fusion of four-channel images (RGB-IR) with a classification accuracy of 96.67%. This method also shows better quantitative fusion criteria than other multispectral image fusion approaches.

    Keywords: Scene Recognition, multi-spectral images, Fusion, deep neural networks, Transfer learning, wavelet transform
  • Vida Esmaeili, Mahmood Mohassel Feghhi * Pages 31-41

    Coronavirus 2019, or Covid-19, is an acute respiratory disease with high virus transmission capacity that has led to high mortality rates worldwide. Although rapid diagnosis can play an essential role in the patient's recovery, radiography by the treatment staff is a time-consuming process.Therefore, the use of ultrasound data and deep learning techniques are recommended. The ultrasound technique is radiation-free and can be used in pediatric wards and intensive care units for specific patients. However, its data have noise that affects the performance of deep learning methods. To this end, in this paper, we combine the uniform local noise-resistant binary pattern method with the deep learning method. First, a uniform local binary pattern is calculated on two temporal planes to extract the features of the Covid-19 manifestations in consecutive ultrasound data, and then, the resulting matrix is given as the input of the convolutional network. According to the performed experiments, the proposed method has better performance compared to that of the other state-of-art methods. The results show that the diagnosis accuracy of the Covid-19 from the ultrasound data using the proposed method is 98.5%.

    Keywords: Covid-19 diagnosis, ultrasound data, convolutional neural network, Deep Learning
  • Jabrail Ranjbar, Hossein Ebrahimnezhad * Pages 43-55
    Same family object matching is widely used in many applications such as object detection and tracking. In this article, we present an efficient way to search for objects in the same family. The proposed method is in fact an improved version of the BBS method, which in addition to having the positive features of this method such as resistance to background crowds, obstruction, scaling, change of angle and deformation, due to use of the characteristics of Haar wavelet, it is resistant to changes in light intensity and gives more accuracy in matching operation. The nature of the proposed method is based on the number of pairs of points that have the best matching, and has unique features that, by separating the features extracted from the image texture, make the matching operation be more accurate and less sensitive to changes in light intensity. Given the many difficulties in finding correspondence, we have proposed a method that overcomes many challenges. In the evaluation phase, by challenging the act of matching in a set of standard images of household objects, including the BBS database and other sports images, animals, objects, film scenes, and MRI images, the test results of the proposed method outperform against other methods.
    Keywords: Target detection, recognition, matching of same family objects, images matching, best match, wavelet analysis
  • Mahsa Hedayatipour *, Yasser Shekofteh, Mohsen Ebrahimi Moghadam Pages 57-78

    Lip-reading or the process of visual recognition of speech is a way to distinguish speech from the movements of the speaker's lips. In recent years, the interest in automatic lip-reading has been increasing and a lot of researches have been done in this field and it is still a leading research topic. This paper provides an overview of researches in automatic lip-reading. A list of used databases in the researches is provided with specifications such as number of speakers, speech content and image quality. In this article, various lip-reading researches are reviewed from recognizing numbers, letters, words and sentences, and traditional methods of feature extraction and classification to the new methods based on deep learning. In addition, Persian lip-reading activities include provided databases and related researches are introduced more comprehensively.

    Keywords: Lip-Reading, Visua speech recognition, Feature Extraction, Machine Learning, Deep Learning, Pattern Recognition
  • Vajihe-Sadat Vatanpour, Sayed Mahmoud Sakhaei *, Yasser Baleghi, Elham-Sadat Banimostafavi Pages 79-91

    Breast cancer is the most common type of cancer in the female population of the world. Early diagnosis and effective treatment with the aim of reducing mortality from this disease is done through screening methods.Ultrasound imaging is one of the most important and effective methods for the detection and diagnosis of this disease due to its non-invasive nature and its advantages over other diagnostic methods.Computer aided diagnosis systems were introduced to improve diagnostic performance. In this study, a fully automated breast cancer detection and diagnosis system is presented, which consists of four main steps: Image preprocessing in two steps to highlight the low echo areas (Hypo echo) and with the aim of selecting the seed point and the region of interest. As well as noise removal using non-local means filter, segmentation using image spatial and frequency information and improving it using genetic optimization algorithm, extracting a set containing 21 features based on shape and boundary Finally, the classification using the support vector machine classifier in order to separate the masses into benign and malignant groups. The results of evaluations performed on images of different datasets showed an accuracy of more than 95.5%.

    Keywords: breast cancer, Ultrasound, benign, malignant, shape, border characteristics, Classification