convolutional neural network (cnn)
در نشریات گروه فناوری اطلاعات-
One of the biometric detection methods is to identify people based on speech signals. The implementation of a speaker identification (SI) system can be done in many different ways, and recently, many researchers have been focusing on using deep neural networks. One of the types of deep neural networks is recurrent neural networks, where memory and recurrent parts are handled by layers such as LSTM or Gated Recurrent Unit (GRU). In this paper, we propose a new structure as a classifier in the speaker identification system, which significantly improves the recognition rate by combining a convolutional neural network with two layers of GRU (CNN+ GRU). MFCC coefficients that have been extracted as cell arrays from each period of Pt speech will be used as sequence vectors for the input of proposed classifier. The performance of the SI system has improved in comparison to basic methods according to experiments conducted on two databases, LibriSpeech and VoxCeleb1. When Pt is longer, the system performs better, so that on the LibriSpeech database with 251 speakers, recognition accuracy is equal to 92.94% for Pt=1s, and it rises to 99.92% for Pt=9s. The proposed CNN+GRU classifier has a low sensitivity to specific genders, which can be said to be almost zero.
Keywords: Speaker Identification, Gated Recurrent Unit Network (GRU), Convolutional Neural Network (CNN), MFCC -
تصاویر ابرطیفی اخذ شده توسط سامانه های سنجش از دور به دلیل وجود داده های باارزش طیفی در بازه ی وسیعی از طول موج دارای قدرت بالایی در آشکارسازی اهداف هستند. علاوه بر اطلاعات طیفی، این تصاویر دارای اطلاعات مکانی باارزشی هستند که در تشخیص دقیق هدف از پس زمینه موثر است. یکی از چالش های اصلی آشکارسازی اهداف، وجود تعداد نمونه های آموزشی محدود هدف است. جهت مقابله با این چالش، یک آشکارساز مبتنی بر شبکه عصبی کانولوشن (CNN) در این مقاله مورد ارزیابی قرار گرفته است. به جای استفاده از تک پیکسل ها، تکه های مکعبی با اطلاعات مکانی در دو بعد و اطلاعات طیفی در بعد سوم به عنوان ورودی آشکارساز استفاده می شوند. CNN با قابلیت بالا در استخراج ویژگی های سلسله مراتبی مکانی دقت خوبی را در خروجی حاصل می کند. جهت حل مشکل تعداد نمونه های آموزشی محدود از شبکه مولد رقابتی (GAN) برای تولید تکه های تصویر مکعبی جعلی مشابه با تکه های مکعبی مفروض حول پیکسل های هدف واقعی استفاده شده است. اثر داده افزایی با GAN در آشکارساز CNN با مقادیر مختلف داده افزایی در حالت بعد کامل و بعد کاهش یافته مورد ارزیابی قرار گرفته است. نتایج آزمایش ها نشان دهنده ی دقت بالاتر CNN نسبت به روش های پرکاربرد آشکارسازی و همین طور بهبود دقت آشکارساز CNN به کمک داده افزایی انجام شده توسط GAN می باشد.کلید واژگان: شبکه مولد رقابتی (GAN)، شبکه عصبی کانولوشن (CNN)، تصویر ابرطیفی، آشکارسازی اهداف، داده افزاییHyperspectral images acquired by remote sensing systems have high ability for target detection due to providing valuable spectral data in a wide range of wavelengths. In addition to spectral information, these images have valuable spatial information that is effective in accurate discrimination of target from background. One of the main challenges of target detection is the limited number of target training samples. To deal with this challenge, a detector based on Convolutional Neural Network (CNN) is introduced in this paper. Instead of using the single pixels, the cubic patches with spatial information in two dimensions and spectral information in the third dimension are used as the detector input. CNN with high capability in extracting hierarchical spatial features achieves good accuracy in the output. In order to solve the problem of the limited number of training samples, the generative adversarial network (GAN) has been used to generate fake cubic patches similar to the considered cubic patches around the real target pixels. The effect of data augmentation with GAN has been evaluated in the CNN detector with different amounts of data augmentation in both cases of full dimension and reduced dimension. The experimental results show the higher accuracy of CNN compared to the widely used detectors, as well as accuracy improvement of the CNN detector using data augmentation implemented by GAN.Keywords: Generative Adversarial Network (GAN), Convolutional Neural Network (CNN), Hyperspectral Image, Target Detection, Data Augmentation
-
A brain-computer interface (BCI) is a form of assistive technology that facilitates communication between users and machines by interpreting brain signals. The P300 wave, an event-related potential (ERP) in oddball paradigms, is generated approximately 300 milliseconds after the presentation of the target stimulus selected by the user in the brain. Accurate recognition of these waves in a P300 spelling system enables the user to write letters. Classification of P300 waves in an EEG-based spelling system faces several challenges, including accurate detection of P300 waves and handling the high dimensionality of these signals. This study presents a Convolutional Deep Learning Framework (CDLF) for character recognition using EEG signals. The proposed model uses CNN with a one-dimensional kernel to extract features over time. The proposed model was applied to two public datasets: BCI Competition III dataset II and BCI Competition II dataset IIb. The proposed model showed an average character recognition rate of 95% at epoch 15 for BCI Competition III dataset II and 100% at epoch 15 for BCI Competition II dataset IIb, without using any feature and channel selection methods before classification. The proposed model is promising for brain-computer interface classification applications in the spelling domain.
Keywords: Brain-Compute Interface (BCI), Electroencephalogram (EEG), Spelling, Classification, Convolutional Neural Network (CNN) -
در سال های اخیر، با پیشرفت الکترونیک خودرو و توسعه وسایل نقلیه مدرن با کمک سیستم های نهفته و تجهیزات قابل حمل، شبکه های درون-خودرویی مانند شبکه ناحیه کنترل کننده (CAN) با مخاطرات امنیتی جدیدی مواجه شده اند. از آنجا که گذرگاه CAN فاقد سیستم های امنیتی مانند تایید اعتبار و رمزگذاری برای مقابله با حملات سایبری می باشد، نیاز به یک سیستم تشخیص نفوذ برای شناسایی حملات به گذرگاه CAN بسیار ضرروی به نظر می رسد. در این مقاله، یک شبکه عصبی پیچیده متخاصم عمیق (DACNN) برای تشخیص انواع نفوذهای امنیتی در گذرگاه های CAN پیشنهاد شده است. به این منظور، روش DACNN که گسترش یافته روش CNN با استفاده از یادگیری خصمانه است، در سه مرحله به تشخیص نفوذ می پردازد؛ در مرحله نخست، CNN به عنوان توصیفگر ویژگی ها عمل نموده و ویژگی های اصلی استخراج می شود و سپس، طبقه بندی کننده متمایزگر این ویژگی ها را طبقه بندی می کند و در نهایت، به کمک یادگیری خصمانه نفوذ تشخیص داده می شود. جهت بررسی کارآمدی روش پیشنهادی، یک مجموعه داده منبع باز واقعی مورد استفاده قرار گرفت که ترافیک شبکه CAN را بر روی یک وسیله نقلیه واقعی در حین انجام حملات تزریق پیام ضبط نموده است. نتایج به دست آمده نشان می دهد که روش پیشنهادی نسبت به سایر روش های یادگیری ماشین در نرخ منفی کاذب و میزان خطا عملکرد بهتری دارد که این میزان برای DoS و حمله جعل دنده محرک و حمله جعل RPM کمتر از 0.1 % می باشد و این میزان برای حمله فازی کمتر از 0.5% می باشد.
کلید واژگان: سیستم تشخیص نفوذ، یادگیری ماشین، شبکه داخل خودرویی، شبکه ناحیه کنترل کننده (CAN)، شبکه عصبی پیچشی (CNN)، یادگیری خصمانهIn recent years, with the advancement of automotive electronics and the development of modern vehicles with the help of embedded systems and portable equipment, in-vehicle networks such as the controller area network (CAN) have faced new security risks. Since the CAN bus lacks security systems such as authentication and encryption to deal with cyber-attacks, the need for an intrusion detection system to detect attacks on the CAN bus seem to be very necessary. In this paper, a deep adversarial neural network (DACNN) is proposed to detect various types of security intrusions in CAN buses. For this purpose, the DACNN method, which is an extension of the CNN method using adversarial learning, detects intrusion in three stages; In the first stage, CNN acts as a feature descriptor and the main features are extracted, and in the second stage, the discriminating classifier classifies these features and finally, the intrusion is detected using the adversarial learning. In order to show the efficiency of the proposed method, a real open source dataset was used in which the CAN network traffic on a real vehicle during message injection attacks is recorded on a real vehicle. The obtained results show that the proposed method performs better than other machine learning methods in terms of false negative rate and error rate, which is less than 0.1% for DoS and drive gear forgery attack and RPM forgery attack while this rate is less than 0.5% for fuzzy attack.
Keywords: In-vehicle network, Controller area network (CAN), Intrusion detection, Convolutional neural network (CNN), Adversarial Training -
Signature identification plays an important role in many areas such as banking, administrative and judicial systems. For this purpose, in this paper, an automatic intelligent framework is developed by combining a deep pre-trained network with a recurrent neural network. The results of the proposed model were evaluated on several valid datasets and collected datasets. Since there was no suitable Persian signature dataset, we collected a Persian signature dataset based on US ASTM guidelines and standards, which can be very effective and profound for deep approaches. Due to the very promising results of the proposed model in comparison with recent studies and conventional methods, to evaluate the resistance of the proposed model to different noises, we added Gaussian Noise, Salt and Pepper Noise, Speckle Noise, and Local var Noise in different SNRs to the raw data. The results show that the proposed model can still be resistant to a wide range of SNRs; So at 15 dB, the accuracy of the proposed method is still above 90%.
Keywords: Automatic Identification of the Writer of the Signature, Pre-trained Network, Feature Learning, Convolutional Neural Network (CNN) -
Diagnosing benign and malignant glands in thyroid ultrasound images is considered as a challenging issue. Recently, deep learning techniques have significantly resulted in extracting features from medical images and classifying them. Convolutional networks ignore the hierarchical structure of entities within images and do not pay attention to spatial information as well as the need for a large number of training samples. Capsule networks consist of different hierarchical capsules equivalent to the same layers in the CNN neural network. This study tried to extract textural features using a deep learning model based on a capsule network. Thyroid ultrasound images were given to the capsule network as input data, and finally the features learned in the capsule network were used to teach the Support Vector Machine classifier, in order to diagnose thyroid cancer. Experimental results showed that the proposed method with 98% accuracy has achieved better results compared to convolutional networks.
Keywords: Thyroid Gland, convolutional neural network (CNN), deep learning, Feature Extract, Capsule Network -
قطعه بندی معنایی تصویر مبتنی بر شبکه های عصبی عمیق، از رویکردهای مهم محققان بینایی ماشین می باشد. در روش های مبتنی بر شبکه های عصبی عمیق، بطور کلی از یک شبکه-پایه که برای کاربرد شناسایی تصویر، آموزش دیده است، بمنظور استخراج ویژگی از تصویر استفاده می شود. از آنجا که ابعاد ویژگی های خروجی از این شبکه های-پایه، کوچکتر از تصویر ورودی می باشد، لذا با اضافه کردن چندین لایه پیچشی به انتهای این شبکه های-پایه، ابعاد ویژگی های خروجی از این شبکه ها را به اندازه ابعاد تصویر وروی می-رسانند. استفاده از ویژگی های محلی خروجی از شبکه های-پایه، بدون در نظر گرفتن ارتباط کلی بین این ویژگی های محلی، منجر به قطعه بندی ضعیف و ناهموار می شود. بر این اساس، در این تحقیق واحدی با نام "واحد احتمالات آگاه به محتوا" پیشنهاد می شود. این واحد با کمک ویژگی های محلی خروجی از شبکه های-پایه، بردار احتمال حضور کلاس های مختلف را در تصویر تولید می کند. واحد پیشنهادی را می توان در معماری های مختلف قطعه بندی معنایی تصویر قرار داد. در این تحقیق، با اضافه کردن واحد پیشنهادی CAP به معماریهای پایه FCN و DeepLab-v3-plus، به ترتیب معماریهای FCN-CAP و DeepLab-v3-plus-CAP پیشنهاد شده است. بمنظور آموزش معماریهای پیشنهادی از دادگان PASCAL VOC2012 استفاده شده است. نتایج آزمایش ها نشان می دهد که معماریهای پیشنهادی نسبت به معماریهای پایه مربوطه، به ترتیب 9/1درصد و 4/0درصد بهبود دقت (mIoU) دارد.کلید واژگان: قطعه بندی معنایی تصویر، شبکه های عصبی عمیق، شبکه های عصبی کانولوشنی، واحد احتمالات آگاه به محتواSemantic image segmentation based on Convolutional Neural Networks (CNNs) is one of the main approaches in computer vision area. The methods based on deep convolutional neural networks, typically use a pre-trained CNN trained on the large image classification datasets as a backend to extract features (image descriptors) from the images. Whereas, the special size of output features from CNN backends are smaller than the input images, by stacking multiple deconvolutional layers on the last layer of backend network, the dimension of the output will be the same as the input image. Segmentation using local image descriptors without involving relationships between these local descriptors yield weak and uneven segmentation results. Inspired by these observations, in this research we propose Context-Aware Probabilities (CAP) unit. CAP unit generates probabilities for classes using local-image descriptors. This unit can be used in any semantic image segmentation architectures. We used CAP unit in Fully Convolutional Network (FCN) and DeepLab-v3-plus architectures and propose the new FCN-CAP and DeepLab-v3-plus-CAP architectures. Training the proposed architectures on PASCAL VOC2012 dataset shows 1.9% and 0.4% accuracy improvement compared to the corresponding basic architectures, respectively.Keywords: Semantic Image Segmentation, Deep Neural Network (DNN), Convolutional Neural Network (CNN), Context-Aware Probabilities (CAP) Unit
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.