convolutional neural network (cnn)
در نشریات گروه فنی و مهندسی-
فشار خون بالا مهمترین عامل مرگ و میر در جهان است. اندازه گیری پیوسته ی فشار خون در سالمندان و افراد با سابقه ی سکته ی قلبی، بیماری قلبی عروقی، بیماری کلیوی و فشار خون بارداری بسیار ضروری است. هولترهای فشار خون مبتنی بر کاف به عنوان مرسومترین روش اندازهگیری پیوسته ی فشار خون به دلیل استفاده از کاف بادی باعث ناراحتی شخص به خصوص در حین خواب میشوند. یک راه حل برای چنین مشکلاتی، اندازهگیری فشار خون به روش نوری با استفاده از سیگنال فوتوپلتیسموگرام است. در این پژوهش یک چارچوب یادگیری عمیق انتقالی برای تخمین فشار خون سیستولیک و دیاستولیک بر مبنای یک سیگنال فوتوپلتیسموگرام ارائه شده است. چارچوب پیشنهادی شامل سه بخش اصلی کاهش نرخ نمونه برداری با ضریب 4 با هدف کاهش پیچیدگی مدل، طراحی یک مدل پیش آموزش شامل لایه های CNN و BiLSTM و ایجاد مدل شخصی سازی شده برای هر فرد با استفاده از یادگیری انتقالی است. آنالیز بلند آلتمن و همبستگی برای مقایسه ی روش پیشنهادی با روش کاتتر شریانی (روش استاندارد طلایی برای اندازه گیری فشار خون) انجام شده است. مدل پیشنهادی روی محدوده ی وسیعی از مقادیر فشار خون 100 بیمار از پایگاه داده ی MIMIC-III ارزیابی شده است. نتایج نشان داده که خطا و ضریب همبستگی پیرسون برای فشار خون سیستولیک به ترتیب برابر با 14/0±38/7 (انحراف معیار±میانگین) میلی مترجیوه و 95/0 و برای فشار خون دیاستولیک برابر با 00/0±67/4 میلی مترجیوه و 92/0 است. روش پیشنهادی الزامات استاندارد AAMI، IEEE-1708a و درجه ی A استاندارد BHS را برآورده کرده است. این پژوهش می تواند چشم انداز روشنی برای مانیتورینگ بلندمدت فشار خون و پیش گیری از رویدادهای قلبی عروقی ترسیم نماید.کلید واژگان: حافظه ی طولانی کوتاه مدت دوجهته، شخصی سازی، شبکه ی عصبی کانولوشن، فشار خون، فوتوپلتیسموگرافی، یادگیری انتقالیHypertension is the leading cause of death worldwide. Continuous blood pressure (BP) measurement is crucial for the elderly and people with myocardial infarction, cardiovascular disease, kidney disease and gestational hypertension. Cuff-based blood pressure Holters are the most common method for continuous blood pressure measurement, but due to the use of an inflatable cuff, they often cause discomfort, particularly during sleep. A solution to such problems is the optical measurement of blood pressure using the photoplethysmogram (PPG) signal. This paper introduces a transfer deep learning framework for estimating systolic BP (SBP) and diastolic BP (DBP) using a single PPG signal. The proposed framework consists of three main parts: 1) downsampling by a factor of 4 aimed at reducing model complexity, 2) designing a pre-trained model including CNN and BiLSTM layers, and 3) personalizing the pre-trained model for each patient through transfer learning. We carry out Bland-Altman and correlation analysis to compare our method to the invasive arterial catheter (the gold-standard BP measurement method). Our model was validated on a wide range of BP signals acquired from 100 patients in MIMIC-III database. Results showed that the error and Pearson correlation coefficient of our model are 0.14±7.38 mmHg (mean±standard deviation) and 0.95 for SBP, and 0.00±4.67 mmHg and 0.92 for DBP. The proposed method satisfies the requirements the AAMI and IEEE-1708a standard and receives a grade A according to the BHS standard. This research has shed light on long-term BP monitoring and the prevention of cardiovascular events.Keywords: Bidirectional Long Short-Term Memory (Bilstm), Personalizing, Convolutional Neural Network (CNN), Blood Pressure, Photoplethysmography, Transfer Learning
-
استفاده از تلفن های همراه با سیستم عامل اندروید روز به روز در حال گسترش است. سیستم عامل اندروید به خودی خود ابزار قدرتمندی برای تشخیص بدافزار ندارد. از این رو، مهاجمان به راحتی از طریق گوشی تلفن همراه افراد وارد حریم خصوصی آنها شده و آنها را در معرض خطر جدی قرار می دهند. تاکنون تحقیقات زیادی بر روی تشخیص بدافزار صورت گرفته است. یکی از مشکلات عمده این راهکارها، دقت پایین در تشخیص چند کلاسه روی مجموعه داده ها و یا عدم حصول نتیجه مطلوب در هر دو نوع تشخیص دودویی و چند کلاسه است. در این مقاله با استفاده از شبکه عصبی کانولوشن (CNN) و تغییر در تعداد لایه های مختلف، سعی کرده ایم تا حداکثر تعداد ویژگی های مهم را از مجموعه داده استخراج نماییم. در فاز طبقه بندی داده ها نیز از الگوریتم یادگیری شبکه حافظه طولانی کوتاه مدت (LSTM) استفاده می کنیم تا با آزمایش آن بر روی ویژگی های انتخاب شده، داده ها با حداکثر دقت ممکن طبقه بندی شوند. نتایج آزمایش بر روی مجموعه داده جدید MalMemAnalysis-2022 نشان می دهد که استفاده از این دو الگوریتم و تغییر در تعداد لایه ها می تواند در بهترین حالت به ترتیب منجر به دقت های 99.99% و 71.99% در دسته-بندی دودویی و چند کلاسه در تشخیص بدافزار شود که نسبت به روش های موجود برتری دارد.کلید واژگان: تشخیص بدافزار، شبکه عصبی کانولوشن (CNN)، شبکه حافظه طولانی کوتاه مدت (LSTM)، مجموعه داده Malmemanalysis-2022The use of mobile phones with Android operating system is expanding day by day. Android itself does not have a powerful malware detection tool. Therefore, attackers easily enter people's privacy through their mobile phones and put them at serious risk. So far, a lot of research has been done on malware detection. One of the main problems of these solutions is the low accuracy in multi-class detection on the dataset or the failure to achieve the desired result in both types of binary and multi-class detection. In this paper, by using Convolutional Neural Network (CNN) and changing the number of different layers, we have tried to extract the maximum number of important features from the dataset. In the data classification phase, we use the Deep Learning-based algorithm named Long Short-Term Memory (LSTM) to classify the data with the maximum possible accuracy by testing it on the selected features. The test results on the new MalMemAnalysis-2022 dataset show that the use of these two algorithms and the change in the number of layers can lead to 99.99% and 99.71% accuracies in binary and multi-class classification in malware detection, respectively, which is superior to existing methods.Keywords: Malware Detection, Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), Malmemanalysis-2022 Dataset
-
One of the biometric detection methods is to identify people based on speech signals. The implementation of a speaker identification (SI) system can be done in many different ways, and recently, many researchers have been focusing on using deep neural networks. One of the types of deep neural networks is recurrent neural networks, where memory and recurrent parts are handled by layers such as LSTM or Gated Recurrent Unit (GRU). In this paper, we propose a new structure as a classifier in the speaker identification system, which significantly improves the recognition rate by combining a convolutional neural network with two layers of GRU (CNN+ GRU). MFCC coefficients that have been extracted as cell arrays from each period of Pt speech will be used as sequence vectors for the input of proposed classifier. The performance of the SI system has improved in comparison to basic methods according to experiments conducted on two databases, LibriSpeech and VoxCeleb1. When Pt is longer, the system performs better, so that on the LibriSpeech database with 251 speakers, recognition accuracy is equal to 92.94% for Pt=1s, and it rises to 99.92% for Pt=9s. The proposed CNN+GRU classifier has a low sensitivity to specific genders, which can be said to be almost zero.
Keywords: Speaker Identification, Gated Recurrent Unit Network (GRU), Convolutional Neural Network (CNN), MFCC -
به موازات رشد استفاده از شبکه های اینترنت اشیا برای کاربردهای مختلف، تهدیدات و حملات مربوط به این نوع شبکه ها نیز افزایش پیدا کرده است. سامانه های تشخیص نفوذ به منظور تشخیص و شناسایی حملات در این گونه شبکه ها طراحی و مورد استفاده قرار می گیرند و اقدام به شناسایی خرابکاری ها و نفوذها و یا سوءاستفاده هایی که از شبکه قرار است صورت بگیرد، کرده و این موضوع را به اطلاع مسئول مربوطه شبکه می رسانند. در بیشتر سامانه های تشخیص نفوذ، روش ها و الگوریتم های مختلفی از جمله الگوریتم های مبتنی بر یادگیری ماشین و یادگیری عمیق استفاده می شود که هر کدام دارای مزایا و معایبی هستند، اما به طور معمول نسبت به روش های ترکیبی نرخ صحت کمتری دارند. در سال های اخیر در تشخیص مبتنی بر ناهنجاری از ایده ترکیب طبقه بندها استفاده شد ه است. ما در این پژوهش، برای افزایش سرعت الگوریتم در شناسایی و دستیابی به نرخ درستی و صحت بالاتر از ترکیب روش های تحلیل مولفه اصلی یا (PCA) و شبکه های عصبی پیچشی (CNN) برای طراحی سامانه تشخیص نفوذ پیشنهادی خود استفاده کرده ایم؛ از PCA به منظور کاهش ابعاد و حجم داده های ورودی بهره بردیم تا به افزایش کارایی الگوریتم اصلی ما کمک کند و داده جدید تولیدشده با این الگوریتم در اختیار طبقه بند CNN قرار می گیرد؛ همچنین ما از دو سطح از دسته بندی مبتنی بر شبکه عصبی عمیق پیچشی دودویی و چندکلاسه برای شناسایی حملات بهره بردیم. به این صورت که ابتدا حملات و داده های نرمال به وسیله طبقه بند عمیق دودویی از هم جداسازی می شوند؛ سپس به وسیله طبقه بند عمیق چندکلاسه به شناسایی و تفکیک نوع حملات صورت گرفته پرداخته شده و دسته بندی حملات صورت می گیرد. بر اساس نتایج آزمایش های انجام شده روی داده های واقعی حملات، شاهد رشد نرخ صحت و درستی روش پیشنهادی نسبت به بسیاری از روش های مطرح دیگر بوده ایم.
کلید واژگان: سامانه تشخیص نفوذ، شبکه عصبی پیچشی، طبقه بند دودویی، طبقه بند چندکلاسه، تحلیل مولفه های اصلیAlong with the growth in the use of Internet of Things networks for various applications, threats and attacks related to these types of networks have also increased. Intrusion detection systems are designed and used to detect and identify attacks in this type of networks, and to identify intrusions or abuses that are going to take place from the network, and to inform the relevant authorities about this issue. In most intrusion detection systems, various methods and algorithms are used, including deep neural networks (DNNs), support vector machines (SVM), or multilayer perceptron (MLP), and other traditional machine learning models. Each method has advantages and disadvantages, but it usually has a lower accuracy rate than combined methods. In recent years, the idea of combining classifications has been used for anomaly-based diagnosis. In this research, to reach better accuracy, we used the combination of principal component analysis (PCA) and convolutional neural network (CNN) algorithms to design our intrusion detection system. In the initial step of the proposed method, after preprocessing including conversions and normalizations, valuable features for classification are extracted. In this study, the NSL-KDD dataset, which has been mentioned in many scientific articles as a valid reference dataset in the field of intrusion detection, has been used. In fact, due to the high number of data dimensions and the high dispersion of feature values, we used a dimension reduction method. The dimensionality reduction method used in this research is principal component analysis (PCA). In the PCA method, the dimensions of the data are reduced in such a way that the reduced dimension data also includes the vital information of the dataset. We used PCA in order to reduce the size and volume of the input data to help increase the efficiency of our main algorithm and the new data generated with this algorithm is provided to the CNN classifier. A convolutional neural network is a special type of neural network with multiple layers that processes data that has a grid arrangement and then extracts important features from them. Here, accurate pattern learning and deep insight from the given data are our two main reasons for using CNN. In the proposed approach, we have two level classification including binary CNN and multi-class CNN, for detecting attacks and exact type of them, respectively. That is, firstly attacks and normal data are identified by binary classification and then by multi-class classification, the types of attacks are identified and separated. In fact, the type of attacks which includes one of DoS, U2R, R2L and Probe cases is determined using second convolutional neural network. Based on the obtained results, we have witnessed the growth of the accuracy rate of the proposed method compared to many other popular methods. In the evaluation of accuracy parameter values for different phases of training and testing, competitive results are observed for binary classification phase. Here we consider the number of 15 rounds. As it is clear from the graph related to training, the accuracy values in the final courses have reached 0.94. The accuracy of the test has also approached the value of 0.9 in the last round. Also, the results obtained in multi-class CNN are such that the accuracy value is 0.99 in the classification of the training data samples and 0.97 in the classification of the test data samples. Moreover, the cost graphs for training and testing courses of multi-class CNN are shown. The cost of training and testing in the final round is 0.06 and 0.09, respectively.
Keywords: Intrusion Detection System, Convolutional Neural Network (CNN), Binary Classifier, Multi-Class Classifier, Principal Component Analysis (PCA) -
تصاویر ابرطیفی اخذ شده توسط سامانه های سنجش از دور به دلیل وجود داده های باارزش طیفی در بازه ی وسیعی از طول موج دارای قدرت بالایی در آشکارسازی اهداف هستند. علاوه بر اطلاعات طیفی، این تصاویر دارای اطلاعات مکانی باارزشی هستند که در تشخیص دقیق هدف از پس زمینه موثر است. یکی از چالش های اصلی آشکارسازی اهداف، وجود تعداد نمونه های آموزشی محدود هدف است. جهت مقابله با این چالش، یک آشکارساز مبتنی بر شبکه عصبی کانولوشن (CNN) در این مقاله مورد ارزیابی قرار گرفته است. به جای استفاده از تک پیکسل ها، تکه های مکعبی با اطلاعات مکانی در دو بعد و اطلاعات طیفی در بعد سوم به عنوان ورودی آشکارساز استفاده می شوند. CNN با قابلیت بالا در استخراج ویژگی های سلسله مراتبی مکانی دقت خوبی را در خروجی حاصل می کند. جهت حل مشکل تعداد نمونه های آموزشی محدود از شبکه مولد رقابتی (GAN) برای تولید تکه های تصویر مکعبی جعلی مشابه با تکه های مکعبی مفروض حول پیکسل های هدف واقعی استفاده شده است. اثر داده افزایی با GAN در آشکارساز CNN با مقادیر مختلف داده افزایی در حالت بعد کامل و بعد کاهش یافته مورد ارزیابی قرار گرفته است. نتایج آزمایش ها نشان دهنده ی دقت بالاتر CNN نسبت به روش های پرکاربرد آشکارسازی و همین طور بهبود دقت آشکارساز CNN به کمک داده افزایی انجام شده توسط GAN می باشد.کلید واژگان: شبکه مولد رقابتی (GAN)، شبکه عصبی کانولوشن (CNN)، تصویر ابرطیفی، آشکارسازی اهداف، داده افزاییHyperspectral images acquired by remote sensing systems have high ability for target detection due to providing valuable spectral data in a wide range of wavelengths. In addition to spectral information, these images have valuable spatial information that is effective in accurate discrimination of target from background. One of the main challenges of target detection is the limited number of target training samples. To deal with this challenge, a detector based on Convolutional Neural Network (CNN) is introduced in this paper. Instead of using the single pixels, the cubic patches with spatial information in two dimensions and spectral information in the third dimension are used as the detector input. CNN with high capability in extracting hierarchical spatial features achieves good accuracy in the output. In order to solve the problem of the limited number of training samples, the generative adversarial network (GAN) has been used to generate fake cubic patches similar to the considered cubic patches around the real target pixels. The effect of data augmentation with GAN has been evaluated in the CNN detector with different amounts of data augmentation in both cases of full dimension and reduced dimension. The experimental results show the higher accuracy of CNN compared to the widely used detectors, as well as accuracy improvement of the CNN detector using data augmentation implemented by GAN.Keywords: Generative Adversarial Network (GAN), Convolutional Neural Network (CNN), Hyperspectral Image, Target Detection, Data Augmentation
-
هدف بیماری آلزایمر، یک اختلال پیشرونده مغزی است که تشخیص به موقع آن برای مدیریت و درمان موثر ضروری است. این مطالعه یک شبکه عصبی پیچشی [1] (CNN) کارآمد، کم حجم و دقیق را برای طبقه بندی تصاویر MRI مغز به چهار دسته مرتبط با آلزایمر ارائه می دهد. دو رویکرد اصلی برای طراحی روش در زمینه بهبود تشخیص، استفاده شده است: (1) پیش پردازش بهینه داده ها و (2) طراحی یک معماری سبک، کم حجم و دارای پیچیدگی کم شبکه عصبی پیچشی که به طور هم زمان دارای دقت خوب، کارایی محاسباتی و عملکرد عالی می باشد. مدل پیشنهادی به دقت 22/99 درصد، میانگین امتیاز F1 برابر با 99/0، ضریب همبستگی متیو [2] (MCC) برابر با 9870/0 و ضریب کاپا کوهن [3] (CKC) برابر با 9870/0 دست یافت. در این تحقیق، علاوه بر دقت، پیچیدگی مدل پیشنهادی، مقایسه اندازه مدل، زمان سپری شده، عملیات نقطه شناور در ثانیه [4] (FLOPs) و پارامترهای قابل آموزش و غیرقابل آموزش روش پیشنهادی به طور کامل موردبررسی قرار گرفته است. این مدل با داشتن مزایای دقت بالا، کاهش FLOPs، زمان اجرای سریع تر و نیاز به حافظه کمتر، در مقایسه با دیگر روش های یادگیری عمیق استفاده شده در مطالعات اخیر، عملکرد بهتری دارد.
کلید واژگان: بیماری آلزایمر، تشخیص، شبکه عصبی پیچشی (CNN)، تصاویر MRI مغز، طبقه بندی، ارزیابی عملکردKarafan, Volume:21 Issue: 68, 2024, PP 277 -299The Alzheimer's disease, a progressive brain disorder, necessitates timely detection for effective management due to the current diagnostic methods' limitations. The study presents an efficient convolutional neural network (CNN) designed for classifying brain magnetic resonance imaging (MRI) images into four categories related to Alzheimer's disease. To enhance diagnosis, this study proposes two distinct approaches at different stages: (1) using optimized data pre-processing; and (2) designing a lightweight CNN architecture with low complexity and fewer parameters that simultaneously possesses good accuracy, computational efficiency, and excellent performance. The proposed method achieved outstanding results, with a final accuracy of 99.22%, a macro average F1 score of 0.99, an MCC of 0.9870, and a Cohen kappa score (CKS) of 0.9870. In addition to accuracy, the complexity of the proposed model, including the comparison of model size, time elapsed, the number of FLOPs, and the trainable and non-trainable parameters of the proposed method were also thoroughly investigated. This model, with the advantages of high accuracy, reduced FLOPs, faster execution time, and lower memory requirements outperforms other deep learning methods used in recent studies.
Keywords: Alzheimer's Disease, Diagnosis, Convolutional Neural Network (CNN), Brain MRI Images, Classification, Performance Evaluation -
A brain-computer interface (BCI) is a form of assistive technology that facilitates communication between users and machines by interpreting brain signals. The P300 wave, an event-related potential (ERP) in oddball paradigms, is generated approximately 300 milliseconds after the presentation of the target stimulus selected by the user in the brain. Accurate recognition of these waves in a P300 spelling system enables the user to write letters. Classification of P300 waves in an EEG-based spelling system faces several challenges, including accurate detection of P300 waves and handling the high dimensionality of these signals. This study presents a Convolutional Deep Learning Framework (CDLF) for character recognition using EEG signals. The proposed model uses CNN with a one-dimensional kernel to extract features over time. The proposed model was applied to two public datasets: BCI Competition III dataset II and BCI Competition II dataset IIb. The proposed model showed an average character recognition rate of 95% at epoch 15 for BCI Competition III dataset II and 100% at epoch 15 for BCI Competition II dataset IIb, without using any feature and channel selection methods before classification. The proposed model is promising for brain-computer interface classification applications in the spelling domain.
Keywords: Brain-Compute Interface (BCI), Electroencephalogram (EEG), Spelling, Classification, Convolutional Neural Network (CNN) -
بیماری پارکینسون یکی از انواع بیماری های عصبی است که در اثر تخریب سلول های مغزی تولید کننده دوپامین ایجاد می شود. تشخیص زودهنگام بیماری پارکینسون عامل مهمی در کاهش سرعت پیشرفت بیماری است. در این مطالعه، از یک شبکه عصبی کانولوشن (CNN) به نام ConvNet برای طبقه بندی افراد سالم و افراد مبتلا به بیماری پارکینسون بر اساس تصاویر توموگرافی رایانه ای تک فوتونی (SPECT) از پایگاه داده PPMI استفاده شده است. از آنجایی که این مجموعه داده محدود است، پس از یک مرحله پیش پردازش داده ها، از دو تکنیک افزایش داده کلاسیک برای جلوگیری از بیش برازش و عملکرد بهتر مدل استفاده شده است. در نهایت از تکنیک Grad-CAM جهت تفسیر پیش بینی های انجام شده توسط شبکه عصبی کانولوشن پیشنهادی استفاده شده است. برای ارزیابی روش پیشنهادی از معیارهای متنوعی همچون دقت، حساسیت و f1-score استفاده شده است. نتایج شبیه سازی برحسب معیارهای ارزیابی نشان می دهد که با استفاده از تکنیک افزایش داده کلاسیک می توان طبقه بندی موثرتری انجام داد، به گونه ای که روش پیشنهادی از نظر دقت طبقه بندی به دقت 98.5% دست یافت.کلید واژگان: بیماری پارکینسون، شبکه عصبی کانولوشن، تصاویرSPECT، افزایش داده، Grad-CAMParkinson's disease is one of the types of neurological diseases that is caused by the destruction of brain cells that produce dopamine. Early detection of Parkinson's disease is an important factor in slowing the progression of the disease. In this study, a Convolutional Neural Network (CNN) namely ConvNet, is used to discriminate Parkinson's patients based on Single Photon Emission Computed Tomography (SPECT) images acquired from the PPMI database. Since the dataset is limited, after a pre-processing stage, two data augmentation techniques are used. Finally, the Grad-CAM technique is used to obtain visual interpretation from the predictions of the proposed CNN. To evaluate the proposed method, different measures such as accuracy, sensitivity (recall) and f1-score are used. Simulation results according to the measures shows that when the classic data augmentation method is used accuracy is increased to 98.50% and more efficient classification is performed.Keywords: Parkinson's Disease (PD), Convolutional Neural Network (CNN), SPECT Images, Data Augmentation, Grad-CAM
-
Journal of Advances in Industrial Engineering, Volume:58 Issue: 1, Winter and Spring 2024, PP 237 -249This study utilizes deep-learning models for stock price prediction, focusing on data from five companies listed on the Tehran Stock Exchange over the period 2001 to 2022. Five models are employed, including two hybrid models and three single models. The hybrid CNN-LSTM model serves as the primary model, with its predictive accuracy compared against the other four models. Results indicate that the CNN-LSTM model demonstrates superior performance relative to the others, although the CNN-GRU hybrid model also yields satisfactory results. Interestingly, among the single models, the CNN model surpasses both the LSTM and GRU models, defying initial expectations. The accuracy of the models is notably impacted by factors such as volatility, which increases uncertainty. This research, which exclusively relies on technical indicators, suggests that achieving optimal results hinges not only on selecting the right neural network but also on determining the appropriate number of layers in each model. Overall, the CNN-LSTM model delivers the best performance across four of the five stocks, with the CNN-GRU model slightly outperforming it for one stock. Among the single models, the CNN model consistently outperforms the others.Keywords: Deep Learning, Convolutional Neural Network (CNN), Long Short-Term Memory Neural Network (LSTM), Gated Recurrent Unit (GRU), Stock Price Prediction
-
Misdiagnosis of skin diseases is a common occurrence. Psoriasis is a skin disease that has many similarities with other diseases, and its incorrect diagnosis causes many problems in the treatment process. Misdiagnosis of this disease causes doctors to face problems during treatment. The lack of images of the disease and the database of skin diseases reduces the diagnosis and the coordination of diagnostic methods, therefore, diagnosis using different images is very useful.
Today, diagnosis methods using deep features in medical images have received much attention.
Artificial intelligence is one of the automatic methods of diagnosis. These methods can detect new data entering the system and keep it in memory. Therefore, in this article, two different groups of data have been identified using deep features based on artificial intelligence.
In this method, the data of the first group in the form of training and testing and the data of the second group are studied gradually. If they are correctly identified, the next 0.1 chunks of data enter the network without testing. If they are wrongly recognized, they enter the training section and this reduces the training process. In this work, by training 20% of the data, i.e. the first 10% and the fourth 10%, there was no need for training because the accuracy was not less than98%.
In this article, deep features of images were first extracted using convolutional neural network, and then psoriasis and eczema were diagnosed with average accuracy of98.3%and sensitivity of 97.9% in skin images using artificial intelligence.Keywords: Artificial Intelligence, deep learning, convolutional neural network (CNN), skin disease psoriasis, eczema -
In recent years, emotion recognition as a new method for human-computer interaction has attracted the attention of researchers. Automatic speech emotion recognition has become one of the practical methods to increase engagement in most industries. It is expected that emotion recognition based on audio information can result in better accuracy. The purpose of this article is to present an efficient method for recognizing emotional states from speech signals, based on a new cognitive model. Due to the importance of the topic, this article presents an efficient method for recognizing emotional states from speech signals based on a mixed deep learning and cognitive model called SOAR. To implement each part of this model, two main steps have been introduced. The first step is reading the video and converting it to images and preprocessing it. The next step is to use the combination of convolutional neural network (CNN) and learning automata (LA) to classify and detect the rate of facial emotional recognition. The reason for choosing CNN in our model is that no dimension is removed from the speech signal and considering the temporal information in dynamic speech leads to more efficient and better classification. Also, the training of the CNN network in calculating the backpropagation error is adjusted by LA so that the efficiency of the proposed model is increased and the working memory part of the SOAR model can be implemented. In the proposed model, audio databases available in the field of multimodal emotion recognition eNTERFACE' 05 and SAVEE have been used for various experiments. The recognition accuracy of the presented model in the best case from eNTERFACE' 05 and SAVEE databases is equal to 85.3% and 84.5%, respectively.Keywords: Speech Emotion Recognition, Convolutional Neural Network (CNN), Learning Automata, Improved SOAR Model
-
در سال های اخیر، با پیشرفت الکترونیک خودرو و توسعه وسایل نقلیه مدرن با کمک سیستم های نهفته و تجهیزات قابل حمل، شبکه های درون-خودرویی مانند شبکه ناحیه کنترل کننده (CAN) با مخاطرات امنیتی جدیدی مواجه شده اند. از آنجا که گذرگاه CAN فاقد سیستم های امنیتی مانند تایید اعتبار و رمزگذاری برای مقابله با حملات سایبری می باشد، نیاز به یک سیستم تشخیص نفوذ برای شناسایی حملات به گذرگاه CAN بسیار ضرروی به نظر می رسد. در این مقاله، یک شبکه عصبی پیچیده متخاصم عمیق (DACNN) برای تشخیص انواع نفوذهای امنیتی در گذرگاه های CAN پیشنهاد شده است. به این منظور، روش DACNN که گسترش یافته روش CNN با استفاده از یادگیری خصمانه است، در سه مرحله به تشخیص نفوذ می پردازد؛ در مرحله نخست، CNN به عنوان توصیفگر ویژگی ها عمل نموده و ویژگی های اصلی استخراج می شود و سپس، طبقه بندی کننده متمایزگر این ویژگی ها را طبقه بندی می کند و در نهایت، به کمک یادگیری خصمانه نفوذ تشخیص داده می شود. جهت بررسی کارآمدی روش پیشنهادی، یک مجموعه داده منبع باز واقعی مورد استفاده قرار گرفت که ترافیک شبکه CAN را بر روی یک وسیله نقلیه واقعی در حین انجام حملات تزریق پیام ضبط نموده است. نتایج به دست آمده نشان می دهد که روش پیشنهادی نسبت به سایر روش های یادگیری ماشین در نرخ منفی کاذب و میزان خطا عملکرد بهتری دارد که این میزان برای DoS و حمله جعل دنده محرک و حمله جعل RPM کمتر از 0.1 % می باشد و این میزان برای حمله فازی کمتر از 0.5% می باشد.
کلید واژگان: سیستم تشخیص نفوذ، یادگیری ماشین، شبکه داخل خودرویی، شبکه ناحیه کنترل کننده (CAN)، شبکه عصبی پیچشی (CNN)، یادگیری خصمانهIn recent years, with the advancement of automotive electronics and the development of modern vehicles with the help of embedded systems and portable equipment, in-vehicle networks such as the controller area network (CAN) have faced new security risks. Since the CAN bus lacks security systems such as authentication and encryption to deal with cyber-attacks, the need for an intrusion detection system to detect attacks on the CAN bus seem to be very necessary. In this paper, a deep adversarial neural network (DACNN) is proposed to detect various types of security intrusions in CAN buses. For this purpose, the DACNN method, which is an extension of the CNN method using adversarial learning, detects intrusion in three stages; In the first stage, CNN acts as a feature descriptor and the main features are extracted, and in the second stage, the discriminating classifier classifies these features and finally, the intrusion is detected using the adversarial learning. In order to show the efficiency of the proposed method, a real open source dataset was used in which the CAN network traffic on a real vehicle during message injection attacks is recorded on a real vehicle. The obtained results show that the proposed method performs better than other machine learning methods in terms of false negative rate and error rate, which is less than 0.1% for DoS and drive gear forgery attack and RPM forgery attack while this rate is less than 0.5% for fuzzy attack.
Keywords: In-vehicle network, Controller area network (CAN), Intrusion detection, Convolutional neural network (CNN), Adversarial Training -
طبقه بندی ارقام جدا شده چالش اساسی برای بسیاری از سیستم های طبقه بندی گفتار است. درحالی که کارهای زیادی بر روی زبان های گفتاری انجام شده است، تحقیقات محدودی در مورد داده های رقمی گفتاری فارسی در ادبیات گزارش شده است و تمامی تحقیقات مربوط به اعداد صفر تا 9 بوده است. برای این منظور، پایگاه داده ی جامعی شامل بازه ی وسیعتری از اعداد با مشارکت 145 نفر که شامل هفتاد نفر مرد و 75 نفر زن هستند، جمع آوری گردیده است. پایگاه داده مذکور، بازه عددی صفر تا 599 را پوشش می دهد. پس از پیش پردازش داده ها، داده های صوتی تبدیل به طیف نگار مل شده و برای استخراج ویژگی و طبقه بندی داده ها از شبکه عصبی کانولوشنی و نیز یک مدل ترکیبی شامل مدل ترنسفورمر و حافظه کوتاه و بلند مدت استفاده گردیده است. نتایج تجربی بر روی پایگاه داده جمع آوری شده حاکی از دقت اعتبارسنجی 98.03 درصد می باشد. آنالیزهای مختلفی نیز بر روی آزمایش و آزمون مدل ها صورت گرفته است.کلید واژگان: ارقام گفتاری، طبقه بندی، ارقام گفتاری فارسی، طیف نگار مل، پایگاه داده، ترنسفورمرClassification of isolated digits is a fundamental challenge for many speech classification systems. Previous works on spoken digits have been limited to the numbers 0 to 9. In this paper, we propose two deep learning-based models for spoken digit recognition in the range of 0 to 599. The first model is a Convolutional Neural Network (CNN) model that uses the Mel spectrogram obtained from the audio data. The second model uses the recent advances in deep sequential models, especially the Transformer model followed by a Long Short-Term Memory (LSTM) Network and a classifier. Moreover, we also collected a dataset, including audio data by a contribution of 145 people, covering the numerical range from 0 to 599. The experimental results on the collected dataset indicate a validation accuracy of 98.03%.Keywords: Spoken digits, Persian digits, Deep learning, Convolutional Neural Network (CNN), Mel spectrogram, Transformer
-
خطوط ریلی در مناطق بیابانی با مشکلی جدی هجوم ماسه های بادی و انباشت آن ها بر روی ریل ها روبرو است. در اثر این پدیده، احتمال بسته شدن خطوط آهن، توقف حرکت قطارها و وقوع حادثه وجود دارد. در حال حاضر تلاش می شود تا با بازدیدهای میدانی در مناطق در معرض هجوم ماسه های بادی، از بروز این مشکل جلوگیری شود اما روش های سنتی با وجود ساده بودن دارای محدودیت هایی است که مهم ترین آنها هزینه مالی و زمانی بالای آن ها است. از این رو نیاز به بازنگری در روش های سنتی پایش در این مناطق به شدت احساس می شود. در این پژوهش با بکارگیری فناوری تصویربرداری پهپادی و پردازش هوشمند تصویر مبتنی بر شبکه های عصبی همگشتی و یادگیری عمیق یک سامانه جامع پایش طراحی شده است. استفاده از پهپادها و عمودپروازها در مدیریت و تعمیر و نگهداری و تعمیرات فراسازه های ترابری می تواند گام مهمی در بالا بردن دقت و سرعت و البته کاهش هزینه ها باشد. به این ترتیب پایش سامانه ریلی به جای آنکه تنها محدود به بازه های زمانی بازدید میدانی باشد، به صورت پیوسته زیر نظر است. در این تحقیق از شبکه عصبی یولو با هدف تشخیص هجوم ماسه های بادی بر شبکه ریلی در تصاویر پهپادی استفاده شده است. در نهایت با آموزش شبکه، دقت شبکه در تشخیص هجوم ماسه بر سطح ریل 91 درصد بدست آمده است.کلید واژگان: پردازش تصویر، شبکه ریلی، شبکه عصبی همگشتی، هجوم ماسه بادیAutomated image processing technologies are being implemented increasingly for infrastructure monitoring applications thanks to their high level of accuracy, versatility and efficiency. Therefore, they can be employed for management, repair, and maintenance of transport meta-structures to reduce costs, enhance accuracy, and accelerate task completion. Moreover, the novel technology of unmanned aerial vehicles (UAVs) had a considerable effect on the improvement of different industries. This study addresses the influx of sand to the rail surface in desert areas. This problems is now analyzed through the conventional method (i.e. field observation), which is the simplest possible technique requiring ongoing inspection and large amounts of time and resources. Hence, the use of novel technologies of image processing and artificial intelligence as well as aerial images helped take a major step in the automated analysis of this problem. In rail networks across desert areas, the influx and accumulation of sand block railways, slow down and stop trains, and sometimes cause accidents. Thus, it is essential to adopt an automated system for the timely detection and resolution of this problems in order to prevent additional costs or further accidents. UAV-based imaging, smart image processing based on convolutional neural networks, and deep learning are employed in this study to design a comprehensive system for monitoring the problems. This system can greatly decrease the costs of monitoring the safety of rail networks and significantly improve the accuracy and efficiency of repair and maintenance systems. The proposed system can also provide the centralized ongoing monitoring of Iran’s transport network.Keywords: image processing, wind-blown sand, railway networks, Convolutional Neural Network (CNN)
-
Deep convolutional neural networks (CNNs) have attained remarkable success in numerous visual recognition tasks. There are two challenges when adopting CNNs in real-world applications: a) Existing CNNs are computationally expensive and memory intensive, impeding their use in edge computing; b) there is no standard methodology for designing the CNN architecture for the intended problem. Network pruning/compression has emerged as a research direction to address the first challenge, and it has proven to moderate CNN computational load successfully. For the second challenge, various evolutionary algorithms have been proposed thus far. The algorithm proposed in this paper can be viewed as a solution to both challenges. Instead of using constant predefined criteria to evaluate the filters of CNN layers, the proposed algorithm establishes evaluation criteria in online manner during network training based on the combination of each filter’s profit in its layer and the next layer. In addition, the novel method suggested that it inserts new filters into the CNN layers. The proposed algorithm is not simply a pruning strategy but determines the optimal number of filters. Training on multiple CNN architectures allows us to demonstrate the efficacy of our approach empirically. Compared to current pruning algorithms, our algorithm yields a network with a remarkable prune ratio and accuracy. Despite the relatively high computational cost of an epoch in the proposed algorithm in pruning, altogether it achieves the resultant network faster than other algorithms.
Keywords: Convolutional Neural Network (CNN), Adaptive Architecture, Pruning, Compression -
Today, electricity theft is one of the main challenges for energy distribution and transmission companies around the world. Early detection of abnormal consumers can prevent security and financial losses. Extensive research studies have been done to detect electricity theft by analyzing customer consumption patterns. Today, one of the most widely used methods is convolutional neural networks (CNNs). These networks contain a large number of hyper-parameters. The accuracy of these networks is low in most studies due to the lack of attention to the adjustment of these hyper-parameters. Network accuracy and achieving a robust learning model are influenced by the optimal adjusting of these hyper-parameters, which requires exploring a complex and large search space. Meta-heuristic-based search methods are suitable for solving these problems. Therefore, the main contribution of this paper is to use the high ability of the cheetah optimization algorithm (CHOA) to optimally extract CNN hyper-parameters. In this paper, in order to balance the dataset, abnormal samples are created using artificial attacks and added to the dataset. Also, in order to increase the accuracy of the network, abnormal data are clustered using the CHOA algorithm. ISSDA dataset is used to test and evaluate the results. Based on the results obtained and comparing them with the other works, it was proved that the proposed framework with high accuracy identifies abnormal consumers.
Keywords: Data mining, Classification, Electricity Theft Detection, Convolutional Neural Network (CNN) -
رها شدن نفت به اقیانوس ها از تانکرها و کشتی ها و خطوط انتقال نفت اهمیت اکولوژی و تاثیر اجتماعی، اقتصادی روی محیط های ساحلی دارد.سالانه 48% آلودگی اقیانوس ها مربوط به سوخت و 29% مربوط به نفت خام می باشد و تصادف تانکرهای حامل، فقط 5% آلودگی های وارد شده به دریا را شامل می شود .هدف از این تحقیق، بررسی اثرات ضریب رانش باد تحت شرایط شدید جزر و مد در منطقه ساحلی غربی کره در زمینه حرکت سیلاب های نفتی ناشی از حادثه تصادف تانکر نفتی با دکل در طوفان هبی می باشد. برای تفکیک نفت از نمونه های مشابه آن، از شبکه عصبی CNN استفاده شد. حذف نویز داده های باز پراکنش شده توسط فیلتر Boxcar اصلاح شد و حرکت سیل نفت با استفاده از یک مدل شبیه سازی ساده بر اساس فرمول تجربی به عنوان عملکرد جریان سطح آب، سرعت باد و فاکتور رانش باد محاسبه شد. برای شبیه سازی، به منظور تولید میدان های جزر و مد و باد، از مدل دینامیکی سیالات محیطی (EFDC) و سیستم هواشناسی خودکار (AWS) استفاده شد. سپس نتایج شبیه سازی شده با 2 نمونه از داده های رادار روزنه مصنوعی Sentinel-1 و TerraSAR-X مقایسه شد. از مطالعه حاضر، مشخص شد که بیشترین میزان تطابق بین نتایج شبیه سازی و تصاویر ماهواره ای با مقادیر مختلف عامل رانش باد به دست می آید و این عامل به طور خطی متناسب با سرعت باد بود. بر اساس نتایج، یک فرمول تجربی اصلاح شده جدید برای پیش بینی حرکت سیل نفت در منطقه ساحلی پیشنهاد شده است.کلید واژگان: شبکه عصبی CNN، سرعت باد، سیستم شناسایی خودکار AIS، طبقه بندی تصویر، رادار پلاریتهThe oil spill into the oceans from oil tankers and oil pipelines has an ecological importance and a social and economic impact on coastal environments. Rapid detection of deliberate and accidental oil leaks can reduce serious risks to coastal residents and help pollutants be identified. The purpose of this research is to study the effects of thrust coefficient in wind under severe tidal conditions in the area of oil floods motion caused by oil tanker collision with a tower in Hebei typhoon in the western coastal zone of Korea. In order to separate oil from similar samples, Convolutional Neural Network (CNN) was used. The noise loss of the open data scattered by the Boxcar filter was modified and the motion of the oil flood was calculated by using a simple simulation model based on the experimental formula as the performance of surface water flow, wind speed and wind thrust factor. To simulate, the Environmental Fluid Dynamics Code (EFDC) and Automatic Weather Station (AWS) were used to generate tidal and wind fields. The simulated results were then compared with two samples of the data of the Synthetic Aperture Radar, Sentinel-1 and TerraSAR-X. From the present study, it is found that the highest match between the simulation results and the satellite images is obtained with different values of wind thrust and this factor is linearly proportionate to the wind speed. According to the results, a new modified experimental formula is proposed to predict the flow of oil flood motion in the coastal zone.Keywords: Convolutional Neural Network (CNN), Wind Speed, Automatic Identification System (AIS), Image Categorization, Polarimetric Radar, Boxcar Filter
-
Signature identification plays an important role in many areas such as banking, administrative and judicial systems. For this purpose, in this paper, an automatic intelligent framework is developed by combining a deep pre-trained network with a recurrent neural network. The results of the proposed model were evaluated on several valid datasets and collected datasets. Since there was no suitable Persian signature dataset, we collected a Persian signature dataset based on US ASTM guidelines and standards, which can be very effective and profound for deep approaches. Due to the very promising results of the proposed model in comparison with recent studies and conventional methods, to evaluate the resistance of the proposed model to different noises, we added Gaussian Noise, Salt and Pepper Noise, Speckle Noise, and Local var Noise in different SNRs to the raw data. The results show that the proposed model can still be resistant to a wide range of SNRs; So at 15 dB, the accuracy of the proposed method is still above 90%.
Keywords: Automatic Identification of the Writer of the Signature, Pre-trained Network, Feature Learning, Convolutional Neural Network (CNN) -
Diagnosing benign and malignant glands in thyroid ultrasound images is considered as a challenging issue. Recently, deep learning techniques have significantly resulted in extracting features from medical images and classifying them. Convolutional networks ignore the hierarchical structure of entities within images and do not pay attention to spatial information as well as the need for a large number of training samples. Capsule networks consist of different hierarchical capsules equivalent to the same layers in the CNN neural network. This study tried to extract textural features using a deep learning model based on a capsule network. Thyroid ultrasound images were given to the capsule network as input data, and finally the features learned in the capsule network were used to teach the Support Vector Machine classifier, in order to diagnose thyroid cancer. Experimental results showed that the proposed method with 98% accuracy has achieved better results compared to convolutional networks.
Keywords: Thyroid Gland, convolutional neural network (CNN), deep learning, Feature Extract, Capsule Network -
دیابت چشمی به عنوان یکی از عوارض مهم دیابت، باعث آسیب به شبکیه چشم بیمار شده و تشخیص دیرهنگام آن حتی می تواند موجب نابینایی گردد. برخی از روش های دسته بندی مبتنی بر یادگیری ماشین بر اساس استخراج داده های تصاویر شبکیه به صورت دستی بوده و توسط متخصصین پردازش تصویر صورت می پذیرد. در سال های اخیر روشی جدید برای تشخیص و طبقه بندی تصاویر شبکیه چشم بدون نیاز به استخراج ویژگی های آن به صورت دستی مبتنی بر شبکه های عصبی کانولوشنال (CNN) ارایه شده است. در زمینه تشخیص و تصویربرداری پزشکی، به علت کمبود داده های طبقه بندی شده و زمان بر بودن فرآیند آموزش تا یک همگرایی مناسب، آموزش یک شبکه CNN از ابتدا دشوار بوده بنابراین یک روش متداول برای آموزش شبکه های CNN در حوزه پزشکی، بر اساس تنظیم مجدد شبکه های از پیش آموزش یافته، می باشد. برای این منظور در این مقاله، شبکه از پیش آموزش داده شده گوگل نت (GoogLeNet) به عنوان یکی از قوی ترین شبکه های عصبی کانولوشنال بر روی تصاویر شبکیه چشم بانک اطلاعات چشم پزشکی کگل (Kaggle Database) جهت تشخیص رتینوپاتی دیابتی اعمال می شود. همچنین جهت ارزیابی کلینیکی ساختار پیشنهادی، شبکه آموزش دیده جهت تشخیص دیابت چشمی بر روی 101 تصویر شبکیه از کلینیک تخصصی چشم پزشکی نوید دیدگان با موفقیت اعمال گردید.کلید واژگان: دیابت شبکیه، شبکه های عصبی کانولوشنال، شبکه گوگل نت، بانک اطلاعات چشم پزشکی کگلDiabetic Retinopathy (DR) is one of the major complications of Diabetes, which is the injury to the retina of the diabetic patient and causes blindness if not diagnosed in early stages. Various machine learning classification and clustering approaches have been studied in literature with the purpose of improving the accuracy of the screening methods. Some of machine learning classification and clustering approaches are based on manually feature extraction of fundus images by image processing experts. In recent years, a new approach for image classification and diagnosis without using any manual feature extraction is proposed based on convolutional neural network (CNN). In medical imaging and diagnosis, training a deep CNN from scratch is difficult because it requires a large amount of labeled training data and the training procedure is a time consuming task to ensure proper convergence. Therefore, a very common method to train CNNs for medical diagnosis is fine-tuning a pre-trained CNN. In this paper, the pre-trained GoogleNet as a powerful CNN is employed on the Kaggle database for DR diagnosis from retinal images. To assess the efficacy of the clinical results, the proposed CNN algorithm is performed to diagnose DR from the images that are gathered from the the Navid-Didegan ophthalmology clinic.Keywords: diabetic retinopathy, Convolutional neural network (CNN), GoogleNet, Kaggle retinopathy database
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.