autoencoder
در نشریات گروه برق-
خوشه بندی متن، روشی برای جداسازی اطلاعات از دادگان متنی است که می تواند متن را براساس موضوع و احساس طبقه بندی کند و اخیرا مورد توجه بسیاری قرار گرفته است. روش های مبتنی برخوشه بندی عمیق به دلیل دقت بالا، در میان تکنیک های خوشه بندی از اهمیت ویژه ای برخوردار هستند. این روش ها شامل دو جزء اصلی کاهش ابعاد و خوشه بندی می باشد. بسیاری از روش های پیشین عمیق، از خودرمزگذار برای کاهش ابعاد استفاده کرده اند. با این حال، آنها قادر به کاهش ابعاد بر اساس ساختارهای منیفولد نیستند و نمونه هایی که شبیه یکدیگر هستند لزوما در ابعاد پایین نیز در کنار یکدیگر قرار نمی گیرند. در این مقاله، ما یک روش خوشه بندی متن عمیق را براساس یک منیفولد محلی در لایه خودرمزگذار (DCTMA) توسعه می دهیم که از ماتریس های شباهت متعدد برای درنظرگرفتن جهت، اندازه و معنا استفاده می کند، به طوری که ماتریس شباهت نهایی از میانگین این ماتریس ها به دست می آید. ماتریس به دست آمده به لایه بازنمایی پنهان در خودرمزگذار اضافه می شود. هدف اصلی DCTMA تولید بازنمایی های مشابه برای نمونه های متعلق به یک خوشه است. پس از کاهش ابعاد با دقت بالا، خوشه ها با استفاده از خوشه بندی عمیق انتها به انتها شناسایی می شوند. نتایج تجربی نشان می دهد که روش پیشنهادی در مقایسه با روش های پیشرفته فعلی در مجموعه داده های متنی، عملکرد شگفت آوری دارد.
کلید واژگان: خوشه بندی متن، خوشه بندی عمیق، یادگیری عمیق، یادگیری منیفولد، خودرمزگذارText clustering is a method for separating specific information from textual data and can even classify text according to topic and sentiment, which has drawn much interest in recent years. Deep clustering methods are especially important among clustering techniques because of their high accuracy. These methods include two main components: dimensionality reduction and clustering. Many earlier efforts have employed autoencoder for dimension reduction; however, they are unable to lower dimensions based on manifold structures, and samples that are like one another are not necessarily placed next to one another in the low dimensional. In the paper, we develop a Deep Text Clustering method based on a local Manifold in the Autoencoder layer (DCTMA) that employs multiple similarity matrices to obtain manifold information, such that this final similarity matrix is obtained from the average of these matrices. The obtained matrix is added to the bottleneck representation layer in the autoencoder. The DCTMA's main goal is to generate similar representations for samples belonging to the same cluster; after dimensionality reduction is achieved with high accuracy, clusters are detected using an end-to-end deep clustering. Experimental results demonstrate that the suggested method performs surprisingly well in comparison to current state-of-the-art methods in text datasets.
Keywords: Text Clustering, Deep Clustering, Deep Learning, Manifold Learning, Autoencoder -
Due to the high computational cost of the direct numerical simulation methods of the governing equations of some natural phenomena, surrogate models based on machine learning methods such as deep learning algorithms have been commonly interested in modeling these phenomena. This paper proposes a reduced-order model based on a deep-learning algorithm to simulate temperature changes in a two-dimensional field. This model is developed using three different methods, including a framework based on convolutional neural networks, a physics-informed loss function of the phenomenon, and a reduced-order model using the autoencoder method. The model outcomes were compared with the results obtained from a high-resolution finite difference method. The results show that the reduced-order model (with an accuracy of 2.528×10-6 °C) has higher accuracy than the other two models. Meanwhile, the Model-based physics-informed loss is superior to the other two models in terms of steady-state temperature data consumption (only 400 data of size 8×8).
Keywords: Steady-State Heat Transfer, Convolutional Neural Networks, Autoencoder, Reduced Order Model, Mean Squared Error -
در سال های اخیر، کاربرد اینترنت اشیا در جوامع به طور گسترده ای رشد یافته و از طرفی، فناوری جدیدی به نام شبکه های نرم افزارمحور جهت حل چالش های اینترنت اشیا پیشنهاد شده است. چالش های موجود در این شبکه های نرم افزارمحور و اینترنت اشیا موجب گردیده که امنیت SDN-IoT به یکی از نگرانی های مهم این شبکه ها تبدیل شود. از طرف دیگر، الگوریتم های هوشمند فرصتی بوده که به کارگیری آنها در موارد متعددی از جمله امنیت و تشخیص نفوذ، موجب پیشرفت چشم گیری شده است. البته سیستم های تشخیص نفوذ جهت محیط SDN-IoT، همچنان با چالش نرخ هشدار غلط بالا مواجه هستند. در این مقاله یک روش ترکیبی جدید مبتنی بر الگوریتم های هوشمند پیشنهاد شده که جهت دسترسی به نتایج خوبی در زمینه تشخیص نفوذ، الگوریتم های نظارتی دروازه بازگشتی مکرر و طبقه بند غیرنظارتی -k میانگین را ادغام می کند. نتایج شبیه سازی نشان می دهند که روش پیشنهادی با بهره گیری مزایای هر کدام از الگوریتم های ادغام شده و پوشش معایب یکدیگر، نسبت به روش های دیگر مانند روش Hamza دارای دقت بیشتری و بالاخص نرخ هشدار غلط کمتری است. همچنین روش پیشنهادی توانسته نرخ هشدار غلط را به 1/1% کاهش داده و دقت را در حدود 99% حفظ کند.
کلید واژگان: شبکه های نرم افزارمحور، الگوریتم های هوشمند، اینترنت اشیا، تشخیص نفوذ، یادگیری ماشینIn recent years, the use of Internet of Things in societies has grown widely. On the other hand, a new technology called Software Defined Networks has been proposed to solve the challenges of the Internet of Things. The security problems in these Software Defined Networks and the Internet of Things have made SDN-IoT security one of the most important concerns. On the other hand, the use of intelligent algorithms has been an opportunity that these algorithms have been able to make significant progress in various cases such as image processing and disease diagnosis. Of course, intrusion detection systems for SDN-IoT environment still face the problem of high false alarm rate and low accuracy.In this article, a new hybrid method based on intelligent algorithms is proposed. The proposed method integrates the monitoring algorithms of frequent return gate and unsupervised k-means classifier in order to obtain suitable results in the field of intrusion detection. The simulation results show that the proposed method, by using the advantages of each of the integrated algorithms and covering each other's disadvantages, has more accuracy and a lower false alarm rate than other methods such as the Hamza method. Also, the proposed method has been able to reduce the false alarm rate to 1.1% and maintain the accuracy at around 99%.
Keywords: Neural Networks, Spam Detection, Twitter, Autoencoder, Softmax -
To enhance the accuracy of learning models, it becomes imperative to train them on more extensive datasets. Unfortunately, access to such data is often restricted because data providers are hesitant to share their data due to privacy concerns. Hence, it is critical to develop obfuscation techniques that empower data providers to transform their datasets into new ones that ensure the desired level of privacy. In this paper, we present an approach where data providers utilize a neural network based on the autoencoder architecture to safeguard the sensitive components of their data while preserving the utility of the remaining parts. More specifically, within the autoencoder framework and after the encoding process, a classifier is used to extract the private feature from the dataset. This feature is then decorrelated from the other remaining features and subsequently subjected to noise. The proposed method is flexible, allowing data providers to adjust their desired level of privacy by changing the noise level. Additionally, our approach demonstrates superior performance in achieving the desired trade-off between utility and privacy compared to similar methods, all while maintaining a simpler structure.
Keywords: Autoencoder, Collaborative Learning, Deep Neural Networks, Privacy-Utility Trade-Off -
تشخیص نوع بیماری سرطان که به ان زیرگروه گفته می شود در تعیین روند درمان حایز اهمیت فراوانی است. در این مقاله، هدف تشخیص چهار زیرگروه سرطان مغز می باشد. تشخیص زیرگروه بیماری را می توان در قالب یک مسئله طبقه بندی مدل کرد. با توجه به پیشرفت های چشمگیر صورت گرفته در علم بیوانفورماتیک در استخراج اطلاعات ژنتیکی از بدن انسان، اخیرا از این اطلاعات در توصیف بیماران در یادگیری ماشین استفاده زیادی می شود. در این مقاله از سه نوع داده ژنی شامل mRNA، miRNA و متیلاسیون DNA استفاده شده است. ترکیب منابع مختلف اطالاعاتی در قالب داده های چندوجهی به جای استفاده از یک منبع اطلاعاتی واحد، به افزایش دقت طبقه بندی اطلاعات منجر می شود. برای استخراج ویژگیهای مطلوب تر از داده های ژنی، از خودرمزگذار استفاده شده است بطوریکه ویژگی های استخراج شده از خودرمزگذار، به عنوان تقویت کننده در کنار داده های ژنی اولیه قرار می گیرند. همچنین جنگل تصادفی به عنوان یک طبقه بندی کننده در طبقه بندی بیماران بر مبنای داده های ژنی عملکرد مطلوبی داشته است. با گسترش روش های عمیق در شبکه های عصبی و عملکرد مطلوب آنها، نسخه ای از جنگل تصادفی عمیق با ساختار لایه ای ارائه شده است. جنگل تصادفی عمیق دارای این مزیت است که در کنار عملکرد مطلوب در طبقه بندی اطلاعات، تعداد پارامتر محدودی داشته و پیچیدگی محاسباتی آن پایین تر است. در این مقاله از جنگل تصادفی عمیق برای تعیین زیرگروه نوعی از سرطان مغز استفاده شده است. نتایج آزمایش ها نشان دهنده عملکرد مطلوب روش پیشنهادی است.کلید واژگان: بیوانفورماتیک، طبقه بندی اطلاعات، خودرمزگذار، جنگل تصادفی عمیق، استخراج ویژگی، داده های ژنی، GBM، TCGADiagnosing the type of cancer, which is called the subtype, is very important in determining the treatment process. This paper focuses on the diagnose of the four subtypes of the brain cancer. Disease subtype diagnosis can be modeled as a classification problem. Due to the significant progress made in bioinformatics in extracting genetic information from the human body, recently this information is widely used in the representing of patients in machine learning. In this paper, three types of genetic information including mRNA, miRNA and DNA methylation are used.It should be noted that combining different information sources in the form of multimodal data instead of using a single information source increases the accuracy of information classification. To extract more desirable features from the original genetic data, auto-encoder has been used so that the features extracted from auto-encoder are concatenated to the original genetic data.Random forest has performed well as a classifier in classifying patients based on genetic information. By extending deep methods in neural networks and their good performance, a version of deep random forest with layered structure has been proposed. The deep random forest has the advantage that has a limited number of parameters and lower computational complexity in addition to the optimal performance in information classification. In this paper, deep random forest is used to determine the subtype of a special type of brain cancer. The experiment results show the desired performance of the proposed method.Keywords: Bioinformatics, Classification, Autoencoder, Deep Forest, Feature Extraction, TCGA
-
نشریه مهندسی برق و مهندسی کامپیوتر ایران، سال بیست و چهارم شماره 4 (پیاپی 83، زمستان 1402)، صص 284 -290
امروزه شبکه های اجتماعی، نقش مهمی در گسترش اطلاعات در سراسر جهان دارند. توییتر یکی از محبوب ترین شبکه های اجتماعی است که در هر روز 500 میلیون توییت در این شبکه ارسال می شود. محبوبیت این شبکه در میان کاربران منجر شده تا اسپمرها از این شبکه برای انتشار پست های هرزنامه استفاده کنند. در این مقاله برای شناسایی اسپم در سطح توییت از ترکیبی از روش های یادگیری ماشین استفاده شده است. روش پیشنهادی، چارچوبی مبتنی بر استخراج ویژگی است که در دو مرحله انجام می شود. در مرحله اول از Stacked Autoencoder برای استخراج ویژگی ها استفاده شده و در مرحله دوم، ویژگی های مستخرج از آخرین لایه Stacked Autoencoder به عنوان ورودی به لایه softmax داده می شوند تا این لایه پیش بینی را انجام دهد. روش پیشنهادی با برخی روش های مشهور روی پیکره متنی Twitter Spam Detection با معیارهای Accuracy، -Score1F، Precision و Recall مورد مقایسه و ارزیابی قرار گرفته است. نتایج تحقیق نشان می دهند که دقت کشف روش پیشنهادی به 1/78% می رسد. در مجموع، این روش با استفاده از رویکرد اکثریت آرا با انتخاب سخت در یادگیری ترکیبی، توییت های اسپم را با دقت بالاتری نسبت به روش های CNN، LSTM و SCCL تشخیص می دهد.
کلید واژگان: توییتر، شناسایی اسپم، شبکه عصبی، Autoencoder، SoftmaxToday, social networks play a crucial role in disseminating information worldwide. Twitter is one of the most popular social networks, with 500 million tweets sent on a daily basis. The popularity of this network among users has led spammers to exploit it for distributing spam posts. This paper employs a combination of machine learning methods to identify spam at the tweet level. The proposed method utilizes a feature extraction framework in two stages. In the first stage, Stacked Autoencoder is used for feature extraction, and in the second stage, the extracted features from the last layer of Stacked Autoencoder are fed into the softmax layer for prediction. The proposed method is compared and evaluated against some popular methods on the Twitter Spam Detection corpus using accuracy, precision, recall, and F1-score metrics. The research results indicate that the proposed method achieves a detection of 78.1%. Overall, the proposed method, using the majority voting approach with a hard selection in ensemble learning, outperforms CNN, LSTM, and SCCL methods in identifying spam tweets with higher accuracy.
Keywords: Neural networks, spam detection, Twitter, Autoencoder, softmax -
Recognizing the emotions from speech signals is very important in different applications of human-computer-interaction (HCI). In this paper, we present a novel model for speech emotion recognition (SER) based on new multi-task parallel convolutional autoencoder (PCAE) and transformer networks. The PCAEs have been proposed to generate high-level informative harmonic sparse features from the input. With the aid of the proposed parallel CAE, we can extract nonlinear sparse features in an ensemble manner improving the accuracy and the generalization of the model. These PCAEs also address the problem of the loss of initial sequential information during convolution operations for SER tasks. We have also proposed using a transformer in parallel with PCAEs to gather long-term dependencies between speech samples and make use of its self-attention mechanism. Finally, we have proposed a multi-task loss function made up of two terms of classification and AE mapper losses. This multi-task loss tries not only to reduce the classification error but also the regression error caused by the PCAEs which also work as mappers between the input and output Mel-frequency-cepstral-coefficients (MFCCs). Thus, we can both focus on finding accurate features with PCAEs and improving the classification results. We have evaluated our proposed method on the RAVDESS SER dataset in different terms of accuracy, precision, recall, and f1-score. The average accuracy of the proposed model on eight emotions outperforms all the recent baselines.Keywords: Speech Emotion Recognition, Mel Frequency Cepstral Coefficients, Autoencoder, Transformer, Multi-Task Deep Learning
-
Utilizing IoT technologies for monitoring large-scale smart facilities such as power, water and gas distribution networks has been the subject of many studies recently. The aim is to detect anomalous events in the network due to elements’ failure, bad designs, attacks or abuses of the network and alert the network operators in a timely manner. As the centralized cloud-based approaches are impractical in time-critical and real-time anomaly detection applications due to 1) high sensor-to-cloud transmission latency 2) high communication cost and 3) high energy consumption at the sensor nodes, the distributed anomaly detection methods based on Deep Neural Networks (DNN) have been applied in past studies vastly. In these methods, in order to detect anomalies in real-time, copies of the anomaly detection model are placed at the sensor nodes (rather than placing one at the cloud node) reducing the sensor-to-cloud transmissions significantly. Nevertheless, new normal samples collected at the sensor nodes still need to be transmitted to the cloud node at predefined intervals to re-train the distributed anomaly detection DNNs. In order to minimize these sensor-to-cloud transmissions during the retraining process, in this paper, two well-known lossless coding algorithms: Huffman Coding and Arithmetic Coding were studied and it was observed that the Huffman and Arithmetic Coding were able to reduce the transmission traffic up to 50% and 75% respectively using two IoT benchmark datasets of pipeline measurements. Besides, the Huffman Coding shown to be computationally feasible on resource limited sensors and resulted in up to 10% saving in energy consumption on each sensor resulting in longer network longevity. Moreover, the experimental results showed that the auto-encoder DNN could outperform the one-class SVM in the iterative distributed anomaly detection method.
Keywords: Distributed Anomaly Detection, AutoEncoder, SVM, Coding Algorithm, IoT -
Video anomaly detection by reconstruction is a challenging task. One of its challenges is related to the volume of input data frames needed to be processed to detect anomalies. The challenge usually manifests itself as increased training and especially testing time. The proposed architecture boosts performance while maintaining the same test time as our previously introduced AnoDetNet architecture. The proposed architecture is a cascaded framework that is a succession of reconstruction and an auxiliary network. Upon training, the auxiliary network acts as guidance through the use of combined loss. The combined training of the networks results in a performance increase compared with the reconstruction case alone. Considering that the auxiliary network's results are not used in the test phase, the overall anomaly detection test time does not change compared with the non-cascaded architecture. Two possible auxiliary networks, namely edge detection and optical flow estimation are studied. The proposed architecture results in state-of-the-art results on the Ped2 and Avenue datasets.
Keywords: Video anomaly detection, Deep Learning, Cascade network, Neural Network, Autoencoder, optical flow -
با توجه به رشد روزافزون رویکردهای داده محور، به ویژه در هوش مصنوعی و یادگیری ماشین، استخراج اطلاعات مناسب از داده های جمع آوری شده با بهترین عملکرد چالشی قابل ملاحظه است. جنبه مهم دیگر این موضوع هزینه های ذخیره سازی است. تحلیل مولفه اصلی (PCA) و خودرمزگذارها (AEs) نمونه هایی از روش های ا ستخراج ویژگی در علم داده و یادگیری ما شین ه ستند که به طور گ سترده در رویکردهای مختلف ا ستفاده می شوند. مقاله ارایه شده، از مزایای خودرمزگذارها و تحلیل مولفه ا صلی برای ارایه روش انتخاب و ا ستخراج ویژگی تحت نظارت برخط بهره گرفته ا ست. بر این اسااا ، برچساابهای مورد نظر برای مدل نهایی در فرآیند اسااتخراج ویژگی نقش دارند و در روش تحلیل مولفه اصاالی نیز تعبیه میشااوند. همچنین انبا شتن لایه های رمزگذار خودکار غیرخطی با الگوریتم تحلیل مولفه ا صلی، انتخاب ه سته در روش های تحلیل مولفه ا صلی مبتنی بر ه سته قدیمی را حذف می کند. علاوه بر این، بهبود عملکرد توسط نتایج تجربی ارایه شده است. مزیت اصلی روش پیشنهادی این است که، برخلاف رویکردهای سنتی تحلیل مولفه اصلی، مدل ارایه شده، هیچ نیازی برای همه نمونه ها برای استخراج ویژگی ندارد. با توجه به کارهای قبلی، روش پیشنهادی میتواند از نظر دقت و اعتبار برای استخراج ویژگی از دیگر روش های پیشرفته برتر باشد .
کلید واژگان: تحلیل مولفه اصلی، تحلیل مولفه اصلی برخط، خودرمزگذار، خودرمزگذار پشتهای، یادگیری نیمه نظارتیDue to the growing number of data-driven approaches, especially in artificial intelligence and machine learning, extracting appropriate information from the gathered data with the best performance is a remarkable challenge. The other important aspect of this issue is storage costs. The principal component analysis (PCA) and autoencoders (AEs) are samples of the typical feature extraction methods in data science and machine learning that are widely used in various approaches. The current work integrates the advantages of AEs and PCA for presenting an online supervised feature extraction selection method. Accordingly, the desired labels for the final model are involved in the feature extraction procedure and embedded in the PCA method as well. Also, stacking the nonlinear autoencoder layers with the PCA algorithm eliminated the kernel selection of the traditional kernel PCA methods. Besides the performance improvement proved by the experimental results, the main advantage of the proposed method is that, in contrast with the traditional PCA approaches, the model has no requirement for all samples to feature extraction. As regards the previous works, the proposed method can outperform the other state-of-the-art ones in terms of accuracy and authenticity for feature extraction.
Keywords: Principal Component Analysis (PCA), online PCA, autoencoder, stacked autoencoder, semi-supervised learning -
Industrial control systems are widely used in industrial sectors and critical infrastructures to monitor and control industrial processes. Recently, the security of industrial control systems has attracted a lot of attention, because these systems are now increasingly interacting with the Internet. Classic systems are suffering from many security problems and with the expansionof Internet connectivity, they are now exposed to new types of threats and cyber-attacks. Addressing this, intrusion detection technology is one of the most important security solutions that is used in industrial control systems to identifypotential attacks and malicious activities. In this paper, we propose Stacked Autoencoder-Deep Neural Network (SAE-DNN), as a semi-supervised Intrusion Detection System (IDS) with appropriate performance and applicability on a wide range of Cyber-Physical Systems (CPSs). The proposed approach comprises a stacked autoencoder, a deep learning-based feature extractor, helping us with a low dimension and low noise representation of data. In addition, our system includes a deep neural network (DNN)-based classifier, which is used to detect anomalies with a high detection rate and low false positive rate in a real-time process. The SAE-DNN’s performance is evaluated on the WADI dataset, which is a real testbed for a water distribution system. The results indicate the superior performance of our approach over existing supervised and unsupervised methods while using a few percentages of labeled data.
Keywords: Autoencoder, Cyber-attack, Industrial Control Systems, Intrusion Detection System, Deep Learning -
با توجه به هزینه زمانی و محاسباتی بالای روش های حل مستقیم یا عددی معادلات دیفرانسیل حاکم بر پدیده ها، پژوهش حاضر به ارایه روشی بدون معادله و مبتنی بر الگوریتم های یادگیری عمیق با استفاده از روش های کاهش بعد می پردازد. دو روش تحلیل مولفه های اصلی (خطی) و خودرمزنگار (غیرخطی) برای شبیه سازی پدیده انتقال حرارت پایا با استفاده از مجموعه داده های انتقال حرارت پایای دو بعدی در ابعاد 64×64 و 128×128 بکار رفت و از طریق ابزارها و کتابخانه های موجود در محیط پایتون پیاده سازی شد. طبق نتایج حاصل، در کاهش مرتبه شدید، خودرمزنگار و در کاهش مرتبه جزیی، تحلیل مولفه های اصلی دقت بالاتری دارد. همچنین خروجی های حاصل از مدل رتبه کاسته پیشنهادی با شبیه سازی های حاصل از مدلی مبتنی بر شبکه عصبی کانولوشنی با تعداد لایه ها و فیلترهای متعدد مقایسه شد. نتایج حاصل از شبیه سازی توزیع دمای پایا برحسب خطای میانگین مربعات (MSE) با استفاده از مدل های مبتنی بر تحلیل مولفه های اصلی، خودرمزنگار و مدل مبتنی بر شبکه های عصبی کانولوشنی در ابعاد 64×64 به ترتیب برابر با 4-10×617/1، 6-10×528/2 و 015/0 و در ابعاد 128×128 نیز برابر با 4-10×046/2، 6-10×253/7 و 0058/0 درجه سلسیوس در هر پیکسل است. بنابراین، مدل های رتبه کاسته پیشنهادی به ویژه مدل مبتنی بر روش خودرمزنگار از دقت بسیار بالاتری نسبت به مدل مبتنی بر شبکه های عصبی کانولوشنی برخوردار می باشد.
کلید واژگان: مدلسازی انتقال حرارت پایا، کاهش مرتبه، تحلیل مولفه های اصلی، خودرمزنگار، خطای میانگین مربعاتSince the formation and Direct solving the governing equations requires high time and computational cost, this study seeks to provide an equation free model based on deep learning algorithm that simulates steady state heat transfer in two-dimensional space and a relatively large size using order reduction method. Principal component analysis is a linear method and autoencoder is a nonlinear methods. The results of comparing their performance on different data sets showed that in reducion of order to very low dimensions, autoencoder and in reducion of order to very high dimensions, principal component analysis has a higher accuracy. Of course, the number of dimensions to order reduction and the characteristics of the data set such as size and number of dimensions of the data will affect the accuracy of the dimensional reduction. These two methods were used to order reduction of thermal data in order to faster simulate the phenomenon of Steady State Heat Transfer and were compared with a model based on convolutional neural network with a number of layers and multiple filters. The results showed that the models based on order reduction methods have much less computational volume and simulation time, and the outputs obtained from them, especially the model based on the autoencoder method, have a much higher accuracy.
Keywords: Steady state heat transfer modeling, Order reduction, Principal component analysis, Autoencoder, Mean squared error -
اخیرا تعداد زیادی الگوریتم بر پایه ی ماشین یادگیری سریع برای آموزش دادن ساختار های شبکه های عصبی عمیق معرفی شده اند .اتوانکدر مبتنی بر ماشین یادگیری سریع یکی از این الگوریتم هاست که برای ایجاد ساختار چندلایه و تعیین پارامترهای هر لایه از مدل معرفی شده است. در الگوریتم آموزش اتوانکدر مبتنی بر یادگیری سریع، وزنها در لایه اول به صورت تصادفی مقدار دهی می شوند که باعث ایجاد خطای بازسازی می شود. فرایند تکراری استفاده از این اتوانکدر ها منجر به پخش خطا درساختار عمیق شده و منجر به کاهش کارایی کل مدل خواهد شد. در این مقاله یک اتوانکدرچندلایه برای تعیین پارامترهای یک شبکه عصبی عمیق ارایه شده است. همچنین یک الگوریتم نوین برای آموزش این مدل معرفی می شود که از پخش خطا جلوگیری می کند. به منظور افزایش کارایی مدل به جای مقداردهی تصادفی پارامترهای اولین از یک اتوانکدر تکرار شونده بهره می بریم که در یک فرایند تکراری پارامترهای اولین لایه را به بهترین حالت تعیین می کند. برای طبقه بندی داده ها به کمک ویژگی های استخراج شده، از یک ماشین یادگیری سریع تک لایه استفاده شده است. آزمایش ها برای طبقه بندی داده ها نشان می دهد که روش پیشنهادی میانگین دقت روی همه ی مجموعه داده ها را به ترتیب به میزان 4%، 26%، 17% و 31% نسبت به روش های موجود بهبود داده است. برای نشان دادن کارایی اتوانکدر چندلایه از این مدل برای بازسازی تصاویر استفاده شده است و نتایج دیداری نشان دهنده ی کارایی بهتر روش پیشنهادی در بازسازی تصاویر می باشد.
کلید واژگان: ماشین یادگیری سریع، طبقهبندی، اتوانکدر، بازسازی تصاویرRecently, a number of Extreme Learning Machine (ELM) based training algorithms have been introduced for training deep neural network structures. ELM based Auto-Encoder (ELM-AE) is one such algorithm that has been used for making multilayer structures and tuning parameters of each layer. In a simple ELM-AE training algorithm, the weights of the first layer are initialized randomly. This issue is a leading factor in producing reconstruction error. The frequent use of ELM-AE in deep network layers results in propagating such errors through deep structures and in decreasing performance as a consequent. In this paper, we introduce a multilayer structure and a new learning algorithm to train it that prevents error propagation. In order to boost the performance of the model, the parameters in the first layer are initialized by a novel type of ELM-AE called Repeated-AE (RAE) rather than by a random selection method. This RAE-based technique determines the parameters in the first layer far better than do the other ELM-AE existed methods. Next, a single hidden layer ELM is applied for handling the classification task. Experimental results for data classification show that the proposed method outperforms some other methods in terms of the average accuracy over all datasets by amounts of 4%, 26%, 17% and 31%. Eventually, so as to verify the performance of the proposed multilayer ELM-AE in application, we used this model to reconstruct images. The reconstructed images obtained by our approach appeared visually a lot better compared to those obtained by the other methods do.
Keywords: extreme learning machine, Classification, autoencoder, reconstruct image -
کشف ناهنجاری به معنای یافتن نمونه هایی است که با اکثریت هنجار و عادی داده ها تفاوت دارند. یکی از اساسی ترین چالش هایی که در سر راه انجام این کار مهم وجود دارد این است که نمونه های برچسب خورده، به ویژه برای کلاس ناهنجار کمیاب و گاه نایاب هستند. ما در این مقاله روشی را پیشنهاد می کنیم که برای کشف ناهنجاری تنها از داده های هنجار استفاده می کند. این روش بر مبنای شبکه های عصبی تاسیس شده که کد کننده خودکار نام دارند و در مطالعات یادگیری عمیق موردتوجه هستند. یک کد کننده خودکار ورودی خود را در خروجی بازتولید کرده و خطای بازسازی را به عنوان رتبه ناهنجاری مورداستفاده قرار می دهد. ما برای ساخت کد کننده، به جای نورون های معمولی از بلوک های LSTM استفاده کرده ایم. این بلوک ها درواقع نوعی از شبکه های عصبی بازگشتی هستند که در کشف و استخراج وابستگی های زمانی و مجاورتی مهارت دارند. نتیجه به کارگیری کد کننده خودکار مبتنی بر بلوک های LSTM برای کشف ناهنجاری نقطه ای در ده نمونه از دادگان های رایج نشان می دهد که این روش در استخراج مدل درونی داده های هنجار و تشخیص داده های ناساز موفق بوده است. معیار AUC مدل مذکور، تقریبا در تمامی موارد از AUC یک کد کننده خودکار معمولی و روش مشهور ماشین بردار پشتیبان تک کلاسه یا OC-SVM بهتر است.
کلید واژگان: کشف ناهنجاری، کد کننده خودکار، LSTM، یادگیری عمیقAnomaly detection means detecting samples that are different from the normal samples in the dataset. One of the great challenges in this area is finding labeled data, especially for the abnormal categories. In this paper, we propose a method that uses normal data to detect anomalies. This method is based on established neural networks which are called automated encoder and are considered in deep learning studies. An automated encoder reproduces its input as output and reconstruction deviation to rate anomalies. We have used LSTM blocks to construct encoder instead of using ordinary neurons. In fact, these blocks are a category of recurring neural networks that are specialized in discovering and fetching time and proximity dependencies. The result of employing an automated encoder using LSTM blocks to detect point anomalies shows that this approach has been promising and successful in extracting the normal data’s internal model and also detecting anomalous data. The AUC factor of the model, in almost all cases, is better than the AUC of an ordinary automated encoder and One Class Support Vector Machine (OC-SVM).
Keywords: Anomaly Detection, AutoEncoder, LSTM, Deep Learning -
در شبکه های هوشمند آینده، اطلاع از قیمت بازار برق برای هدایت رفتار مصرف کنندگان و تولیدکنندگان ضروری است. در این مقاله روش ترکیبی پیش بینی میان مدت قیمت برق در بازار تجدید ساختار شده با استفاده از ماشین بردار پشتیبان و شبکه های عصبی ارائه شده است. در این روش ابتدا حد زیاد برای قیمت ها در نظر گرفته می شود؛ سپس مجموعه آموزش به دو قسمت جهش های قیمت و قیمت های معمولی تقسیم می شود. پس از آن، روی داده های ورودی عملیات استخراج ویژگی با استفاده از اتوانکدرهای به هم چسبیده انجام می گیرد و با استفاده از هر یک از مجموعه های آموزش، مدل تخمین آموزش داده می شود. مدل های بردار پشتیبان با توابع کرنل مختلف و شبکه عصبی دولایه پیشخور با استفاده از روش پیشنهادی، آموزش و آزموده می شوند. نتایج شبیه سازی با استفاده از روش پیشنهادی نشان می دهند این روش در افزایش سرعت آموزش مدل تاثیر چشم گیری دارد و موجب بهبود دقت پیش بینی می شود.
کلید واژگان: اتوانکدر، پیش بینی قیمت برق، شبکه عصبی پیشخور، ماشین بردار پشتیبانIn future smart grids, it's imperative to know the price of electricity market to guide the behavior of consumers and suppliers. This paper presents a hybrid approach for mid-term electricity price forecasting based on support vector machine and neural networks. In this method, at first, the price upper bound is considered. Then, the training set is divided into two parts including normal price and price spikes. Feature extraction applies on input data sets using stacked auto-encoders and a prediction model trained using each training set. Support Vector Machine (SVM) models with different kernel functions and a two layered feed-forward neural network were trained and tested with the proposed method. Simulation results using the proposed method show that this method has a significant effect on the speed of model training and improves forecasting accuracy.
Keywords: Autoencoder, Electricity Price Forecasting, Feed-Forward Neural Network, Support Vector Machine (SVM)
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.