deep learning
در نشریات گروه برق-
در این مقاله یک سیستم تشخیص خودکار موارد مبتلا به کوید-19 مبتنی بر اینترنت اشیا پیشنهاد می شود. در مدل پیشنهادی ابتدا با استفاده از فن آوری اینترنت اشیا تصاویر پزشکی مستقیم پس از مراجعه فرد مشکوک از طریق تجهیزات پزشکی مجهز به اینترنت اشیا به مخزن داده ارسال می شود. سپس به منظور کمک به متخصصین رادیولوژی برای تفسیر هرچه بهتر تصاویر پزشکی از چهار مدل شبکه عصبی پیچشی از پیش آموزش دیده به نام های InceptionResNetV2، InceptionV3، VGG19 و ResNet152 و دو مجموعه داده تصاویر پزشکی رایولوژی قفسه سینه و CT Scan در یک طبقه بندی سه کلاسه برای پیش بینی دقیق موارد مبتلا به کوید-19، افراد سالم و موارد مبتلا بیماری استفاده می شود. درنهایت بهترین نتیجه به دست آمده برای تصاویر CT Scan متعلق به معماری InceptionResNetV2 با دقت 99.366% و برای تصاویر رادیولوژی مربوط به معماری InceptionV3 با دقت 96.943% می باشد. نتایج نشان می دهد این سیستم منجر به کاهش مراجعه روزانه به مراکز درمانی و در نتیجه کاهش فشار بر سیستم مراقبت های درمانی می شود. همچنین به متخصصین رایولوژی و کادر درمان کمک می کند تا هرچه سریعتر بیماری شناسایی شود.
کلید واژگان: پردازش تصویر، هوش مصنوعی، اینترنت اشیا، شبکه عصبی پیچشی، یادگیری عمیقIn this paper, we propose an automatic detection system for COVID-19 cases based on the Internet of Things. In the proposed model, first, using Internet of Things technology, medical images are sent directly to the data collection after the suspicious person's visit through medical equipment equipped with Internet of Things, and then, in order to help radiologists to interpret medical images better, usage has been made of four pre-trained convolutional neural network models i.e. InceptionV3, InceptionResNetV2, VGG19 and ResNet152 as well as two datasets of chest radiology medical images and CT Scan in a 3-class classification for accurate prediction of cases suffering from COVID-19, healthy people, and diseased cases. Finally, the best result for CT-Scan images is related to InceptionResNetV2 architecture with an accuracy of 99.366%, and for radiology images related to the InceptionV3 architecture, it is 96.943%. The results show that this system leads to a reduction in daily visits to medical centers and thus reduces the pressure on the medical care system. It also helps rheology specialists to identify the disease as quickly as possible.
Keywords: Image Processing, Artificial Intelligence, Internet Of Things, Convolutional Neural Network, Deep Learning -
The lack of access to reliable databases, as well as the small number and imbalance of databases, is one of the main limitations of using machine learning methods in power systems, which can reduce efficiency and cause distrust in the results obtained from these methods. One of the solutions used to solve this problem is the use of Synthetic data generation. Two deep generative architectures, Generative Adversarial Network (GAN) and Variational Auto Encoder (VAE), are currently used to generate synthetic data. Due to the novelty and importance of the subject, until now, a comparative study has not been done on the research conducted in this field, in terms of subject classification, with an emphasis on validation methods of synthetic production databases. The purpose of this research is to review the studies done in this field up to now and examine the research trends for the future. In this regard, after introducing the principles of GAN and VAE deep architectures, the subject of synthetic data generation using the mentioned methods in power systems has been studied comparatively.Keywords: Synthetic Data, Deep Learning, Generative Adversarial Network, Variational Auto Encoder, Power Systems
-
Accurate prediction of stock market trends is crucial for informed investment decisions and effective portfolio management, ultimately leading to enhanced wealth creation and risk mitigation. This study proposes a novel approach for predicting stock prices in the stock market by integrating Convolutional Neural Networks (CNN) and Long Short-Term Memory (LSTM) networks, using sentiment analysis of social network data and candlestick data (price). The proposed methodology consists of two primary components: sentiment analysis of social networks and candlestick data. By amalgamating candlestick data with insights gleaned from Twitter, this approach facilitates a more detailed and accurate examination of market trends and patterns, ultimately leading to more effective stock price predictions. Additionally, a Random Forest algorithm is used to classify tweets as either positive or negative, allowing for a more subtle and informed assessment of market sentiment. This study uses CNN and LSTM networks to predict stock prices. The CNN extracts short-term features, while the LSTM models long-term dependencies. The integration of both networks enables a more comprehensive analysis of market trends and patterns, leading to more accurate stock price predictions.
Keywords: Stock Price Prediction, Deep Learning, Sentiment Analysis, Long Short-Term Memory, Convolutional Neural Network -
In today's world, improving the quality and clarity of videos has become increasingly important, particularly in the fields of surveillance, medicine, and imaging technologies. Traditional super-resolution methods primarily focus on the full reconstruction of video frames, which poses challenges in preserving fine details and complex structures. This paper introduces a novel approach based on parallel deep networks, effectively enhancing video quality by dividing video frames into three separate input branches: raw images, outputs based on Hidden Markov Random Fields (HMRF), and temporal images. The method also leverages techniques such as residual learning and random patching within a unified framework that combines spatial segmentation (HMRF) and temporal information. This integration allows the model to better capture spatial and temporal dependencies, leading to more accurate and efficient video frame reconstruction. To better focus on high-frequency details and mitigate the vanishing gradient problem, residual learning is employed, enabling the network to estimate only the additional details necessary for reconstructing high-resolution images. Additionally, through random patching, the network training process is designed to emphasize critical features and intricate textures. Experimental results demonstrate that the proposed method achieves an SSIM of 0.92857 and a PSNR of 34.8617, offering superior clarity in video reconstruction.Keywords: Super-Resolution, Deep Learning, Hidden Markov Random Fields, Residual Learning, Random Patching
-
در این مقاله، یک سیستم کارآمد تشخیص نفوذ برای اینترنت اشیا (IoT) ارائه شده است که به چالش گره های IoT آلوده به بدافزارهای مختلف و تبدیل شدن هر دستگاه هوشمند به گره حمله کننده بات نت می پردازد. همچنین، مسائل موجود در سیستم های تشخیص نفوذ فعلی، مانند انتخاب ویژگی های هوشمند، عدم تعادل مجموعه داده های آموزشی و تمرکزگرایی را نیز مد نظر قرار می دهد. سیستم پیشنهادی از معماری توزیع شده شبکه های نرم افزارمحور (SDN) بهره می برد. روش پیشنهادی با متعادل سازی مجموعه داده ها با استفاده از تکنیک SMOTE آغاز می شود. سپس، ویژگی های اساسی با استفاده از الگوریتم بهینه سازی کرکس آفریقایی انتخاب می شوند. در مرحله بعد، یک مدل یادگیری عمیق LSTM در کنترلر SDN آموزش داده می شود. سوئیچ های SDN از این مدل آموزش دیده برای تشخیص حملات استفاده می کنند. برای بهبود مقابله با حملات، آدرس های گره های حمله کننده بین سوئیچ های SDN به اشتراک گذاشته می شوند، که تشخیص سازگار را تضمین کرده و امکان جلوگیری موثر از حملات منع سرویس توزیع شده (DDoS) را در سراسر شبکه فراهم می کند. نتایج تجربی به دست آمده در MATLAB، با استفاده از مجموعه داده NSL-KDD، اثربخشی روش پیشنهادی را نشان می دهد و دقت 99.34٪، حساسیت 99.16٪ و دقت 98.93٪ را در تشخیص حملات به دست می آورد. روش پیشنهادی عملکرد بهتری نسبت به روش های انتخاب ویژگی مبتنی بر الگوریتم های WOA، HHO و AO، و روش های یادگیری عمیق مانند LSTM، RNN و CNN، به ویژه در تشخیص حملات DDoS، دارد.
کلید واژگان: اینترنت اشیاء، یادگیری عمیق، شبکه SDN، حملات Ddos، سیستم تشخیص نفوذThis paper introduces an efficient intrusion detection system for the Internet of Things, addressing the challenge of malware-infected IoT nodes acting as botnet attackers, along with issues in existing intrusion detection systems such as feature selection, data imbalance, and centralization. The proposed system leverages the distributed architecture of SDN. The method begins by balancing the dataset using the SMOTE technique. Essential features are then selected using the African Vulture Optimization Algorithm. Subsequently, an LSTM deep learning model is trained within the SDN controller. SDN switches utilize this trained model for attack detection. To enhance attack mitigation, attacking node addresses are shared among SDN switches, ensuring consistent recognition and enabling effective Distributed Denial-of-Service (DDoS) attack prevention across the network. Experimental results obtained in MATLAB, using the NSL-KDD dataset, demonstrate the proposed method’s effectiveness, achieving an accuracy of 99.34%, a sensitivity of 99.16%, and a precision of 98.93% in attack detection. The proposed method outperforms feature selection methods based on WOA, HHO, and AO algorithms, and deep learning methods like LSTM, RNN, and CNN, particularly in detecting DDoS attacks.
Keywords: Internet Of Things, Ddos Attacks, Deep Learning, Intrusion Detection System, SDN Network -
This paper presents a Multi-Head Self-Attention Fusion Network (MHSA-FN) for real-time crop disease classification, addressing key limitations in existing models, including suboptimal feature extraction, inefficient feature recalibration, and weak multi-scale fusion. Unlike prior works that rely solely on CNNs or transformers, MHSA-FN integrates MobileNetV2, EfficientNetV2, and Vision Transformers (ViTs) with a structured multi-level attention framework for enhanced feature learning. A gated fusion mechanism and a Multiscale Fusion Module (MSFM) optimize local texture details and global spatial relationships. The model was trained on a combined dataset of PlantVillage and locally collected images, improving adaptability to real-world conditions. It achieved 98.66% training accuracy and 99.0% test accuracy across 76 disease classes, with 99.34% precision, 99.01% recall, and 99.04% F1 score. McNemar’s test (p = 0.125) and Bayesian superiority probability (0.851) validated its robustness. Confidence variance analysis (0.000010) outperformed existing models, demonstrating MHSA-FN as a scalable, high-performance AI solution for precision agriculture in resource-constrained environments.Keywords: Crop Disease Detection, Vision Transformers, Convolutional Neural Networks, Multimodal Fusion, Deep Learning
-
Scientia Iranica, Volume:31 Issue: 21, Nov-Dec 2024, PP 1939 -1947Plant diseases are a signi cant concern in agriculture, contributing to as much as 16% of global agricultural losses. This poses serious threats to food security, especially for crops like bananas, which are highly vulnerable to diseases such as Xanthomonas Wilt and Sigatoka leaf spot. These diseases have the potential to cause complete yield losses, reaching up to 100%. Addressing these challenges is crucial, and this study aims to do so by developing a robust disease detection model. Leveraging Convolutional Neural Network (CNN) algorithms, we have created a sophisticated system capable of accurately identifying and categorizing diseases in banana plants. To train our model e ectively, we have gathered a meticulously curated dataset of banana plant leaf images from regions heavily a ected by these diseases. This dataset has been carefully categorized into three groups: Healthy, Xanthomonas Wilt infected, and Sigatoka leaf spot infected. Employing advanced techniques such as data augmentation and transfer learning, we have netuned our model using various architectures including MobileNet, EcientNet, VGG16, VGG19, and InceptionV3. Our research ndings highlight the exceptional performance of the VGG16 model, achieving an impressive classi cation accuracy of 81.53% during rigoroustesting with independent datasets. Looking to the future, we recognize the need for further improvements in model performance. This includes acquiring a more diverse and expansive dataset and implementing automatic hyperparameter selection methods.Keywords: Convolutional Neural Network, Deep Learning, Plant Disease Detection, Xanthomonas Wilt, Sigatoka Leaf Spot, SDG
-
Journal of Artificial Intelligence in Electrical Engineering, Volume:13 Issue: 51, Autumn 2024, PP 55 -64
Social networks have become the primary platforms for information dissemination, significantly influencing user interactions and shaping information trends. Understanding how information spreads in these networks is crucial not only for optimizing recommendation algorithms and digital marketing strategies but also for identifying fake news and analyzing user influence. This paper provides a comprehensive review of information diffusion models, analyzing the strengths and weaknesses of traditional approaches such as probabilistic, deterministic, and influence-based models. Subsequently, a Hybrid Deep Learning Model (DLHM) is proposed, integrating Graph Neural Networks (GNNs) for modeling user relationships and Reinforcement Learning (RL) for optimizing the diffusion process. This combination enables the model to learn complex network structures while dynamically selecting optimal strategies for maximizing information spread. Experimental results indicate that the proposed model improves prediction accuracy by 25% compared to classical models and performs better in terms of scalability in large-scale networks. These findings demonstrate that combining deep learning with classical models can significantly enhance the analysis and prediction of information diffusion in social networks.
Keywords: Information Diffusion, Social Networks, Diffusion Models, Deep Learning, Graph Neural Networks -
Power-electronic converters play a crucial role in the functioning of microgrids. However, these converters, characterized by their low inertia, present a significant challenge to maintaining a consistent frequency in islanded microgrids. To address this issue, an innovative concept known as virtual inertia control (VIC) has emerged as a promising solution for enhancing frequency stability in islanded microgrids. The VIC system does not perform well against disturbances and uncertainty related to microgrid parameters. Therefore, to overcome these problems, it needs a suitable controller in its structure. In this paper, a linear quadratic regulator (LQR) mode feedback controller based on deep learning is proposed to improve the performance of VIC in an islanded microgrid against disturbances and uncertainties in the system. The LQR controller uses measurements of system states and the integration of a deep network increases the accuracy and dynamic response of the feedback controller. This allows for fine-tuning of the control response, which exhibits significant robustness against uncertainty in system parameters and disturbances. To evaluate its effectiveness and compare it against alternative control approaches, comprehensive assessments have been conducted across multiple scenarios. The results indicate that the proposed method in the field of VIC surpasses previous approaches.Keywords: Virtual Inertia Control, LQR, Deep Learning, Performance
-
تقویت دستگاه های پزشکی با اینترنت اشیا و فناوری هوش مصنوعی تشخیصی، ضمن درنظرگرفتن محدودیت های این سامانه ها، پتانسیل مدرن سازی و ارتقای رویکرد تشخیصی نسل های آینده سامانه های اینترنت اشیا در حوزه سلامت را دارد. یکی از دستگاه های پرکاربرد در پاراکلینیک، دستگاه رادیوگرافی است. ارزیابی خودکار ناهنجاری ها و سن استخوان از تصاویر رادیوگرافی دست چپ، به رادیولوژیست ها، متخصصان اطفال و پزشکی قانونی در تصمیم گیری در مورد وضعیت رشد جوانان کمک می کند. دستگاه های اینترنت اشیا در پزشکی به علت محدودیت منابع قادر به پردازش حجم زیاد داده ها نیستند. در این مقاله، با استفاده از یک مدل چکانش دانش تجزیه شده از شبکه های عصبی پیچشی معلم به شبکه دانش آموز برای طبقه بندی سن استخوان استفاده شد ه است. این روش از حجم محاسبات موردنیاز برای دستگاه های لبه می کاهد. ارزیابی روش ارائه با استفاده از مجموعه داده های اطلس دست دیجیتال انجام شد ه است. نتیجه روش با معیارهای دقت، بازیافت، صحت و میانگین خطای مطلق ارزیابی شد ه است. مدل پیشنهادی 47/96 درصد دقت آزمون را برای طبقه بندی سن استخوان به دست می آورد.
کلید واژگان: انتقال یادگیری، تشخیص سن، چکانش دانش، ناهنجاری رشدEnhancing medical devices with Internet of Things (IOT) and diagnostic artificial intelligence technology, while considering the constraints of these systems, has the potential to modernize and enhance the diagnostic approach of future generations of Internet of Things systems in healthcare. The radiography device, commonly used in paraclinical settings, is widely used in various hospital departments. The automated assessment of abnormalities and bone age from radiographic images of the left hand assists radiologists, pediatricians, and forensic experts in determining the developmental stage of young individuals. The IoT devices in medicine are unable to process large amounts of data due to limited resources. This article uses a teacher-student network for bone age classification, using the decomposed knowledge distillation model of convolutional neural networks. This approach minimizes the computational resources needed for edge devices. The proposed method is comprised of two sequential steps. In the preprocessing step, the initial phase involves the elimination of non-clinical data and artifacts. This is followed by the extraction of region of interest (ROI). In this phase of the procedure, only the hand portion of the patient's X-ray remains for further evaluation. The subsequent phase involves the delineation of the boundaries of the region of interest. This is necessary because, in certain age groups, some bones are not ossified. Consequently, reliance on bones as landmarks is precluded. In the second step, The extracted ROI from the preceding step is utilized to train the teacher model. The student model utilizes the teacher model's knowledge to learn how to predict patient age. Therefore, the present study puts forth transfer learning methodologies founded on the distillation of knowledge, with the aim of facilitating the transference of knowledge between teacher and student models. The proposed method is based on the data set of the Digital Hand Atlas (DHA) database. The evaluation criteria used in this work are Accuracy, recall, permission and mean absolute error (MAE). The proposed model achieves 96/47% test accuracy for bone age classification.
Keywords: Developmental Disorders, Knowledge Distillation, Bone Age, Deep Learning -
نشریه پژوهش های نظری و کاربردی هوش ماشینی، سال دوم شماره 1 (پیاپی 3، بهار و تابستان 1403)، صص 14 -37
یادگیری عمیق به دلیل توانایی در تجزیه و تحلیل الگوهای پیچیده ترافیک شبکه با قابلیت پاسخ های خودکار بلادرنگ، ابزار مهمی برای تشخیص حمله ممانعت از سرویس توزیع شده است. ولی در اینجا مسئله اصلی نوظهور بودن آن است که باعث شده بررسی کامل فرصت ها و چالش ها در این زمینه با پیاده سازی های واقعی یا نمونه داده های محک انجام نشده باشد. در این مقاله دو روش تشخیص حمله ممانعت از سرویس به وسیله یادگیری عمیق LSTM و CNN و همچنین روش پیشنهادی جدیدی با ترکیب آن ها معرفی می شود. نتایج نشان می دهد که هر دو روش LSTM و LSTM-CNN به طور مداوم از نظر درستی، دقت، بازیابی و امتیازات F1 بهتر از CNN عمل می کنند. بررسی های ما نشان داد که CNN می تواند به طور خودکار ویژگی هایی مانند اندازه بسته، زمان، و آدرس های منبع/مقصد را از ترافیک خام شبکه یاد بگیرد؛ از سوی دیگر، LSTM به ویژه برای تشخیص الگوهای توالی زمانی حملات در ترافیک شبکه مفید است. از طرف دیگر انتخاب بین استفاده از CNN یا LSTM برای تشخیص DDoS به ویژگی های خاص مجموعه داده حمله، و اهمیت نسبی ویژگی های مکانی و زمانی در شناسایی حملات DDoS بستگی دارد. در نهایت، چالش هایی مثل بیش برازش، پیچیدگی رایانشی، تفسیرپذیری، محدودیت های داده و حملات خصمانه بررسی می شود و دلیل تردید ها در گزارش نتایج مقالات می تواند به مشکلات مجموعه داده محک مورد استفاده مانند عدم کیفیت نمونه ها بر اساس اندازه و تنوع محدود، عدم برچسب گذاری، داده های نامتعادل، نسبت داده شود.
کلید واژگان: یادگیری ماشین، یادگیری عمیق، CNN، Ddos، LSTMDeep learning is an essential tool for detecting distributed denial of service (DDoS) attacks due to its ability to analyze complex network traffic patterns and respond in real-time. However, a comprehensive examination of the opportunities and challenges in this field is necessary, given its emerging nature. This examination should include real implementations or benchmark data samples. In this paper, we introduce two methods for detecting DDoS attacks: one using Long Short-Term Memory (LSTM) and the other using Convolutional Neural Networks (CNN). Additionally, we propose a new method that combines LSTM and CNN. The results demonstrate that both LSTM and LSTM-CNN methods consistently outperform CNN in terms of accuracy, precision, recovery, and F1 scores. Our investigations reveal that CNN can automatically learn features such as packet size, timing, and source/destination addresses from raw network traffic. On the other hand, LSTM is particularly useful for detecting temporal sequence patterns of attacks in network traffic. The choice between CNN or LSTM for DDoS detection depends on the specific characteristics of the attack dataset and the relative importance of spatial and temporal features in identifying DDoS attacks. Finally, we examine challenges such as overfitting, computational complexity, interpretability, data limitations, and hostile attacks. Doubts surrounding the reporting of results in literature can be attributed to problems with the benchmark dataset used, including limited sample size and variety, lack of labeling, and unbalanced data.
Keywords: CNN, Ddos, Deep Learning, Machine Learning, LSTM -
نشریه پژوهش های نظری و کاربردی هوش ماشینی، سال دوم شماره 1 (پیاپی 3، بهار و تابستان 1403)، صص 131 -141
ساختارهای گراف نقشی کلیدی در مدل سازی روابط در زمینه های مختلف، از جمله شبکه های اجتماعی، پایگاه های دانش و شبکه های زیستی، دارند. با افزایش ابعاد این شبکه ها، کارایی روش های تحلیل مبتنی بر مجاورت کاهش می یابد و استفاده از تکنیک های تعبیه گذاری گراف به منظور کاهش ابعاد و حفظ ساختار ضروری می شود. این فرآیند به بهبود عملکرد در کاربردهایی مانند دسته بندی گره ها و پیش بینی پیوندها کمک می کند. اما روش های سنتی تعبیه گذاری گراف در ثبت روابط غیرخطی و مقیاس پذیری برای شبکه های بزرگ با محدودیت هایی مواجه هستند. همچنین، در داده های دنیای واقعی، ویژگی های اولیه و دقیق گره ها که برای این الگوریتم ها ضروری است، همیشه در دسترس نیست.در این مقاله، چارچوب جدیدی به نام FuzzyRandomNet ارائه شده است که با ترکیب منطق فازی و گام های تصادفی، این چالش ها را برطرف می سازد. FuzzyRandomNet با افزودن لایه های غیرخطی و بهینه سازی ویژگی های گره، راه حل هایی کارآمدتر و مقیاس پذیرتر برای یادگیری گراف ها ارائه می دهد. نتایج ارزیابی روش پیشنهادی در مقایسه با تکنیک های موجود بر روی مجموعه داده های استاندارد نشان می دهد که این روش عملکرد بهتری در دسته بندی گره ها و پیش بینی پیوندها داشته و دقت و انعطاف پذیری بالاتری در شبکه های بزرگ و پیچیده از خود نشان می دهد
کلید واژگان: کاهش ابعاد گراف، یادگیری عمیق، منطق فازی، گام های تصادفی، تعبیه گذاری گرافGraph structures play a vital role in modeling relationships across various domains, including social networks, knowledge bases, and biological networks. As the dimensions of these networks grow, the efficiency of proximity-based analysis methods declines, necessitating the use of graph embedding techniques to reduce dimensionality while preserving the underlying structure. This process enhances performance in applications such as node classification and link prediction. However, traditional graph embedding methods face challenges with capturing non-linear relationships and scaling to large networks. Additionally, in real-world networks, the essential initial and precise node features which are required by these algorithms are not always available. In this paper, we propose a novel framework called FuzzyRandomNet, which addresses these challenges by integrating fuzzy logic with random walks. FuzzyRandomNet introduces non-linear layers and optimizes node features to provide more efficient and scalable solutions for graph representation learning. The evaluation of the proposed method against existing techniques on standard datasets demonstrates superior performance in node classification and link prediction, exhibiting higher accuracy and flexibility in large and complex networks.
Keywords: Graph Dimensionality Reduction, Deep Learning, Fuzzy Logic, Random Walks, Graph Embedding -
نشریه پژوهش های نظری و کاربردی هوش ماشینی، سال دوم شماره 1 (پیاپی 3، بهار و تابستان 1403)، صص 39 -50
در جامعه امروزی اخبار و آگهی ها، جایگاه به خصوصی در رشد و ترقی جامعه دارند. با مشخص کردن واژگان اصلی آگهی، می توان به مفهوم کلی آن پی برد. آماده سازی این واژگان به روش سنتی نیازمند صرف زمان و دانش تخصصی راجع به موضوع متن است. سایت ایده کاو، سامانه ای هست که به جمع آوری پیام ها و آگهی های تلگرام می پردازد. نیازمندی سامانه ایده کاو، استخراج کلمات کلیدی از آگهی های منتشر شده در تلگرام بوده است. کیفیت کلمات کلیدی استخراج شده، نقش بسزایی در بهبود سئو و آمار بازید آگهی ها دارد. با استفاده از الگوریتم های درون سازی، می توان صحبت های محاوره ای و ساختار معنایی متن را استخراج کرد، ازاین رو در تشخیص کلمات کلیدی در آگهی های تلگرام که اغلب به صورت عامیانه منتشر می شوند، مفید واقع می شود. در این پژوهش با استفاده از داده های سامانه ایده کاو مدلی از روش های درون سازی پیاده سازی شده است. نوآوری استفاده شده در این پژوهش از ترکیب کردن روش های درون سازی واژه، بسامد کلمات و جایگاه کلمات ایجاد شده است. مدل درون سازی از کلمات دو کلمه ای ایجاد شده است. ایجاد مدل از کلمات دو کلمه ای، به این دلیل است که اغلب کلمات کلیدی از دو کلمه به بالا تشکیل شده اند. جهت نمایش بهتر ارزیابی ها، مدل آی کی (مدل پیشنهادی) با روش های آماری و روش های مبتنی بر گراف مقایسه شده است که نتایج به دست آمده نشان می دهد ترکیب مدل آی کی دو-گرم عملکرد بهتری در استخراج کلمات کلیدی نسبت به سایر روش ها به وجود آورده است.
کلید واژگان: استخراج برچسب، بهینه سازی برای موتور جست وجو (سئو)، یادگیری عمیق، درون سازی واژهIn today's society, news and advertisements have a special place in the growth and development of society. By specifying the main words of the ad, you can understand its general meaning. Preparing these words in the traditional way requires time and specialized knowledge about the subject of the text. Ideakav site is a system that collects Telegram messages and advertisements. The requirement of the idea search system was to extract keywords from the advertisements published in Telegram. The quality of extracted keywords plays a significant role in improving SEO and advertising statistics. By using embedding algorithms, it is possible to extract colloquial conversations and the semantic structure of the text, therefore, it is useful in identifying keywords in Telegram ads that are often published in popular form. In this research, a model of word embedding has been implemented using the data of the idea mining system. The innovation used in this research is created by combining word embedding methods, word frequency and word position. The embedding model is created from two-word words. Creating a model of two-word words is because most of the keywords consist of two words or more. In order to better display the evaluations, the IK model (proposed model) has been compared with statistical methods and graph-based methods, and the obtained results show that the combination of the two-gram IK model has produced a better performance in extracting keywords than other methods.
Keywords: Tag Extraction, Search Engine Optimization (SEO), Deep Learning, Word Embedding -
نشریه پژوهش های نظری و کاربردی هوش ماشینی، سال دوم شماره 1 (پیاپی 3، بهار و تابستان 1403)، صص 77 -91
در این مقاله، یک روش جستجوی معماری عصبی فشرده برای طبقه بندی تصاویر با استفاده از الگوریتم جستجوی گرانشی (GSA) ارائه شده است. یادگیری عمیق با بهره گیری از مدل های محاسباتی چندلایه، امکان استخراج خودکار ویژگی ها را از داده های خام در سطوح انتزاعی مختلف فراهم می کند که نقش کلیدی در مسائل پیچیده ای مانند طبقه بندی تصاویر دارد. روش جستجوی معماری عصبی (NAS) که به طور خودکار به کشف معماری های جدید شبکه های عصبی کانولوشنی (CNN) می پردازد، با چالش هایی نظیر پیچیدگی محاسباتی و هزینه های بالا مواجه است. برای مقابله با این چالش ها، رویکردی بر پایه الگوریتم جستجوی گرانشی (GSA) توسعه داده شده است که بهینه سازی دوسطحی با طول متغیر را برای طراحی معماری های میکرو و ماکرو شبکه های عصبی کانولوشنی (CNN) به کار می گیرد. این رویکرد با استفاده از فضای جستجوی فشرده و گلوگاه های کانولوشنی اصلاح شده، عملکرد بهتری نسبت به روش های پیشرفته نشان می دهد. نتایج تجربی بر روی مجموعه داده های CIFAR-10، CIFAR-100 و ImageNet نشان می دهد که روش پیشنهادی با دقت طبقه بندی 98.48% و هزینه جستجوی 1.05 (روز (GPU از الگوریتم های موجود ازنظر دقت، هزینه جستجو و پیچیدگی معماری برتری دارد.
کلید واژگان: الگوریتم جستجوی گرانشی، جستجوی معماری عصبی، شبکه های عصبی کانولوشنی، یادگیری عمیقThis paper presents a compact neural architecture search method for image classification using the Gravitational Search Algorithm (GSA). Deep learning, through multi-layer computational models, enables automatic feature extraction from raw data at various levels of abstraction, playing a key role in complex tasks such as image classification. Neural Architecture Search (NAS), which automatically discovers new architectures for Convolutional Neural Networks (CNNs), faces challenges such as high computational complexity and costs. To address these issues, a GSA-based approach has been developed, employing a bi-level variable-length optimization technique to design both micro and macro architectures of CNNs. This approach, leveraging a compact search space and modified convolutional bottlenecks, demonstrates superior performance compared to state-of-the-art methods. Experimental results on CIFAR-10, CIFAR-100, and ImageNet datasets reveal that the proposed method achieves a classification accuracy of 98.48% with a search cost of 1.05 GPU days, outperforming existing algorithms in terms of accuracy, search efficiency, and architectural complexity.
Keywords: Convolutional Neural Networks (Cnns), Deep Learning, Gravitational Search Algorithm (GSA), Neural Architecture Search (NAS) -
نشریه پژوهش های نظری و کاربردی هوش ماشینی، سال دوم شماره 1 (پیاپی 3، بهار و تابستان 1403)، صص 142 -154امروزه با رشد چشمگیر هوش مصنوعی و تولیدات آن، فرصت ها و تهدیدات زیادی به وجود آمده است. یکی از معروف ترین و محبوب ترین تولیدات هوش مصنوعی تولید متن است که به آن متن ماشینی نیز گفته می شود. در این پژوهش روش جدیدی معرفی می شود که ویژگی های استخراج شده از متن را با ویژگی های ساختاری آن ترکیب کرده و به این ترتیب برای تشخیص متن نوشته شده توسط انسان و متن تولیدی هوش مصنوعی، یک متمایزگر خودکار ایجاد می کند. روش معرفی شده متشکل از دو بخش می باشد، بخش اول: مدل توسعه یافته ی (RoBERTa) BERT و مدل حافظه ای کوتاه مدت بلند مدت دو سویه (BiLSTM) است که با لایه ی ادغام بهبود یافته اند. بخش دوم: ویژگی های ساختاری متن با روشی مبتنی بر سبک نوشتار استخراج می شود. در نهایت خروجی بخش های مدل باهم ترکیب شده و به این ترتیب مدل متن نوشته شده توسط انسان را از متن تولید شده توسط ماشین تشخیص می دهد. نتایج حاصل از این پژوهش نشان می دهد که روش پیشنهادی با دقت 90 درصدی قابلیت تشخیص متون ماشینی را داشته و عملکرد مطلوبی را از خود به نمایش می گذارد.کلید واژگان: یادگیری عمیق، مدل مبتنی بر سبک نوشتار، Roberta، BilstmToday, with the significant growth of artificial intelligence and its products, many opportunities and threats have emerged. One of the most famous and popular products of artificial intelligence is text generation, also called machine text. In this research, a new method is introduced that combines features extracted from the text with its structural features, thus creating an automatic discriminator to distinguish between human-written text and artificial intelligence-generated text. The introduced method consists of two parts, the first part: the extended BERT (RoBERTa) model and the bidirectional long-term short-term memory (BiLSTM) model, which are improved with the fusion layer. The second part: the structural features of the text are extracted using a writing style-based method. Finally, the output of the model parts is combined together, and in this way, the model distinguishes human-written text from machine-generated text. The results of this research show that the proposed method is capable of recognizing machine texts with 90% accuracy and exhibits good performance.Keywords: Deep Learning, Writing Style Based Model, Roberta, Bilstm
-
According to today's statistics, more than half a billion vehicles move around the world, making inspection and monitoring one of the basic needs of any traffic control system. All vehicles have an identification number exhibited as the license plate, their primary ID, a vital element. Deep Learning methods are adopted to detect vehicle license plates. This proposed method consists of two steps: highlighting the license plate and reading the ID stages. In this context, the combination of deep neural networks (DNN) and the competitive generative adversarial network (GAN) is applied in the encoding-coder network/structure for this highlighting. The proposed models are assessed based on the FZU Cars and Stanford Cars datasets, to which the results of this study are compared and discussed. The findings here indicate that the accuracy of this proposed model is almost 98%, subject to the two datasets.
Keywords: License Plate Recognition, Deep Learning, Neural Networks, Generative Adversarial Network, Encoding-Decoding Structure -
بهبود کیفیت تصویر جهت شناسایی و احراز هویت در سیستم های امنیتی و نظارتی دارای اهمیت ویژه بوده و امروزه با استفاده از هوش مصنوعی می توان کیفیت تصاویر را به صورت قابل توجهی بهبود داد. در این راستا مقاله حاضر با تمرکز بر جزئیات تصاویر چهره، مدل تشخیص خرابی تصویر در شبکه مولد تخاصمی را بهبود داده است که منجر به عملکرد مناسب در فراتفکیک پذیری تصاویر چهره شد. اکثر شبکه های CNN که در سالهای اخیر ارائه شده است، برای عملکرد مناسب نیاز به مجموعه تصاویر بسیار زیاد با حاشیه نویسی مناسب دارند و معمولا در مورد خرابی هایی که آموزش ندیده اند عملکرد نامناسبی دارند که در این مقاله به بهبود این چالش پرداخته شده است. در این کار برای آموزش مدل تشخیص خرابی تصویر، از جفت تصویرهای با کیفیت و بی کیفت استفاده شده است؛ سپس این اطلاعات به تصاویر واقعی انتقال داده می شوند. طبیعی بودن تصاویر خروجی از مهمترین چالش های موجود در این زمینه است. نتایج بدست آمده نشان می دهد که معیار شباهت ادراکی تصویر به دست آمده برابر با 38.4% بوده که نسبت به پژوهش های اخیر قابل مقایسه می باشد. در نتیجه با استفاده از مدل پیشنهادی، تصاویر طبیعی تری تولید شد.
کلید واژگان: افزایش کیفیت تصویر چهره، شبکه مولد تخاصمی، فراتفکیک پذیری، یادگیری عمیقImproving image quality for identification and authentication in security and surveillance systems is of particular importance, and today, using artificial intelligence, the quality of images can be significantly improved. In this regard, the present paper, focusing on the details of face images, has improved the image failure detection model in the adversarial generator network, which led to a suitable performance in the meta-dissolving of face images. Most of the CNN networks that have been presented in recent years require a large set of images with appropriate annotations for proper performance, and they usually perform poorly in the case of degradation that have not been trained, which is addressed in this research to improve this challenge. In this work, pairs of high-quality and low-quality images are used to train the image degradation detection model; This information is then transferred to real images. The naturalness of the output images is one of the most important challenges in this field. The obtained results show that the criterion of perceptual similarity of the obtained image is equal to 38.4%, which is comparable to recent researches. As a result, using the proposed model, more natural images were produced
Keywords: Quality Of Face Image, Adversarial Generative Network, Super-Resolution, Deep Learning -
Journal of Electrical and Computer Engineering Innovations, Volume:13 Issue: 1, Winter-Spring 2025, PP 27 -42Background and ObjectivesThe lack of a suitable tool for the analysis of conversational texts in Persian language has made various analyzes of these texts, including Sentiment Analysis, difficult. In this research, it has we tried to make the understanding of these texts easier for the machine by providing PSC, Persian Slang Convertor, a tool for converting conversational texts into formal ones, and by using the most up-to-date and best deep learning methods along with the PSC, the sentiment learning of short Persian language texts for the machine in a better way.MethodsBe made More than 10 million unlabeled texts from various social networks and movie subtitles (as dialogue texts) and about 10 million news texts (as official texts) have been used for training unsupervised models and formal implementation of the tool. 60,000 texts from the comments of Instagram social network users with positive, negative, and neutral labels are considered as supervised data for training the emotion classification model of short texts. The latest methods such as LSTM, CNN, BERT, ELMo, and deep processing techniques such as learning rate decay, regularization, and dropout have been used. LSTM has been utilized in the research, and the best accuracy has been achieved using this method.ResultsUsing the official tool, 57% of the words of the corpus of conversation were converted. Finally, by using the formalizer, FastText model and deep LSTM network, the accuracy of 81.91 was obtained on the test data.ConclusionIn this research, an attempt was made to pre-train models using unlabeled data, and in some cases, existing pre-trained models such as ParsBERT were used. Then, a model was implemented to classify the Sentiment of Persian short texts using labeled data.Keywords: Natural Language Processing, Persian Conversational Text, Sentiment Analysis, Deep Learning
-
یکی از مهمترین و موثرترین راه های تشخیص سرطان سینه، بخصوص در مراحل اولیه بیماری، انجام ماموگرافی است. تصاویر ماموگرافی به علت پیچیدگی بافت های سینه، شباهت بین توده های سرطانی و بافت های طبیعی آن، اندازه و شکل متفاوت توده ها و تابش اشعه ایکس، معمولا از کیفیت پایینی برخوردار هستند. از این رو تشخیص ضایعات به خصوص در مراحل اولیه، کار بسیار دشواری است؛ زیرا برخی از ضایعات جرم در بافت های طبیعی جاسازی شده و حاشیه های ضعیف یا حاشیه های مبهم دارند. روش پیشنهادی در این مطالعه ارائه ی یک معماری مبتنی بر شبکه عصبی کانولوشنی عمیق برای تشخیص توده های سرطانی در تصاویر ماموگرافی می باشد که در نهایت به طبقه بندی توده ها به کلاس های نرمال و غیر نرمال منجر می گردد. آموزش شبکه ی پیشنهادی با اصلاح تصاویر در مرحله پیش پردازش آغاز می شود تا ترسیم دقیق تر با وضوح بالاتر بر روی تصاویر انجام شود و در نهایت دقت و حساسیت جداسازی توده از بافت سینه برای تشخیص صحیح بهبود یابد. برای پیاده سازی روش پیشنهادی از زبان برنامه نویسی پایتون و کتابخانه تنسورفلو در محیط ویندوز استفاده شده است. برای اطمینان از عملکرد روش پیشنهادی روش اعتبارسنجی متقابل استفاده شده و نتایج بدست آمده توسط معیارهای دقت، صحت و حساسیت مورد ارزیابی قرار گرفته است. نتایج بدست آمده با دقت 97.67 % بیانگر بهبود دقت تشخیص و همچنین کاهش هزینه در فرایند تشخیص انجام شده می باشد.کلید واژگان: شبکه عصبی کانولوشنی، تصاویر ماموگرافی، سرطان سینه، یادگیری عمیق، توده نرمال و غیر نرمالOne of the most important and influential ways to diagnose breast cancer, especially in the early stages of the disease, is mammography. Mammography images are usually of low quality due to the complexity of breast tissues, the similarity between cancerous masses and normal tissues, the different sizes and shapes of the masses, and X-ray radiation. Therefore, it is very difficult to detect lesions, especially in the early stages; Because some mass lesions are embedded in natural tissues and have weak margins or vague margins. The proposed method in this study is to present an architecture based on a deep convolutional neural network to detect cancerous masses in mammography images, which ultimately leads to classifying the masses into normal and abnormal classes. The training of the proposed network begins with the modification of the images in the pre-processing stage in order to perform more accurate drawings with high resolution on the images and finally to improve the accuracy and sensitivity of separating the mass from the breast tissue for correct diagnosis. Python programming language and TensorFlow library have been used in the Windows environment to implement the proposed method. To ensure the performance of the proposed method, the cross-validation method was used and the obtained results were evaluated by the criteria of precision, accuracy, and sensitivity. The results obtained with an accuracy of 97.67% indicate the improvement of the diagnosis accuracy and the cost reduction in the diagnosis processKeywords: Separated By Semicolons Convolutional Neural Network (CNN), Mammography Images, Breast Cancer, Deep Learning, Normal, Abnormal Mass
-
تشخیص و مکان یابی ساختارهای ناخواسته و یا ناهنجاری درون تصویر یکی از مسائل مهم در بینایی ماشین و بازرسی صنعتی است. پیچیدگی و متغیر بودن توزیع داده ها و نبود داده های برچسب دار از چالش های تشخیص ناهنجاری در تصاویر است. در سال های اخیر روش های یادگیری عمیق نتایج امیدوارکننده ای برای حل مسائل تشخیص ناهنجاری در انواع داده و بخصوص در تصویر ارائه داده اند. در این مقاله معماری DFDA-AD که رویکردی بدون نظارت و مبتنی بر یادگیری عمیق است برای تشخیص ناهنجاری در تصاویر صنعتی پیشنهاد شده است. DFDA-AD شامل استخراج دوگانه ویژگی از تصاویر توسط شبکه های از پیش آموزش دیده DenseNet121 و ResNet50 است. دو سازوکار توجه در این مقاله بهبود و توسعه داده شده که نقشه ی ویژگی های مهم تر را برای خوشه بندی توسط الگوریتم K-means فراهم می کنند. ارزیابی عملکرد مدل بر روی مجموعه داده ی MVTec AD صورت پذیرفت که نتایج ارزیابی ها برای تشخیص و همچنین مکان یابی ناهنجاری در مقایسه با چندین رویکرد دیگر که اخیرا پیشنهاد شده اند، رضایت بخش بود.کلید واژگان: تصاویر صنعتی، تشخیص ناهنجاری، ساز و کار توجه، یادگیری انتقالی، یادگیری عمیقDetecting and locating unwanted structures or anomalies in the image is one of the important issues in machine vision and industrial inspection. The complexity and variability of data distribution and the lack of labeled data are among the challenges of detecting anomalies in images. In recent years, deep learning methods have provided promising results for solving anomaly detection problems in any data types, especially in images. In this paper, the DFDA-AD architecture, which is an unsupervised approach based on deep learning, is proposed for anomaly detection in industrial images. DFDA-AD consists of dual feature extraction from images by pre-trained DenseNet121 and ResNet50 networks. Two attention mechanisms are improved and developed in this paper, which provide more important feature maps for clustering by K-means algorithm. The evaluation of the model's performance was done on the MVTec AD data set, and the results of the evaluations for anomaly detection and localization were satisfactory compared to several other approaches that have been recently proposed.Keywords: Abnormality Detection, Attention Mechanism, Deep Learning, Industrial Images, Transfer Learning
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.