به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

q learning algorithm

در نشریات گروه فنی و مهندسی
  • Farhad Mollaei, Ali Moradzadeh *, Reza Mohebian
    Shear wave velocity (Vs) is one of the most critical parameters for determining geomechanical properties to predict reservoir behavior. Determining shear wave velocity (Vs) through methods, such as core analysis requires a significant amount of time and cost. Additionally, due to the scarcity of core samples and the heterogeneity of reservoir rocks, determining this parameter using conventional methods is often not very accurate. While many empirical methods have been developed for estimating Vs, their applicability across different regions is often limited. Therefore, estimating Vs using conventional well logs is crucial. An efficient method for predicting Vs is the use of intelligent algorithms, which offer low-cost and accurate predictions. It is feasible to predict Vs using well log data. In this study, Vs was predicted using empirical relations and some deep learning (DL) algorithms in one of the hydrocarbon fields in southern Iran. In order to use the DL methods, the autoencoders deep network was used to select the effective features in predicting the Vs, and then, with multi-layer perceptron (MLP), long-short term memory (LSTM), convolutional neural network (CNN), and convolutional neural network + long-short term memory (CNN+LSTM) networks, Vs was predicted. The performance of these models was tested by a blind data set that the models had not seen before. Furthermore, the results were checked and evaluated by set of statistical measures, including MAE, MAPE, MSE, RMSE, NRMSE, and R2 values calculated for train, test, and blind datasets. It was found that all four deep learning models used in this study well performed effectively for Vs prediction, but the combined CNN+LSTM model results indicated that the least root mean squared error (RMSE) was equal to 0.0243 (2.43%) and the best coefficient of determination (R2) equal to 0.9993 for blind dataset. We found that Vs can be predicted from a series of well log data by considering their variation trends and context information with depth by means of DL algorithms. This approach is particularly suitable for problems involving various series data, such as Vs prediction. By comparing the results obtained from DL algorithms with those from conventional empirical methods and processing real petrophysical well log data, it can be concluded that deep learning algorithms not only offer more predictive accuracy and robustness but also hold promising use prospects in Vs prediction studies. The results showed that the used CNN and CNN+LSTM networks, as new deep learning algorithms, are able to predict Vs adequately.
    Keywords: Shear Wave Velocity, Log Data, Empirical Relations, Deep Learning Algorithm
  • محمد پردل، امیر امین زاده قوی فکر*
    بتن به عنوان یکی از مصالح اصلی در صنعت ساخت، نقش حیاتی در پایداری، ایمنی و رفاه فضاهای شهری ایفا می کند. کیفیت بتن رابطه مستقیمی با تحمل بارهای ثقلی و جانبی دارد و می تواند از تخریب زودهنگام ساختمان ها جلوگیری کرده و علاوه بر کاهش حجم ضایعات ساختمانی، یک محیط شهری پایدار ایجاد نماید. با این حال، عوامل متعددی بر مقاومت فشاری بتن تاثیرگذارند که عدم شناسایی این عوامل می تواند منجر به تخریب زودرس ساختمان ها و همچنین پیامدهای ناگوار در بلایای طبیعی شود. درک صحیح از این عوامل برای ارتقای کیفیت بتن و تضمین عملکرد مطلوب سازه ها ضروری است. هدف این مقاله، تحلیل عوامل موثر بر کیفیت مقاومت بتن در راستای ارتقا پایداری، ایمنی، رفاه فضاهای شهری و همچنین حفاظت از محیط زیست شهری است. در این مقاله، علاوه بر استفاده از مدل یادگیری ماشین مبتنی بر الگوریتم تقویت گرادیان شدید، از الگوریتم های فراابتکاری برای ایجاد یک مدل پیش بینی دقیق استفاده شده است. نتایج این پژوهش نشان می دهد که عوامل متعددی از جمله نسبت آب به سیمان، نوع و کیفیت سنگدانه، افزودنی های بتن، شرایط عمل آوری و شرایط محیطی، بر مقاومت بتن تاثیرگذار هستند. همچنین، در این پژوهش مدل یادگیری ماشین قادر به شناسایی الگوهای پیچیده در بین عوامل شناسایی شده و پیش بینی دقیق مقاومت فشاری بتن با دقت 66/95 درصد است. نتایج این مطالعه می تواند به ارتقای کیفیت ساخت، افزایش طول عمر مفید سازه ها، کاهش هزینه های نگهداری و تعمیرات، ایجاد فضاهای شهری پایدار و ایمن منجر شود.
    کلید واژگان: مدیریت شهری، الگوریتم یادگیری ماشین، الگوریتم فراابتکاری، مقاومت فشاری بتن، محیط زیست، ضایعات ساختمانی
    Mohammad Pordel, Amir Aminzadeh Ghavifekr *
    Concrete, as one of the main materials in the construction industry, plays a vital role in the sustainability, safety, and welfare of urban spaces. This is because concrete has a direct impact on bearing gravitational and lateral loads, and improving the quality of concrete can prevent the premature destruction of buildings. Additionally, it can reduce the volume of construction waste and create a sustainable urban environment. However, numerous factors affect the compressive strength of concrete, and failing to identify these factors can lead to premature building destruction and adverse outcomes during natural disasters. A proper understanding of these factors is essential for enhancing concrete quality and ensuring the optimal performance of structures. Accordingly, the aim of this article is to analyze the factors influencing the quality and strength of concrete to improve the sustainability, safety, and welfare of urban spaces and to protect the urban environment. In this article, to achieve the research objectives, in addition to using a machine learning model based on the Extreme Gradient Boosting algorithm, metaheuristic algorithms have been employed to create an accurate predictive model.
    Keywords: Urban Management, Machine Learning Algorithm, Metaheuristic Algorithm, Concrete Compressive Strength, Environment, Construction Waste
  • Azin Nodoust *, Ali Rajabzadeh Ghatari
    Diabetes Mellitus is one of the most chronic diseases in all over the world. Every year, many people die due to this disease in all countries. Therefore, identifying early detection methods for this disease can reduce its mortality. Today, many diseases can be diagnosed and prevented from progressing by using data mining techniques and machine learning algorithms. In this paper, diabetes prediction has been aimed by comparing the efficiency of several classical machine-learning techniques. For this reason, for the sake of diabetes prediction algorithms such as Naïve Bayes, Logistic Regression (LR), Multi-Layer Perceptron (MLP), Sequential Minimal Optimization (SMO), J48, Random Forest (RF), Regression Tree (RT) algorithms and a new hybrid algorithm based on Multi-Verse Optimizer (MVO) and Multi-Layer Perceptron (MLP) algorithms are employed for this evaluation based on Accuracy (ACC) Indicator and Area under Curve (AUC) criteria. Numerous and diverse methods and algorithms have been used to predict diabetes. Each of these algorithms has been effective in predicting diabetes with a different level of accuracy. Our goal in this research is to introduce a new combined algorithm that has the highest level of accuracy in predicting diabetes compared to the old frequent algorithms so that it can help people in the timely treatment of this disease. In the structure of the MLP algorithm, the backpropagation algorithm is used for training. This article uses the MVO algorithm to train the MLP instead of the backpropagation algorithm, which built the hybrid algorithm called MVO-MLP. The accuracy results and the area under the ROC diagram Indicated that the proposed hybrid algorithm increases the accuracy by 107% compared to the MLP algorithm with the default structure. The outcomes of the accuracy of the new model are also higher than other algorithms used in this article
    Keywords: Diabetes Mellitus, Machine Learning Algorithm, Data Mining, Accuracy, Area Under Curve, Multi-Verse Optimizer, Multi-Layer Perceptron
  • محمود دی پیر*، امیرحسین محمدپور

    هدف انتخاب موارد آزمون این است که بتوان زیر مجموعه ای انتخاب شود که قابلیت بالقوه شناسایی خطاهای ناشی از تغییرات را داشته باشد. به عبارتی هدف روش های انتخاب موارد آزمون، کاهش تعداد موارد آزمون بعد از تغییر کد است و بر روی شناسایی بخش های اصلاح شده برنامه تمرکز دارد. روش های هوشمند مانند رگرسیون، دقت آزمون را در پروژه های نرم افزاری بهبود می بخشند و استفاده از الگوریتم های بهینه سازی در یافتن مقدار بهینه موارد آزمون می تواند از نظر زمان و سرعت هم مفید واقع شود. در این مقاله تکنیکی برای کاهش موارد آزمون رگرسیون مبتنی برروش بهینه سازی معلم- دانش آموز ارائه می شود.  این روش از دو مرحله معلم (فاز آموزش) و دانش آموز (فاز یادگیری) روی مجموعه آزمون تشکیل شده و بر اساس پارامترهای مختلف پیاده سازی گردیده است. نتایج آزمایش ها نشان داد که استفاده از الگوریتم معلم- دانش آموز، زمان لازم برای کاهش موارد آزمون رگرسیون را تا حدی بهبود می بخشد، هر چند که جواب قطعی را به ما نمی دهد و جوابی نزدیک به بهینه را خواهد داد. نتایج حاصل از اجرای رویکرد پیشنهادی با روش های قبلی انتخاب موارد آزمون مقایسه شده و مشاهده شد که میانگین زمان اجرای موارد آزمون انتخابی، توسط آن بهتر است.

    کلید واژگان: آزمون نرم افزار، بهینه سازی، آزمون رگرسیون، الگوریتم یادگیری معلم- دانش آموز
    Mahmood Deypir *, Amirhossein Mohammadpour

    The aim of selecting test items is to choose a subset that has the potential to detect errors due to changes within the software. In other words, the purposes of test selection methods is to reduce the number of test cases after changing the code and focus on identifying the modified parts of the program. Intelligent methods such as regression improve the accuracy of tests in software projects, and the use of optimization algorithms to find the optimal amount of test cases can be useful in terms of time and speed, and according to research by examining and optimizing this algorithm in the system. In this paper, a technique for reducing regression test cases based on teacher-student optimization method was presented. This method was studied in two stages of teacher (education phase) and student (learning phase) on the test set and was implemented with different parameters. The experimental results showed that the use of the teacher-student algorithm reduces the time required for the reduction parameters of the regression test to some extent, although it does not give us a definite answer and will give a near-optimal answer. Also, the results of teacher-student algorithm were compared with previous approaches of regression test case reduction. Experimental results show better average execution time for test case selection. .

    Keywords: Software Test, Optimization, Regression Test, Teacher, Student Learning Algorithm
  • عاطفه واثی*، طاها بازوند، محسن نیک رای

    مسیریابی شبکه ای پهپادها برای عملیات جست وجو و نجات یک چالش مهم است. این چالش به دلیل محدودیت های فیزیکی پهپادها، شرایط محیطی نامساعد، و محدودیت های زمانی است. در این مقاله، یک روش جدید برای مسیریابی شبکه ای پهپادها با استفاده از الگوریتم Q-Learning ارائه شده است. این الگوریتم به پهپادها امکان می دهد تا به صورت خودکار بهترین مسیرها را در محیط های پیچیده ترسیم کنند و همچنین با تغییرات محیطی سازگار شوند. نتایج شبیه سازی های انجام شده نشان می دهد که الگوریتم Q-Learning می تواند مسیرهای کوتاه تر و کارآمدتری را نسبت به الگوریتم های حوزه ژنتیک پیدا کند. این نتایج نشان می دهد که الگوریتم Q-Learning می تواند یک روش امیدوارکننده برای بهبود مسیریابی شبکه ای پهپادها در عملیات جست وجو و نجات باشد.

    کلید واژگان: بهینه سازی، الگوریتم ژنتیک، الگوریتم Q-Learning، مسیریابی پهپادها، شبکه ای از پهپادها
    Atefeh Vasi *, Taha Bazvand, Mohsen Nickray

    Network routing of drones for search and rescue operations is a critical challenge. This challenge arises due to the physical limitations of drones, adverse environmental conditions, and time constraints. In this paper, a novel approach for network routing of drones using the Q-Learning algorithm is proposed. This algorithm enables drones to automatically determine optimal paths in complex environments and adapt to environmental changes. Simulation results demonstrate that the Q-Learning algorithm can find shorter and more efficient routes compared to genetic algorithms. These findings highlight Q-Learning as a promising method for improving network routing of drones in search and rescue operations

    Keywords: Drone Routing, Genetic Algorithm, Q-Learning Algorithm, Network Of Drones, Optimization
  • روژین محقق، بهنود برمایه ور*، حسین طوسی

    با توجه به جایگاه برجسته کشور در دنیا از منظر منابع انرژی مخصوصا حوزه گازی، اجرای پروژه های زیرساختی انرژی به ویژه خط لوله گاز ضروری می نماید. با این وجود، یکی از چالش های اساسی در این نوع از پروژه ها، موضوع عدم بهره وری مناسب منابع (ماشین آلات و...) است. از این رو هدف اصلی پژوهش حاضر عبارت است از بهبود بهره وری ماشین آلات خاکبرداری پروژه های احداث خط لوله گاز، با کمک الگوریتم های یادگیری ماشین. در این پژوهش، با بهره گیری از مطالعات کتابخانه ای، اسنادی (گزارش های روزانه هفت پروژه خطوط انتقال گاز)، قضاوت خبرگان، روش متن کاوی (و نرم افزار رپیدماینر)، معیارهای موثر بر تعیین بهره وری ماشین آلات خاکبرداری در پروژه های احداث خط لوله گاز، شناسایی و نهایی شدند. به طور خلاصه، نتیجه اصلی پژوهش کنونی اشاره دارد که پیش بینی حجم خاکبرداری، از طریق الگوریتم پیش بینانه (به عنوان مبنای بهینه سازی بهره وری ماشین آلات خاکبرداری) و نیز الگوریتم دسته بندی و با استفاده از مدل یادگیری عمیق (به عنوان مدل منتخب و دارای بهترین عملکرد در پیش بینی حجم خاکبرداری)، قابل اجرا است. درواقع، یافته های پژوهش فعلی در راستای پیش بینی حجم خاکبرداری، پیش از شروع پروژه و تهیه برنامه زمانبندی کلی که در نهایت موجب بهبود بهره وری ماشین آلات خاکبرداری در پروژه های خط لوله گاز می شود، قابل استفاده است.

    کلید واژگان: بهره وری ماشین آلات عملیات خاکبرداری، الگوریتم یادگیری ماشین، پروژه های زیرساختی انرژی، پروژه احداث خط لوله گاز
    Rojin Mohaghegh, Behnod Barmayehvar *, Hossein Toosi

    Considering the outstanding position of the country in the world from the point of view of energy resources, especially the gas field, the implementation of energy infrastructure projects, especially the gas pipeline, is essential. Nevertheless, one of the main challenges in this type of projects is the lack of proper productivity of resources (machinery, etc.). Therefore, the main goal of the current research is to improve the productivity of earthmoving machinery for gas pipeline construction projects, with the help of machine learning algorithms. In this research, by using library studies, documents (daily reports of seven gas transmission pipeline projects), expert judgment, text mining method (and Rapidminer software), effective criteria for determining the productivity of earthmoving machinery in gas pipeline construction projects, identified and final became. In short, the main result of the current research indicates that the prediction of the excavation volume, through the predictive algorithm (as a basis for optimizing the productivity of earthmoving machinery) and also the classification algorithm and using the deep learning model (as the selected model with the best performance in the prediction of the excavation volume), is applicable. In fact, the findings of the current research can be used in order to predict the volume of earthmoving, before the start of the project and prepare a general schedule that ultimately improves the productivity of earthmoving machinery in gas pipeline projects.

    Keywords: Productivity Of Earthmoving Machinery, Machine Learning Algorithm, Energy Infrastructure Projects, Gas Pipeline Construction Project
  • Ge Zhang, Neng Wei, Ying Zhou, Licheng Zhou *, Gongfa Chen, Zejia Liu, Bao Yang, Zhenyu Jiang, Yiping Liu, Liqun Tang
    In recent years, Double Window Principal Component Analysis (DWPCA) has been proposed. The spatial windows exclude damage-insensitive data from the analysis, while the temporal window improves the discrimination between healthy and damaged states. As a result, the DWPCA method exhibits higher sensitivity and resolution in damage identification compared to traditional PCA methods, as well as other traditional signal processing methods such as wavelet analysis. However, existing research on DWPCA has mainly focused on using the first-order eigenvector for damage identification, while the potential of higher order DWPCA eigenvectors remains unexplored. Therefore, the objective of this paper is to investigate the damage identification capabilities of higher-order DWPCA eigenvectors. Furthermore, we propose three types of damage-sensitive features based on DWPCA eigenvectors and use them as inputs to artificial intelligence (AI) algorithms for damage localization and quantification. The AI algorithms considered include AutoGluon and Transformer, which are powerful machine learning (ML) and deep learning (DL) algorithms proposed in recent years, respectively. In addition, classical ML algorithms such as Decision Tree (DT), Random Forest (RF) and Extreme Gradient Boost (XGBoost) are considered for comparison. Extensive benchmark experiments are performed and the numerical results obtained show that the combination of AutoGluon with DWPCA features achieves remarkable performance in terms of damage localization and quantification. This performance exceeds that of DT, RF, XGBoost and Transformer algorithms. Specifically, the prediction accuracies for damage localization and quantification exceed 90%. These results highlight the great potential of integrating AutoGluon with DWPCA features, particularly by combining AutoGluon with the first and second DWPCA eigenvectors, for real-world applications in structural health monitoring.
    Keywords: Structural Health Monitoring, Damage Detection, Machine Learning Algorithm, Principal Component Analysis
  • عرفان خسرویان*

    انتقال حرارت عامل مهم و تاثیرگذار در طراحی موتورهای احتراق داخلی است. پیش بینی دقیق انتقال حرارت برای طراحی سامانه خنک کاری موتورهای احتراق داخلی تاثیر بسزایی دارد. لذا شبیه سازی موتورهای احتراق داخلی به منظور تحلیل حرارتی آن ها با استفاده از دینامیک سیالات محاسباتی به همراه شبیه سازی جوشش انجام می پذیرد. در این مقاله، بررسی جریان جوشش زیرخنک شده آب خالص در یک آبراه کوچک و وابستگی آن به متغیرهای مختلف مانند فشار کاری، شار حرارتی، شار جرمی. و دمای زیر سرد سیال ورودی مورد توجه است. شبیه سازی های عددی با استفاده از الگو های متقارن محوری انجام شده و تاثیر اندازه های شبکه های مختلف بر دقت نتایج مورد بررسی قرار گرفت. قطر جداسازی حباب نیز مطالعه شد و وابستگی آن با فشار، شار گرما، شار جرمی و دمای زیر خنک کننده ورودی تحلیل شد. در نهایت، یک پایگاه داده از نتایج شبیه سازی تولید شده و الگو های پیش بینی برای دینامیک حباب با استفاده از روش های یادگیری دستگاه ارائه شد.

    کلید واژگان: جوشش جریانی، شبیه سازی عددی، دینامیک حباب، روش یادگیری دستگاه، شبکه عصبی مصنوعی
    Erfan Khosravian*

    Heat transfer is an important and influential factor in the design of internal combustion engines. Accurate prediction of heat transfer has a great impact on the design of cooling systems of internal combustion engines. The simulation of internal combustion engines for their thermal analysis is done using computational fluid dynamics along with boiling simulation. This article investigates the subcooled boiling flow of pure water in a small channel and its dependence on different parameters such as working pressure, heat flux, and mass flux. The subcooling temperature of the inlet fluid is of interest. Numerical simulations were performed using axisymmetric models and the effect of different grid sizes on the accuracy of the results was investigated. The bubble separation diameter was also studied and its relationship with pressure, heat flux, mass flux, and temperature under the inlet coolant was analyzed. Finally, a database of generated simulation results and predictive models for bubble dynamics using machine learning algorithms were presented.

    Keywords: Flow Boiling, Numerical Simulation, Bubble Dynamics, Machine Learning Algorithm, Artificial Neural Network
  • W. R. Liao, J. H. Shi *, G. X. Li
    Artificial Neural Network (ANN) and Support Vector Machine (SVM) have been widely used to solve non-linear problems. In the current study, based on 112 groups of experimental data, ANN and SVM models were established and compared to improve the trade-off relationship between SOOT and NOx emissions of a Common Rail Diesel Injection (CRDI) engine fueled with Fischer-Tropsch (F-T) diesel under different operating conditions and injection parameters. The model parameters for the different predictive targets were selected by evaluating the mean square error (MSE) and determination coefficient. Compared to the number of network iterations, the number of implied nodes had a greater effect on the MSE of the ANN model. Compared to the penalty parameter, the width coefficient had a weaker impact on the SVM performance. A comparative analysis showed that the SVM had better predictive accuracy and generalization ability than the ANN, with a maximum error not exceeding five percent and a determination coefficient of over 0.9. Subsequently, the optimal SVM model was combined with the NSGA-II algorithm to determine the optimal injection parameters for the CRDI engine, resulting in solutions to simultaneously decrease the SOOT and NOx emissions. The optimized injection parameters resulted in a 3.7–7.1% reduction in SOOT emission and a 1.2–2.6% reduction in NOx emissions compared to the original engine operating conditions. Based on limited experimental samples, SVM is inferred to be a useful tool for predicting the exhaust emissions of engines fueled with F-T diesel and can provide support for optimizing injection parameters.
    Keywords: CRDI engine, F-T diesel, Machine learning algorithm, Emission, Model optimization
  • مسلم سردشتی بیرجندی، حسین رحمانی*، سعید فراهت

    فاضلابروها جزء اصلی تاسیسات زیربنایی شبکه فاضلاب شهری به حساب می آیند. آسیب های فاضلابروها به دلیل غیرقابل رویت بودن کمتر توجه شده و این عدم رسیدگی به آسیب ها، موجب وضعیت های اضطراری و هزینه های غیر منطقی می گردد. این شریان های حیاتی در طول سرویس دهی، نیازمند نگهداری و بازسازی جهت عملکرد بهینه در تمام ابعاد می باشند. امروزه روش های پردازش و طبقه بندی عکس و فیلم-های گرفته شده توسط ربات های ویدیو متری متحرک برای انجام بازرسی شبکه فاضلاب بسیار مورد استفاده قرار می گیرند. یکی از الگوریتم های موفق در زمینه پردازش تصویر، الگوریتم شبکه عصبی کانولوشن است که از زیر مجموعه های الگوریتم یادگیری عمیق به شمار می رود. در این مقاله از یک الگوریتم شبکه عصبی کانولوشن جهت طبقه بندی تصاویر آسیب های شبکه فاضلاب و موارد موثر در بهبود و دقت و عملکرد این الگوریتم، پرداخته شده است. تصاویر توسط ربات ویدیومتری از شبکه فاضلاب بدست آمده است. نتایج حاصل از استفاده از الگوریتم پیشنهادی در شبکه فاضلاب، دستیابی به دقت 98 درصدی در طبقه بندی آسیب های شبکه و در مقایسه با سایر روش ها و نیز کاهش زمان اجرای نسبتا کم معماری پیشنهادی (91 دقیقه) در مقایسه با سایر معماری های معتبر در یادگیری عمیق در یک بستر سخت افزاری یکسان می باشد. همچنین، در آینده، الگوریتم پیشنهادی جهت تحلیل شبکه های فاضلاب بدون نیاز به نیروهای متخصص و همچنین کنترل یک ربات هدایت خودکار ویدیومتری شبکه فاضلاب مورد استفاده قرار خواهد گرفت.

    کلید واژگان: الگوریتم یادگیری عمیق، شبکه عصبی کانولوشن، ویدئومتری شبکه فاضلاب، پردازش تصویر
    Moslem Sardashti Birjandi, Said Farahat

    Sewage flow path is the main component of urban sewerage network infrastructure. Damage to sewers is less noticeable due to invisibility, and this failure to handle the damage leads to emergencies and unreasonable costs. These vital arteries need to be maintained and rebuilt during service for optimal performance in all dimensions. Nowadays, the methods of processing and classifying photos and videos taken by mobile videometer robots are widely used to inspect the sewer network. One of the successful algorithms in the field of image processing is the convolutional neural network algorithm, which is a subset of deep learning algorithm. In this paper, a convolutional neural network algorithm is used to classify images of sewer network damage and cases affecting the improvement, accuracy and performance of this algorithm. The images were obtained by a videometric robot from the sewer network. Results of using the proposed algorithm in the sewerage network, achieving 98% accuracy in classifying network faults and compared to other methods and also reducing the relatively low execution time of the proposed architecture (91 minutes) compared to other architectures valid ones are the same in deep learning on the same hardware platform. Also, in the future, the proposed algorithm will be used to analyze networks without the need for specialized personnel and also to control an automatic network videometry robot.

    Keywords: Deep learning algorithm, Convolution neural network, Sewer network videometry, Image Processing
  • هومن مریدویسی، فربد رزازی*، محمدعلی پورمینا، مسعود دوستی
    الگوریتم ردیابی یادگیری تشخیص (TLD) سنتی، نسبت به چالش هایی همچون تغییرات روشنایی، کلاترها و نرخ قاب پایین بسیار حساس بوده و باعث خطا در ردیابی هدف می گردد. در راستای غلبه بر این مشکلات و بهبود مقاومت الگوریتم، معماری الگوریتم ردیابی یادگیری تشخیص با ترکیب الگوریتم انتقال متوسط و الگوریتم یادگیری نیمه نظارتی هم یادگیری، بهبود داده شده است. این ساختار در شرایط نرخ قاب پایین نتایج بهتری را نتیجه می دهد و مقاومت و دقت الگوریتم را نسبت به الگوریتم سنتی ردیابی یادگیری تشخیص افزایش می دهد. زیرا الگوریتم ردیابی انتقال متوسط نسبت به چرخش، موانع جزیی، تغییرات اندازه مقاوم بوده و به سادگی اجرا شده و به محاسبات کمی نیاز دارد. از طرف دیگر الگوریتم یادگیری نیمه نظارتی هم یادگیری با دو طبقه بند مستقل می تواند تغییرات ویژگی های هدف را به خوبی آموزش ببیند. بنابراین، ساختار توسعه داده شده می تواند مشکل گم کردن هدف را در شرایط وجود همزمان نرخ قاب پایین و چالش های دیگر حل نماید. نهایتا، ارزیابی مقایسه ای روش پیشنهادی با الگوریتم های معروف ردیابی بر روی سناریوهای مختلف از پایگاه داده مشهور TB-100، حاکی از عملکرد برتر روش پیشنهادی در مقایسه با سایر روش ها از لحاظ مقاومت و پایداری است. نهایتا ساختار پیشنهادی بر اساس معماری ردیابی یادگیری تشخیص در ویدیوهایی با چالش های مختلف ذکر شده به طور متوسط حدود 33 درصد نتایج را نسبت به الگوریتم سنتی ردیابی یادگیری تشخیص بهبود خواهد بخشید.
    کلید واژگان: ردیابی هدف، الگوریتم انتقال متوسط، الگوریتم ردیابی یادگیری تشخیص، الگوریتم یادگیری ماشین، نرخ قاب پایین
    Hooman Moridvaisi, Farbod Razzazi *, Mohammad Ali Pourmina, Massoud Dousti
    The conventional Tracking-Learning-Detection (TLD) algorithm is sensitive to illumination change and clutter and low frame rate and results in drift even missing. To overcome these shortcomings and increase robustness, by improving the TLD structure via integrating mean-shift and co-training learning can be achieved better results undergo low frame rate (LFR) condition and the robustness and accuracy tracking of the TLD structure increases. Because of, the Mean-Shift tracking algorithm is robust to rotation, partial occlusion and scale changing and it is simple to implement and takes less computational time. On the other, the co-training learning algorithm with two independent classifiers can learn changes of the target features in during the online tracking process. Therefore, the extended structure can solve the problem of lost object tracking in LFR videos and other challenges simultaneously. Finally, comparative evaluations of the proposed method to other top state-of-the-art tracking algorithms under the various scenarios from the TB-100 known dataset, demonstrate the superior performance of the proposed algorithm compared to other tracking algorithms in terms of tracking robustness and stability performance. Finally, the proposed structure based on the TLD architecture, in scenarios with the various challenges mentioned, will improve on average about 33% of the results, compared to the traditional TLD algorithm.
    Keywords: Low frame rate, Machine learning algorithm, Mean-Shift algorithm, target tracking, Tracking learning detection
  • Iman Farzin, Mohammadhossein Abbasi, Amir Reza Mamdoohi *
    Spatial analysis and distribution are of great importance to transportation planners, especially in traffic demand management. Simulation is an important tool in the planning and management of transportation systems to achieve an estimation of real system behavior to evaluate different scenarios. Regarding the aggregate nature and inability to consider heterogeneity among the individuals in a large number of discrete choice models and the high cost of data collection through questionnaires, using a disaggregate and heterogeneous agent approach can be used to evaluate different policies. Since each agent is inherently autonomous and interacts with different agents and the environment to achieve its goals, this paper aims to use the agent-based approach to simulate the destination choice of discretionary tours of Qazvin citizens. Individual socioeconomic characteristics and travel information questionnaires (revealed preference) of 9938 households and 29840 individuals in 12 municipality districts of Qazvin were collected. After extracting 12 types of activity patterns including shopping and recreation trips, the simulation of destination choice in MATLAB has been studied using the Reinforcement Learning algorithm (RL) and reward-punishment functions which are based on the relative attractiveness of districts for various modes and travel times. High correlation (above 0.9) results were achieved among simulated trip destination choice distributions and observed survey data using the RL algorithm which illustrates the algorithm's goodness of fit; also the simulation results and survey data have a similar trend among districts which illustrates that the simulation findings have real-world implications.
    Keywords: Agent-Based Modeling, Reinforcement Learning Algorithm, Destination Choice, Discretionary Tours
  • منا طهماسبی*، محمد گهری، محمد مبارک آبادی
    ارتعاشات انتقال‏یافته به بدن راننده در خودروهای غیر‏جاده‏ای سنگین که سیستم تعلیق اولیه ندارند باعث ایجاد مشکلات سلامتی در بلند مدت می‏گردد. معمولا در این‏گونه از وسایل‏نقلیه سیستم تعلیق ثانویه در صندلی راننده تعبیه می‏شود تا بتواند جداسازی ارتعاشی و جذب آن را انجام دهد و باعث جلوگیری از مشکلات سلامتی بخصوص در ستون فقرات شود. سیستم تعلیق غیرفعال صندلی به طور گسترده برای این منظور استفاده می‏شود، اما کارایی آنها پایین است. سیستم تعلیق صندلی فعال و سیستم تعلیق نیمه‏فعال عملکرد بهتری در جلوگیری از نوسانات ناخواسته دارند. یکی از میراگرهایی که اخیرا مورد توجه محققان قرار گرفته است میراگر نیمه‏فعال مجهز به سیال هوشمند مگنتوریولوژیک است که با ایجاد میدان مغناطیس گرانروی سیال تغییر می‏کند. بدین‏ترتیب سیستم تعلیق با استفاده کمی از جریان الکتریسیته می‏تواند با تغییر ضریب میرایی به‏صورت موثری انرژی ارتعاشی را مستهلک کند. در مقاله حاضر یک کنترل‏گر جدید هوشمند فعال نیرو مجهز به تخمین‏گر یادگیری تدریجی طراحی و شبیه‏سازی شده است. سیستم تعلیق به مدل ارتعاش بدن انسان کوپل شد و نتایج ارتعاش بدن راننده بدست آمد. نکته قابل توجه این است که کنترل فعال نیرو می‏تواند برای حذف اغتشاشات سرعت بالا نیز بکار رود. از آنجایی‏که ارتعاشات رخ داده در خودرو دارای سرعت تغییرات بالا هستند نتایج نشان داد که کنترل فعال نیرو مجهز به سامانه تخمین‏گر یادگیری تدریجی می‏تواند بطور موثری در کاهش ارتعاش انتقالی به راننده عمل کند بطوری‏که پیک‏های اول و دوم ارتعاش در حدود 60 درصد کاهش داشتند.
    کلید واژگان: کنترل گر فعال نیرو، میراگر مگنتورئولوژیک، سیال هوشمند، الگوریتم یادگیری تدریجی، خودروی سنگین غیر‏جاده ای
    Mona Tahmasebi *, Mohammad Gohari, Mohammad Mobarakabadi
    Transmitted vibration to driver body (whole-body vibration) in heavy-duty Off-road vehicles without primary suspension leads to health problems in long term such as spine disorder, back pain, heart abnormal beating, vision disable, digestive problem, etc. Commonly, secondary seat suspension is used to isolate vibration and remove health problems, s especially in the spinal column. Passive seat suspension is widely employed for this purpose, but its efficiency is low. Active seat suspension and semi-active suspensions have better performance in blocking unwanted oscillation. Recently, semi-active magnetorheological dampers are focused on by researchers which can adjust their viscosity by electromagnetic flux. It is called smart fluid due to having controllable parameters such as damping ratio by electricity variations. Thus, suspension can dampen oscillation by low electricity current efficiently. The current paper introduces a novel active force control (AFC) equipped with an iterative learning estimator for seat suspension via MR damper. Results of simulations show that it can cancel vibration perfectly. The suspension was coupled to the human body vibration model, and the driver vibration results have been obtained. It is important to note that active force control can also be used to eliminate high-velocity disturbances. Since the vibrations that occur in the car have a high rate of change, the results indicated that active force control equipped with an iterative learning estimator system can be effective in reducing the transmission vibration to the driver so that the first and second vibration peaks was reduced by about 60%.MethodologyAt the first, a dynamic model of an off-road vehicle seat suspension which is equipped with an MR damper has been developed. After that, a PID controller has been designed for semi-active seat suspension. Next, the PID controller has been integrated into the AFC method. Lastly, utilizing the ILA in mass estimation for the AFC approach and simulation results of that has been discussed.The simulation work has been developed employing MATLAB/Simulink software whereas passive suspension and semi-active suspension via the PID and AFCAIL controllers were simulated. To evaluate the performance of the control schemes, the seat suspension model was exposed to a number of various disturbances as road roughness listed as follows:Results and DiscussionIn this section, a comparison between passive suspension and all the control methods has been performed in time and frequency domains. ConclusionA novel controller called the active force control has been employed for vibration control of seat suspension equipped by a magnetorheological (MR) damper. The AFC method was integrated into the iterative learning algorithm to calculate the estimated mass of the system named AFC-IL . The designed controllers were simulated for the vibration canceling of an off-road vehicle seat suspension system. The AFC technique achieved to be uncomplicated in terms of calculation and change it suitable for real-time working conditions. Moreover, the AFC demonstrates high performance and produce robust and accurate response still in the presence of various disturbances. The simulation results express that for known parameters and situations, the proposed AFC-IL method efficiency enhanced in comparison to the popular PID controller. The results exemplify that the AFC-based scheme as an intelligent control technique has proper potential to eliminate the disturbances superiorly for the off-road vehicle seat suspension. Although complementary efforts should be accomplished to investigate the influences of other types of disturbances, parameters and uncertainties changes in real situations such as road trials. In continuing a test rig will be developed to evaluate the AFC scheme performance in real conditions in terms of the vibration attenuating and optimized parameters.
    Keywords: Active Force control, Magnetorheological Damper, Smart Fluid, Iterative Learning Algorithm, Heavy Duty Off-Road Vehicle
  • ندا جلالی، محمد طلوع عسکری*، هادی رزمی

    طبقه بندی خودکار اختلالات کیفیت توان پایه و اساس حل مشکل کیفیت توان است. از نقطه نظر سنتی، فرآیند شناسایی اختلالات کیفیت توان باید به سه مرحله مستقل تقسیم شود: تحلیل سیگنال، انتخاب ویژگی و طبقه بندی. با این حال، برخی نواقص ذاتی در آنالیز سیگنال وجود دارد و روند انتخاب ویژگی دستی خسته کننده و غیردقیق است که منجر به دقت طبقه بندی پایین اختلالات چندگانه می شود. با توجه به این مشکلات، در این مقاله یک سیستم خودکار به منظور شناسایی و طبقه بندی اختلالات کیفیت توان ارایه شده است. در سیستم پیشنهادی پس از دریافت سیگنال ورودی پیش پردازش هایی نظیر تغییر بازه مقادیر با تقسیم سیگنال ها به دامنه پایه خود انجام می شود. در مرحله بعد مقدار RMS سیگنال برای بررسی رخداد اختلال مورد ارزیابی قرار می گیرد. در صورتی که RMS سیگنال ورودی با مقدار RMS سیگنال نرمال یکسان نباشد، به معنی رخداد اختلال در سیگنال است. به منظور شناسایی و دسته بندی اختلال ها از یک روش جدید مبتنی بر الگوریتم یادگیری عمیق استفاده شده است. در این روش، توابع فعال ساز به کمک توابع فازی تعریف می گردد. با این کار، انعطاف پذیری سیستم افزایش می یابد. مزیت روش ارایه شده در این است که به خوبی اختلالات ایجاد شده را از فرکانس پایه جدا می سازد و از ماهیت سیگنال های کیفیت توان به منظور استخراج ویژگی استفاده می کند. این در حالی است که جداسازی اجزای سیگنال در روش های کلاسیک مانند تجزیه مد تجربی به خوبی امکان پذیر نبوده است. برای ارزیابی الگوریتم از شبیه سازی شبکه توزیع قدرت 33 باسه استفاده شده است. دقت ارزیابی به دست آمده با استفاده از الگوریتم پیشنهادی در مقایسه با کارهای مشابه، بهبود نسبی پیدا کرده است.

    کلید واژگان: طبقه بندی اختلالات کیفیت توان، سیستم قدرت، الگوریتم یادگیری عمیق، الگوریتم هوشمند فازی
    Neda Jalali, Mohammad Tolou Askari*, Hadi Razmi

    Automatic classification of power quality disturbances is the foundation to deal with the power quality problem. From a traditional viewpoint, the identification process of power quality disturbances should be divided into three independent stages: signal analysis, feature selection, and classification. However, there are some inherent defects in signal analysis and the procedure of manual feature selection is tedious and imprecise, leading to a low classification accuracy of multiple disturbances. To deal with these problems, this paper presents an automated system for the classification and identification of power quality disturbances. After receiving input signals, the proposed system requires some preprocessing such as changing the range of values by dividing the signals into their basic domains. In the next stage, the RMS value of the signal can be appraised to know the occurrence of the disturbance. If the RMS value of the input signal is not equal to the normal signal, the disturbance is occurring. To identify and classify disturbances, a novel deep learning-based method is developed. In this method, the activation function is expressed by a fuzzy approach. This makes the system more flexible. The benefits of the proposed strategy are separating the disturbances of basic frequency and using the nature of power quality signals as a tool for feature extraction. However, in the traditional method, for example, in empirical mode decomposition, the separation of signals from their components is not conveniently possible. To evaluate the proposed algorithm, a 33-bus distribution power network has been applied. The results reveal good agreement in comparison with other assessment tests.

    Keywords: classification of power quality disturbances, power system, deep learning algorithm, fuzzy intelligent algorithm
  • AKBAR PAYANDAN, S. Hossein Hosseini Nejad *
    Deep learning has developed rapidly in recent years and has been applied in many areas that are major areas of artificial intelligence. The combination of deep learning and embedded systems has created good dimensions in the technical field. In this paper, a deep learning neural network algorithm can be designed that can be implemented on FPGA hardware. The PyTorch and CUDA were used as assistant methods. Convolution neural network (CNN) was also used for image classification. Three good CNN models such as ResNet, ResNeXt and MobileNet were reviewed in this article. Using these models in the design, an algorithm was eventually designed with the MobileNet model. Models were selected from different aspects such as floating operation point (FLOP), number of parameters and classification accuracy. In fact, the MobileNet-based algorithm was selected with a top-1 error of 5.5% in software with a 6-class data set. In addition, hardware simulation in MobileNet-based algorithms was presented. The parameters were converted from floating numbers to 8-bit integers. The output numbers of each layer were cut into integer fixed bits to fit the hardware constraint. A method based on working with numbers was designed to simulate number changes in hardware. The results of simulation show that, the top-1 error increased to 12.3%, which is acceptable.
    Keywords: Artificial Intelligence, deep learning, Image classification, Convolution Neural Network, Deep Learning Algorithm
  • AKBAR PAYANDAN, Seyed Hossein Hosseininazhad *
    Deep learning has progressed rapidly in recent years and has been applied in many fields, which are the main fields of artificial intelligence. Traditional methods of machine learning most use shallow structures to deal with a limited number of samples and computational units. When the target objects have rich meanings, the performance and ability to generalize complex classification problems will be quite inadequate. The convolutional neural network (CNN), which has been developed in recent years, widely used in image processing; because it has high skills in dealing with image classification and image recognition issues and it has led to great care in many machine learning tasks and it has become a powerful and universal model of deep learning. The combination of deep learning and embedded systems has created good technical dimensions. In this paper, several useful models in the field of image classification optimization, based on convolutional neural network and embedded systems, are discussed. Since this paper focuses on usable models on the FPGA board, models known for embedded systems such as MobileNet, ResNet, ResNeXt and ShuffNet have been studied.
    Keywords: Artificial Intelligence, deep learning, Image classification, Convolution Neural Network, Deep Learning Algorithm
  • الناز کلهر، امین نوری*، سارا صبوری راد، محمدعلی صدرنیا

    هدف اصلی در این مقاله، تعیین میزان بهینه دوز دارو برای کاهش جمعیت سلول های سرطانی در بیماران مبتلا به سرطان ملانوما می باشد. برای این کار از روش مسیرهای شایستگی که یکی از روش های حل مسئله یادگیری تقویتی می باشد، استفاده شده است. این روش مزایای دو روش مرسوم یادگیری تقویتی شامل یادگیری تفاوت گذرا و مونت کارلو را دارا می باشد. از دیگر مزایای این روش می توان به بی نیاز بودن آن به مدل ریاضی اشاره کرد ولی چون امکان پیاده سازی بر روی سیستم واقعی امکان پذیر نبوده است، برای بررسی عملکرد کنترلر پیشنهادی از مدل ریاضی غیرخطی تاخیردار جهت شبیه سازی رفتار محیط استفاده گردیده است. با توجه به بررسی هایی که تاکنون انجام شده است،لازم به ذکر می باشد که بر روی این مدل ریاضی هیچ نوع روش کنترلی پیاده سازی نشده است و این اولین باری می باشد که کنترل جمعیت سلول های سرطانی برای این مدل انجام گرفته است. در کنترل بهینه دوز دارو، میزان دارو می بایست به گونه ای باشد تا از اثرات زیان بار دارو بر روی سلول های سالم تا حد امکان جلوگیری شود. با توجه به نتایج حاصل از شبیه سازی، مشاهده می شود که روش انتخابی توانسته است با تزریق زیر بهینه میزان دوز دارو، جمعیت سلول های سرطانی را کنترل کرده، کاهش داده و به صفر برساند که این امر، در کنار افزایش سلول های ایمنی بدن رخ داده است. در انتها برای نشان دادن مزیت روش انتخابی در افزایش سرعت برای کاهش سلول های سرطانی، این روش با روش الگوریتم یادگیری Q که یکی دیگر از روش های حل مسئله یادگیری تقویتی می باشد و روش کنترل بهینه مقایسه شده است. با اعمال عیب به سنسور سیستم نیز، عملکرد کنترلر پیشنهادی برای کاهش سلول های سرطانی در حضور عیب مورد بررسی قرار گرفت. برای بررسی یکی از مزایای روش یادگیری تقویتی که تطبیق پذیری آن با محیط می باشد، با لحاظ عدم قطعیت در پارامترهای سیستم و شرایط اولیه، کنترل جمعیت سلول های سرطانی در پنج بیمار مبتلا به سرطان ملانوما انجام شده است. همچنین سرعت همگرایی هر دو روش مسیرهای شایستگی و الگوریتم یادگیری Q در کاهش سلول های سرطانی به ازای نرخ های آموزش مختلف مورد بررسی قرار گرفته است.

    کلید واژگان: اثرات زیان بار دارو، الگوریتم یادگیری Q، کنترل جمعیت سلول های سرطانی، ملانوما، یادگیری تقویتی، مسیرهای شایستگی، کنترل بهینه
    Elnaz Kalhor, Amin Noori *, Sara Saboori Rad, Mohammad Ali Sadrnia

    This paper mainly aims to determine the optimal drug dosage for the purpose of reducing the population of cancer cells in melanoma patients. To do so, Reinforcement Learning method and the eligibility traces algorithm are employed, giving us the advantage of creating a compromise between the two algorithms of the reinforcement learning, being Monte-Carlo and Temporal Difference. Furthermore, it can be said that using this approach, there was no need to employ a mathematical model in the whole process. However, as its implementation on the real system was not possible, a delayed nonlinear mathematical model is used to investigate the performance of the proposed controller and simulate the behavior of the environment. It should be noted this mathematical model made use of no control method. This is the first time that population control of cancer cells is applied and tested on this model. To know of the optimal dosage of the drug, it should be mentioned that the drug is required to prevent the side effects on healthy/normal cells as much as possible. According to the obtained results, the eligibility traces algorithm is able to control and reduce the population of cancer cells through injecting the sub-optimal drug dose. This will increase the level of immunity in our body. Finally, to demonstrate the advantage of a selective method of increasing the rate of cancer cell death, this method is compared with the Q-learning algorithm and optimal control. By applying the fault to the sensor, the performance of the proposed controller to reduce cancer cells was investigated. The adaptability of the proposed method with the environment changes is checked afterwards. To this end, uncertainty in the system parameters and initial conditions are applied and the population of cancer cells are controlled in five melanoma patients. Moreover, having added noise to the system, it was shown that the eligibility traces algorithm is able to control the population of cancer cells and make it reach zero. Additionally, the convergence speed of both eligibility traces algorithm and Q learning algorithm in reducing the number of cancer cells for different learning rates was investigated.

    Keywords: Side effects of drugs, Q-learning algorithm, cancer cells population control, Melanoma, Reinforcement Learning, Eligibility Traces, Optimal control method
  • Elham Golrasan, Hossein Shirazi*, Kourosh Dadashtabar

    Wireless sensor networks consist of a collection of sensor nodes deployed densely and randomly to fully cover a set of targets. Due to high redundancy incurred, it is possible to both preserve energy and enhance coverage quality by first switching off some sensors and then adjusting the sensing radius of the remaining ones. In this paper, the problem of target coverage in wireless sensor networks is studied by keeping a small number of active sensor nodes and adjusting the sensing radius of nodes. We propose a new game theory-based algorithm to target coverage. Inspired by current challenges in energy-limited sensor networks, we formulate the target coverage problem with adjustable sensing range as a repeated multiplayer game in which a utility function is formulated to consider the tradeoff between energy consumption and coverage quality. To solve the formulated game and achieve the Nash equilibrium, we present a distributed payoff based learning algorithm where each sensor only remembers its utility values and actions played during the last plays. The simulation results demonstrate the performance of our proposed game-theoretic algorithm and its superiority over previous approaches in terms of increasing the coverage rate and reducing the number of active nodes.

    Keywords: Sensor networks, target coverage, game theory, sensing radius adjustment, distributed learning algorithm
  • امین نوری*، الناز کلهر، محمدعلی صدرنیا، سارا صبوری راد

    سرطان پوست یکی از خطرناک ترین سرطان هایی است که همه ساله افراد زیادی به آن مبتلا می شوند. به همین دلیل تشخیص و درمان سریع این سرطان بسیار برای پزشکان حایز اهمیت می باشد، در چند دهه اخیر برای بهبود تشخیص و درمان این بیماری استفاده از روش های هوشمند بسیار مورد توجه قرار گرفته است. هدف اصلی در این مقاله، تعیین مقدار بهینه دارو برای از بین بردن سلول های سرطانی می باشد به گونه ای که از تاثیر سوء دارو بر روی سلول های سالم جلوگیری شود. از الگوریتم یادگیری Q  بدین منظور استفاده شده است. برای انتخاب اعمال، از سیاست استدلال مبتنی بر مورد با نام اختصاری CBR که یک نوع سیاست اکتشافی شتاب داده شده می باشد، استفاده گشته است که باعث افزایش سرعت یادگیری و کاهش زمان،  برای رسیدن به سیاست بهینه می شود. مورد دیگری که در این مقاله لحاظ شده است، تاثیر نیمه عمر دارو برای بدست آوردن اثر دارو در هر لحظه در بدن بیمار می باشد. برای اینکه  عملکرد روش یادگیری تقویتی در کنترل سلول های سرطانی و تعیین میزان بهینه دوز دارو  بهتر نشان داده شود، این روش با  یکی از روش های کنترل بهینه به نام روش همیلتونین و روش تزریق دوز داروی ثابت مقایسه شده است. در نهایت نشان داده شده است مجموع دوز داروی تزریقی به بیمار با استفاده از روش یادگیری تقویتی در مقایسه با حالتی که از روش کنترل بهینه و دوز داروی ثابت برای تمام زمان ها استفاده شده است، بسیار کاهش پیدا کرده است و در ضمن جمعیت سلول های سرطانی نیز کنترل شده است. با اعمال نویز و عدم قطعیت در پارامترهای سیستم و شرایط اولیه باز هم روش انتخابی قادر به کنترل سلول های سرطانی می باشد.

    کلید واژگان: سرطان ملانوما، الگوریتم یادگیری Q، سیاست استدلال مبتی بر مورد، اثرات سوء دارو، نیمه عمر دارو، کنترل بهینه
    Amin Noori*, Elnaz Kalhor, MohammadAli Sadrnia, Sara Saboori Rad

    Melanoma is one of the most dangerous types of cancers and every year, many people suffer from this cancer. Hence, quick diagnosis and treatment are significantly important for the physicians. In the recent decade, intelligent methods have attracted considerable attention for diagnosing and treating the melanoma. The main objective of this paper is determining the optimal dosage of the drug for the elimination of the cancer cells while preventing from the side effect of the drug on the normal cells. To this aim, the Q-learning algorithm is employed. In order to select the actions, a Case-Based Reasoning (CBR) policy is used, which is an accelerated heuristic policy. The considered policy has increased the learning speed and reduced the overall time, to reach the optimal policy. The half-life effect of the drug is also considered to obtain the side effect of the drug on the patientchr('39')s body, at each time step. In order to demonstrate Q-learning algorithm performance in cancer cells control and optimal dosage determination purposes, Q-learning is compared with two methods, including fix dosage injection method and Hamiltonian method, which is one of the most important optimal control methods. Finally, it is revealed that the total injected dosage by using Reinforcement Learning method (Q-learning) is significantly reduced within the whole period of time in comparison with employing the optimal control and a fixed dosage injection cases. The number of cancer cells is controlled, as well. It should be noted that by applying the noise and uncertainty to the system parameters and the initial conditions, the proposed method can successfully control the cancer cells.

    Keywords: melanoma cancer, Q-learning algorithm, case based reasoning, side effect of the drug, half-life of drug, optimal control
  • سید محمدرضا موسوی، اکرم محسنی، عبدالله امیرخانی
    نگاشت های ادراکی فازی (FCM) که از تکنیک های محاسبات نرم محسوب می شوند، با ترکیب منطق فازی و تئوری شبکه های عصبی، به عنوان ابزاری قدرتمند برای مدل سازی سیستم های پیچیده معرفی گشته اند. استفاده از الگوریتم های یادگیری مختلف برای غلبه بر ضعف های این مدل، یکی از حوزه های فعال علمی است. در این مقاله یک الگوریتم ترکیبی جدید مبتنی بر الگوریتم یادگیری هبین غیرخطی (NHL) و الگوریتم ژنتیک کدحقیقی (RCGA) معرفی می شود که به صورت درهم تنیده عمل کرده و با بهبود مشخصه های هر یک از این دو الگوریتم، قابلیت به کارگیری در مدل های مختلف تصمیم گیری را با دقت بالا دارد. مدل پیشنهادشده بر روی یک مسئله ی کنترل فرآیند پیاده سازی شده است.
    کلید واژگان: الگوریتم یادگیری ترکیبی، نگاشت ادارکی فازی، الگوریتم ژنتیک، یادگیری هبین غیرخطی
    M. R. Mosavi, Akram Mohseni, Abdollah Amirkhani
    Fuzzy cognitive maps (FCMs) that are soft computing techniques, by combining fuzzy logic and neural network theory, have been known as a powerful tool for modeling complex systems. Utilization of different learning algorithms to overcome the weaknesses of this model, is one of the active area of science. In this paper, a new hybrid algorithm based on nonlinear Hebbian learning and real-coded genetic algorithm is introduced, which operate in an entangled way and by improving the characteristics of each of these two algorithms, can be applied in different decision-making models with high precision. The proposed model is implemented on a process control problem.
    Keywords: Hybrid learning algorithm, Genetic Algorithm, Fuzzy cognitive map, Nonlinear Hebbian learning
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال