support vector regression
در نشریات گروه فنی و مهندسی-
The work focuses on predicting the bearing response in hydrothermal-aged carbon fiber-reinforced epoxy composite (CFREC) joints through the utilization of machine learning techniques. CFREC are extensively employed in aerospace and other high-performance applications, and their long-term structural integrity is of paramount importance. The hydrothermal aging process can significantly affect the mechanical behavior of such composites, particularly in joint configurations. In this research, an innovative support vector regression approach is present that leverages machine learning algorithms to forecast the bearing response of CFREC joints after undergoing hydrothermal aging. The study encompasses the development of predictive models using a comprehensive dataset of experimental observations. The machine learning technique, support vector regression is trained and evaluated to assess their accuracy and reliability in predicting bearing response. The results show that the overall percent reduction in bearing response, after 30 days of pristine composite bolted joints at 0 Nm bolt torque shows reductions of 23.22 % at 65°C, respectively. Conversely, under the same conditions, MWCNTs added composite bolted joints exhibit only a 9.2% reduction. The predictive models find the value of 0.0081 RSME and 0.8 R2 respectively through support vector regression confirming that the predicted values lie in between the upper and lower bond.Keywords: Carbon Fiber, Epoxy Resin, Machine Learning, Bearing Response, Support Vector Regression
-
ایستگاه های پمپاژ مهمترین مصرف کنندگان انرژی در صنعت آب و فاضلاب هستند که انرژی الکتریکی در آن ها نقشی اساسی دارد. مهم ترین عامل مصرف انرژی در سیستم های پمپاژ نحوه عملکرد پمپ است. مصرف انرژی در واحد حجم سیال پمپاژ شده در هر پمپ به ازای دبی های مختلف پمپاژ، متفاوت است بدین جهت بازده پمپ با دبی آن تغییر خواهد کرد. در این مقاله نویسندگان یک روش بهینه سازی با مدل ترکیبی الگوریتم گرگ خاکستری و رگرسیون بردار پشتیبان را جهت تنظیم یک پمپ در سیستم پمپاژ فاضلاب تحت جریان ورودی متغیر ارائه کرده اند. داده های دبی استفاده شده در این مدل، مربوط به ایستگاه پمپاژ ورودی تصفیه خانه فاضلاب زاهدان است. داده های دریافتی با فرکانس ساعتی، با استفاده از روش مونت کارلو و توزیع نرمال به داده هایی با فرکانس دقیقه ای تبدیل شدند. سپس، با بهره گیری از الگوریتم بهینه سازی گرگ خاکستری و روابط هیدرولیکی پمپاژ، مقادیر بهینه متغیرهای دبی، هد، توان و بازده سیستم تعیین گردید. این مقادیر به عنوان ورودی به مدل رگرسیون بردار پشتیبان وارد شده و مدل برای پیش بینی سرعت دوران بهینه پمپ آموزش داده شد. مدل ترکیبی حاصل، منجر به کاهش مصرف انرژی و افزایش بازده پمپ به میزان تقریبی 10 درصد نسبت به حالت دور ثابت در دوره های زمانی مختلف شد. مقایسه نتایج شبیه سازی سرعت دوران پمپ توسط رگرسیون بردار پشتیبان با نتایج حاصل از الگوریتم گرگ خاکستری، نشان دهنده دقت بسیار بالای مدل رگرسیون با ضریب همبستگی (R2) بیش از 0.996 است.کلید واژگان: بهینه سازی، دور پمپ، گرگ خاکستری، رگرسیون بردار پشتیبانIntroductionWastewater treatment plants (WWTPs) play a vital role in protecting public health and the environment, but the treatment process itself is energy-intensive. Among the various stages, pumping stations stand out as major energy consumers, responsible for lifting wastewater through the treatment cycle. Traditionally, these stations have relied on fixed-speed pumps, leading to inefficiencies when dealing with variable inflow rates – a common occurrence in WWTPs. Recent advancements in artificial intelligence (AI) offer promising solutions for optimizing pump control strategies and minimizing energy consumption. AI techniques like machine learning and optimization algorithms can analyze real-time data, predict future inflow trends, and dynamically adjust pump speeds accordingly. Studies have demonstrated the effectiveness of AI-based pump control in reducing energy use by significant margins. This research explores a novel AI-based approach combining the Grey Wolf Optimization (GWO) algorithm and Support Vector Regression (SVR) for optimizing pump speed control in WWTP pumping stations. GWO, inspired by grey wolf hunting behavior, identifies optimal pump operation parameters to minimize energy consumption. SVR, a machine learning technique, predicts future pump speed requirements based on real-time data and the optimized GWO parameters. Utilizing real-world data from Zahedan Refinery's pumping station, this study aims to validate the proposed GWO-SVR approach and assess its potential for reducing energy consumption in WWTPs, thereby enhancing operational efficiency and sustainability.Materials and MethodsIn this section, an optimization model for a wastewater pump is developed and presented. The pump is situated in a reservoir where the inflow pattern is randomly generated based on a real-world measured dataset. The Zahedan Wastewater Treatment Plant is located on a 24-hectare land in the east of the city, designed to serve a population of about 900,000 people in the future. The project includes 17 kilometers of transmission lines, a reservoir, and a pumping station. The hourly inflow data to the treatment plant was measured for a pumping station with a constant cross-sectional area of the reservoir of 12 square meters, and a minimum and maximum height of 1 and 9 meters, respectively, in the year 1400 (2021). Based on the 12 month data of 1400, the maximum average wastewater flow rate was 6.99 liters per second in June, and the maximum standard deviation was 68.27 in February (Table 1)The optimization problem is formulated to minimize daily energy consumption for pumping equation(12).Two models are compared:• Classic Model: Fixed pump speed operation• Optimization Model: GWO-based variable speed control for optimized energy usageSVR is introduced to predict pump speed based on data obtained from the optimization model.Discussion andResultsThe GWO algorithm is implemented to identify optimal pump operation parameters (Table 3). The SVR model is then employed to predict pump speed based on these optimized parameters. The optimized model is compared to a fixed-speed system, demonstrating significant energy savings. Figures 4 to 6 show the changes between constant-speed (ηcs) and variable-speed (ηopt) performance based on α and β for different time windows of Zahedan station in 2021. With increasing inflow rates (decreasing α), the variable-speed pump performance improves over the constant-speed pump, widening the gap between ηopt and ηcs. Conversely, with decreasing inflow rates (increasing α), this gap narrows. The parameter β, which regulates pump speed, increases performance for both pump types when raised. These optimizations were performed for 30, 60, and 120 minute time windows in 2021, with the variable-speed pump outperforming the constant-speed pump in all cases. Across all time windows, increasing the inflow rate (smaller α) results in a larger energy saving (ε) for the variable-speed pump over the constant-speed pump. With increasing β, which allows higher pump speeds, ε decreases for the same inflow rates (constant α). This is because at higher β values, the variable-speed pump behaves more like a constant-speed pump. The correlation coefficients comparing these optimization results to simulations in 2021 are 0.9996-0.9999 for pump speed and 0.9976-0.9999 for energy, indicating the high accuracy of the SVR simulations and GWO optimization. Figure 10 compares the optimized GWO and simulated SVR results for pump speed in a 60-minute window, while Figure 11 shows the same for pump energy consumption. The close agreement between the optimization and simulation demonstrates the effectiveness of the proposed GWO-SVR model.ConclusionsThis study investigated a novel AI-based approach combining the Grey Wolf Optimization (GWO) algorithm and Support Vector Regression (SVR) model for optimizing pump speed control in wastewater treatment plant pumping stations. The GWO-SVR model demonstrated significant energy savings in the variable-flow pumping station compared to a fixed-speed system. The SVR model accurately predicted optimal pump speeds based on real-time data and GWO-optimized parameters, enabling efficient, dynamic pump control. The combined GWO-SVR approach provides a practical solution for WWTP operators to optimize pump control, achieve substantial energy savings, and contribute to more sustainable and cost-effective wastewater treatment practices. Its successful implementation in existing pumping stations can drive improved operational efficiency and environmental sustainability.Keywords: Energy efficiency - simulation - pumping station - gray wolf algorithm - support vector regressionKeywords: Optimization, Round Pump, Gray Wolf, Support Vector Regression
-
امروزه با رشد بی نظیر هوش مصنوعی و افزایش کاربردهای آن در زمینه های مختلف، کاربرد آن در صنعت نیز بیش ازپیش مورد استقبال قرارگرفته است. از نمونه های بارز این کاربردها، استفاده از تکنیک های هوش مصنوعی برای مدل سازی و پیش بینی نیازهای توان در فرآیند ماشین کاری است. وضعیت فعلی باعث افزایش احساس نیاز به پذیرش مدل های پیش بینی توان شده تا در برنامه ریزی فرآیند پایدار قابل اعمال باشد. این مقاله دو تکنیک مدل سازی هوش مصنوعی - شبکه عصبی مصنوعی و رگرسیون بردار پشتیبان - را برای پیش بینی توان مصرفی در فرآیند ماشین کاری معرفی می کند. برای بررسی قابلیت این تکنیک ها برای پیش بینی ارزش توان، یک آزمایش واقعی ماشین کاری انجام شده است. آزمایش ها با استفاده از روش Taguchi طراحی شده اند تا تاثیر تمام پارامترها با حداقل تعداد ممکن از آزمایش ها موردمطالعه قرار گیرد. یک طراحی Taguchi 4-سطح 3- عامل L16 برای شرح طرح آزمایش ها استفاده شده است. توان پیش بینی شده توسط هر دو تکنیک مقایسه و ارزیابی شده و مشخص شده است که شبکه عصبی مصنوعی نسبت به رگرسیون بردار پشتیبان به نسبت کمی بهتر عمل می کند. برای بررسی کارایی مدل ها، برخی از آزمون های فرضیه نماینده ازجمله آزمون t برای آزمایش میانگین، آزمون f و آزمون Leven برای آزمایش واریانس انجام شده است. نتایج نشان می دهد که مدل های پیشنهادی در تحقیق برای پیش بینی توان مناسب هستند.
کلید واژگان: توان، مدل سازی پیش بینی، شبکه عصبی مصنوعی، رگرسیون بردار پشتیبانToday, with the unprecedented growth of artificial intelligence (AI) and its increasing applications across various fields, its use in industry has gained significant traction. A notable example of this application is the use of AI techniques for modeling and predicting power requirements in machining processes. The current state has heightened the need for adopting power prediction models to facilitate sustainable process planning. This paper introduces two AI modeling techniques—Artificial Neural Networks (ANN) and Support Vector Regression (SVR)—for predicting power consumption in machining processes. To evaluate the capabilities of these techniques in forecasting power values, a real machining experiment was conducted. The experiments were designed using the Taguchi method to study the impact of all parameters with the minimum number of trials possible. A Taguchi L16 4-level 3-factor design was employed to describe the experimental setup. The predicted power values from both techniques were compared and assessed, revealing that the ANN performs slightly better than SVR. To evaluate the models' performance, several representative hypothesis tests were conducted, including t-tests for mean testing, F-tests, and Levene's test for variance testing. The results indicate that the proposed models in this study are suitable for power prediction.
Keywords: Power, Predictive Modeling, Artificial Neural Network, Support Vector Regression -
مجله محیط و معدن، سال پانزدهم شماره 3 (Summer 2024)، صص 1011 -1027
The objective of this research work to employ machine learning techniques including Multilayer Perceptron Artificial Neural Networks (ANN-MLP), Random Forests (RFs), Extreme Gradient Boosting (XGBoost), and Support Vector Regression (SVR) to predict copper ore grades in a copper deposit located in Peru. The models were developed using 5654 composites containing available geological information (rock type), as well as the locations of the samples (east, north, and altitude) and secondary ore grade (Mo) obtained from drilling wells. The data was divided into 10% (565 composites) for testing, 10% (565 composites) for validation, and 80% (4523 composites) for training. The evaluation metrics included SSE (Sum of Squared Errors), RMSE (Root Mean Squared Error), NMSE (Normalized Mean Squared Error), and R² (Coefficient of Determination). The XGBoost model could predict the ore grade with an SSE of 15.67, RMSE = 0.17, NMSE = 0.34, and R² = 0.66, the RFs model with an SSE of 16.40, RMSE = 0.17, NMSE = 0.36, and R² = 0.65, the SVR model with an SSE of 19.94, RMSE = 0.19, NMSE = 0.43, and R² = 0.57, and the ANN-MLP model with an SSE = 21.00, RMSE = 0.19, NMSE = 0.46, and R² = 0.55. In conclusion, the XGBoost model was the most effective in predicting copper ore grades.
Keywords: Multilayer Perceptron Artificial Neural Network, Random Forests, Extreme Gradient Boosting, Support Vector Regression -
مقاله حاضر یک روش دومرحله ای قدرتمند برای تشخیص خسارت پل های بزرگ دهانه با مقاطع متغیر ارائه می نماید. پل ها یکی از زیرساخت های اساسی در حوزه حمل ونقل شهری و برون شهری بوده که تشخیص خسارت به موقع درطول بهره برداری آن حائز اهمیت می باشد. خسارت دراین دسته از سازه ها سبب اختلال درخدمت رسانی درزمان بروزبلایای طبیعی خواهد شد. روش ارائه شده بر مبنای ترکیب المان محدود طیفی و شاخص خسارت انرژی کرنشی مودال و همچنین ترکیب الگوریتم ژنتیک و رگرسیون بردار پشتیبان برای تشخیص وتخمین میزان شدت خسارت می باشد. یکی از روش های کارآمد درحوزه انتشار امواج روش المان محدود طیفی بوده که از قابلیت مدلسازی با انعطاف پذیری بالا و تشخیص خسارات ریز می باشد. روش های مبتنی بر ارتعاش بطور گسترده برای تشخیص خسارت سازه ها استفاده می گردد درحالیکه شاخص خسارت انرژی کرنشی مودال از حساسیت بالاتری در تشخیص خسارت در میان دیگر روش های مبتنی برارتعاش برخوردار است. مدل مورد تحقیق، پل کروچایلد درغرب کانادا می باشد که دارای ویژگی های خاصی از نظرهندسی و هم از مشخصات المان های سازه ای می باشد. در این تحقیق شاخص خسارت انرژی کرنشی مودال به علت تغییر مقطع در طول شاه تیر ها اصلاح گردیده است. همچنین از رگرسیون بردار پشتیبان به عنوان یک تکنیک قدرتمند در تخمین میزان شدت خسارت استفاده شده است. جهت افزایش دقت و بهبود روش تخمین میزان شدت خسارات از الگوریتم ژنتیک برای بهینه سازی پارامترهای موثر رگرسیون بردار پشتیبان استفاده می گردد. روش ترکیبی الگوریتم ژنتیک و رگرسیون بردار پشتیبان توانسته است به نحو مطلوبی شدت خسارات را تخمین بزند.
کلید واژگان: تشخیص خسارت چندگانه، خسارات ریز و کوچک، المان محدود طیفی، شاخص خسارت انرژی کرنشی مودال، رگرسیون بردار پشتیبان، الگوریتم ژنتیکThis paper presents a powerful two-step method for damage detection of large-span bridges with variable sections. Bridges are one of the basic infrastructures in the field of urban and suburban transportation, and timely detection of damage during its operation is important. Damage in this category of structures will cause service disruption during natural disasters. The presented method is based on the combination of spectral finite element and modal strain energy damage index, as well as the combination of genetic algorithm and support vector regression to detect and estimate the damage severity. One of the efficient methods in the field of wave propagation is the spectral finite element method, which is capable of modeling with high flexibility and detecting micro damage. Vibration-based methods are widely used to detect structural damage, while the modal strain energy damage index has a higher sensitivity in detecting damage among other vibration-based methods. The case study model is the Crowchild Bridge in Western Canada, which has special characteristics in terms of geometry and the characteristics of structural elements. In this research, the modal strain energy damage index has been modified due to the change of cross-section along the girders. Also, support vector regression has been used as a robust technique in estimation damage severity. In order to increase the accuracy and improve the damage severity estimation method, the genetic algorithm is used to optimize the effective parameters of the support vector regression. The combined method of genetic algorithm and support vector regression has been able to estimate the severity of damages in a favorable way.
Keywords: Multiple Damage Detection, Micro, Small Damages, Spectral Finite Element, Modal Strain Energy Damage Index, Support Vector Regression, Genetic Algorithm -
Accurate settlement forecasting is essential for preventing severe structural and infrastructure damage. This paper investigates predicting tunneling-induced ground settlements using machine learning models. Empirical methods for estimating settlements are often imprecise and site-specific. Developing novel, accurate prediction methods is critical to avoid catastrophic damage. The umbrella arch method constrains deformations for initial stability before installing primary support. This study develops machine learning models to forecast settlements solely from umbrella arch parameters, disregarding soil properties. Multilayer perceptron artificial neural networks (MLP-ANN) and support vector regression (SVR) are applied. Results demonstrate machine learning outperforms empirical methods. The MLP-ANN surpasses SVR, with R2 of 0.98 and 0.92, respectively. Strong correlation is observed between umbrella arch configuration and settlements. The suggested approach effectively estimates surface displacements lacking mechanical properties. Overall, this study supports machine learning, specifically MLP-ANN, as an efficient, reliable alternative to empirical methods for predicting tunneling-induced ground settlements from umbrella arch design.Keywords: Surface Settlement, Settlement prediction, Umbrella Arch Method, Artificial Neural Networks, Support vector regression
-
تابش خورشیدی پارامتر اساسی مورد نیاز برنامه های انرژی خورشیدی به دلیل محدودیت های تکنیکی و مالی در اقصی نقاط جهان اندازه گیری نمی شود و تعیین آن با روش های تخمینی دقیق ضروری است. در این تحقیق، یک مدل برای تخمین تابش خورشیدی پراکنده ی افقی روزانه با روش های هیبریدی ماشین بردار رگرسیونی، الگوریتم های گرگ و هارمونی توسعه یافت. در بررسی اعتبار مدل، داده های تابش خورشیدی اندازه گیری شده روزانه شهرهای مختلف با اقلیمهای متفاوت در قسمت آفتابی ایران (بندرعباس، کرمان، سنندج، سمنان و زاهدان) استفاده شد. پارامترهای ورودی مدل ها، دمای متوسط، رطوبت نسبی، ساعت آفتابی، تبخیر و سرعت باد می باشند. مقایسه تابش خورشیدی مدل هیبریدی با مقادیر اندازه گیری شده نشان دهنده نتایج مطلوب بر اساس تحلیل آماری بوده و مدل ماشین بردار رگرسیونی - هارمونی روشی کارآمد و دقیق در مقایسه با سایر مدل ها به ویژه مدل های تجربی می باشد. متوسط خطای بایاس مطلق بدست آمده، خطای مجذور متوسط ریشه و ضریب همبستگی برای ایستگاه زاهدان به ترتیب برابر با 77/14 مگاژول بر مترمربع، 85/ 26 مگاژول بر مترمربع و 68/0 برای معادله تجربی و مقادیر بدست آمده ماشین بردار رگرسیونی - هارمونی به ترتیب برابر با 85/13 مگاژول بر مترمربع ، 58/9 مگاژول بر مترمربع و 71/0 می باشد.
کلید واژگان: تابش خوشیدی، تغییر اقلیم، ماشین بردار رگرسیونی، الگوریتم گرگ، الگوریتم هارمونی، تجربیSolar radiation, the basic parameter required for solar energy programs, is not measured in all parts of the world due to technical and financial limitations, and it is necessary to determine with the accurate estimation methods. In this research, a model was developed to estimate the daily horizontal scattered solar radiation with the hybrid methods of Support Vector Regression, Gray Wolf Optimization and Harmony Search Algorithm. To determine the validity of the model, daily measured solar radiation data of different cities in the sunny part of Iran (Bandar Abbas, Kerman, Sanandaj, Semnan and Zahedan) were used. The input parameters of the models are the mean temperature, relative humidity, sunshine hour, evaporation and wind velocity. The comparison of the solar radiation of the hybrid model with the measured values shows the desired results based on statistical analysis, and the hybrid model is an efficient and accurate method compared to other models, especially experimental models. The average absolute bias error obtained, root mean square error and correlation coefficient for Zahedan station are respectively equal to 14.77 MJ⁄m^2, 26.85 MJ⁄m^2, and 0.68 for the experimental equation and the obtained values of the regression vector machine - Harmony respectively It was similar to 13.85MJ⁄m^2, 9.58 MJ⁄m^2 and 0.71. The research results showed that the regression-harmony vector machine model is an efficient method that is much more accurate than other models.
Keywords: Solar radiation, Climate change, support Vector Regression, Wolf Optimization Algorithm, harmony search algorithm, Experimental Models -
سازه هایی نظیر پلها در طول عمر بهره برداری خود در معرض انواع خسارات ریز و کوچک قرار می گیرند. با توجه به اهمیت و نقش این دسته از سازه ها در حوزه حمل و نقل ، تشخیص به موقع خسارت در آنها از جایگاه ویژه ای برخوردار است. از این رو در این تحقیق یک روش نوین و کارآمد برای تشخیص و تخمین خسارات ریز و کوچک در پل ها ارایه گردیده است. روش ارایه شده بر مبنای ترکیب المان محدود طیفی و شاخص انرژی کرنشی مودال برای تشخیص موقعیت خسارت بوده و از تکنیک رگرسیون بردار پشتیبان جهت تخمین میزان شدت خسارت استفاده شده است. برای مدلسازی المان هشت گره ای جدید که دارای ویژگی های المان محدود طیفی می باشد در نرم افزارOpenSees تعریف گردید. سپس جهت مدلسازی خسارات ریز و کوچک به ترتیب از یک تیر یک دهانه و یک تیر دو دهانه فولادی با تکیه گاه های ارتجاعی استفاده شده است. جهت تشخیص خسارات در گام اول پس از تحلیل مودال سازه ها به محاسبه شاخص انرژی کرنشی مودال پرداخته تا موقعیت خسارات در سازه تشخیص داده شود. در گام دوم با استفاده از شاخص های انرژی کرنشی مودال محاسبه شده در گام قبل به آموزش شبکه های رگرسیون بردار پشتیبان برای تخمین میزان شدت خسارات پرداخته می شود. نتایج کاربرد روش دو مرحله ای ارایه شده نشان دهنده دقت مناسب و عملکرد مطلوب آن می باشدکلید واژگان: تشخیص خسارت، المان محدود طیفی، شاخص خسارت انرژی کرنشی مودال، تیر فولادی، رگرسیون بردار پشتیبانBridges are exposed to various micro and small damages during their service life. Due to the importance and role of these structures in transportation on roads, timely detection of damages in them has a special place. This research presents an innovative and efficient method for diagnosing and estimating micro and small damages to bridges. The proposed method is based on the combination of spectral finite element and modal strain energy-based damage index to determine the location of damages in the first step. Then the support vector regression technique is used to estimate the severity of damages in the second step. A new eight-node element with spectral finite element characteristics is defined in OpenSees software. Then, micro and small damages are modeled in a single-span beam and a double-span steel beam with spring supports. In the first step, after modal analysis of the structures, the modal strain energy-based damage index is calculated to determine the location of the damages. In the second step, using the modal strain energy-based damage indices calculated in the previous step, the support vector regression networks are trained to estimate the severity of the damages. The results show very high accuracy and optimal performance of the proposed method.Keywords: Damage detection, Spectral finite element, Modal strain energy index, steel beam, Support vector regression
-
روستاهای واقع در استان اصفهان یکی از مناطق مستعد شیوع بیماری لیشمانیوز پوستی است که با وقوع زخم روی پوست مشخص می شود. برای پیش بینی شیوع بیماری لیشمانیوز پوستی در آینده، نظارت مداوم بر روند توزیع مکانی این بیماری ضروری است. مدلسازی بیماری با استفاده از دو الگوریتم یادگیری ماشین به نام های رگرسیون بردار پشتیبان (SVR) و شبکه عصبی پرسپترون چند لایه (MLP) انجام شده است. عملکرد این الگوریتم ها با استفاده از شاخص RMSE ارزیابی شده است. تحلیل نتایج نشان می دهد الگوریتم SVR با RMSE=0.170 در مقایسه با MLP با RMSE= 0.348 عملکرد بهتری دارد. عوامل محیطی شامل دما، رطوبت، بارش، ارتفاع و سرعت باد به عنوان متغیر های مستقل و تخمین تراکم بیماری لیشمانیوز پوستی به عنوان متغیر وابسته در فرایند مدلسازی مورد استفاده بودند، که از این تعداد ( 70 %) برای آموزش مدل و ( 30 %) باقی مانده برای ارزیابی مدل مورد استفاده قرار گرفتند. نتایج شاخص تحلیل مکانی نشان داد الگوی توزیع بیماری لیشمانیوز پوستی در سال های 1397 تا 1399 بصورت خوشه ای بوده است.
کلید واژگان: بیماری لیشمانیوز پوستی، شبکه عصبی پرسپترون چندلایه، رگرسیون بردار پشتیبان، الگوی بیماری، روستاهای استان اصفهانVillages located in Isfahan province are one of the areas prone to the spread of cutaneous leishmaniasis, which is characterized by the occurrence of wounds on the skin. To predict the future prevalence of cutaneous leishmaniasis, Continuous monitoring of the spatial distribution of this disease is essential. Disease modeling was performed using two machine learning algorithms called support vector regression (SVR) and multilayer perceptron neural network (MLP). The performance of these algorithms is evaluated using the RMSE index. Analysis of the results shows that SVR algorithm with RMSE = 0.170 compared to MLP with RMSE = 0.348 has better performance. Environmental factors include temperature, humidity, precipitation, altitude and wind speed as independent variables and Estimation of leishmaniasis density was used as a dependent variable in the modeling process, Of which (70%) were used for model training and the remaining (30%) for model evaluation. The results of spatial analysis index showed that The distribution pattern of cutaneous leishmaniasis in the years 1397 to 1399 was clustered.
Keywords: Cutaneous leishmaniasis, Multilayer perceptron neural network, Support vector regression, Pattern of disease, Villages of Isfahan province -
پیش بینی کوتاه مدت بار الکتریکی نقش مهمی در طراحی و بهره بردای از سیستم های قدرت ایفا می کند. با توجه به ماهیت سری زمانی بار الکتریکی کوتاه مدت، پیش بینی دقیق بار بسیار چالش برانگیز است. در این مقاله، روشی برای پیش بینی بار کوتاه مدت پیشنهاد شده است. در مرحله نخست توابع مد ذاتی (IMFها) منحنی بار با استفاده از روش تجزیه مد تجربی (EMD) استخراج می شوند. باقی مانده سیگنال که حاوی نوفه است در این مرحله دور ریخته می شود تا سیگنال به نسبه تمیزی حاصل شود. در مرحله دوم هر IMF با استفاده از تبدیل موجک تجزیه می شود تا زیر دنباله های آن حاصل شود. هر زیردنباله حاوی اطلاعات و جزییات متفاوتی است که می تواند به بهبود دقت پیش بینی کمک کند. در مرحله سوم زیردنباله های به دست آمده تجمیع شده و در نهایت به وسیله رگرسیون بردار پشتیبان (SVR) جهت پیش گویی استفاده می شوند. روش پیشنهادی بر روی دو مجموعه داده لهستان و کانادا و با چهار معیار خطای میانگین مربعات (MSE) ریشه میانگین مربعات خطا (RMSE)، میانگین درصد مطلق خطا (MAPE) و میانگین خطای مطلق (MAE) مورد ارزیابی قرار گرفت. یافته ها نشان می دهد که خطای پیش بینی بار برای مجموعه داده لهستان با معیار MSE برابر 0.0012 ، با معیار RMSE برابر 0.0342 با معیار MAPE برابر 2.9771، با معیار MAE برابر 0.0044 و برای مجموعه داده کانادا با معیار MSE برابر 5.0969e-07، با معیار RMSE برابر 7.1393e-04 با معیار MAPE برابر 0. 9571 و با معیار MAE برابر 2624e-04 است. از مقایسه روش پیشنهادی نسبت به سایر روش های رقیب، نتایج بهتری از نظر میزان خطا مشاهده شده است.
کلید واژگان: پیش بینی بار کوتاه مدت، تقاضای بار، تجزیه مولفه ذاتی، تبدیل موجک، رگرسیون بردار پشتیبانThe Short-term forecasting of electric load plays an important role in designing and operation of power systems. Due to the nature of the short-term electric load time series (nonlinear, non-constant, and non-seasonal), accurate prediction of the load is very challenging. In this article, a method for short-term daily and hourly load forecasting is proposed. In this method, in the first step, the intrinsic mode functions (IMFs) of the Electric load curve, which are a group of average and pseudo-periodic average signals, are extracted by using the empirical mode decomposition (EMD) method, which is a non-linear and non-constant time-frequency method. For this purpose, the maximum and minimum points of the signal are determined, and then, in one cycle, the difference between the average curve of the upper and lower envelope is calculated with it. This continues until the result falls below a threshold value, and then, the rest of the signal which contains noise is discarded to get a relatively clean signal. In the second step, we need to obtain the sub-sequences of each IMF. So, we use the wavelet transform. The wavelet transform is a kind of transform that is used to decompose a continuous signal into its frequency components, and the resolution of each component is equal to its scale. Each subsequence contains different information and details that can help the improvement of the prediction accuracy. In the third step, the obtained subsequences are aggregated and finally used for prediction by Support Vector Regression (SVR). Support vector regression is a type of supervised learning system that is used for both grouping and estimating the fitting function of data in regression problems so that the least error occurs in the grouping of data or in the fitting function. The purpose of the proposed method is to reduce the error for daily and hourly load prediction. In this method, two datasets of Poland and Canada have been experimented. With four criteria of mean square error (MSE), root mean square error (RMSE), average absolute percentage error (MAPE) and mean absolute error (MAE), the results are evaluated. The findings show that the load prediction error for the Polish data set are as follows: MSE equal to 0.0012, RMSE equal to 0.0342, MAPE equal to 2.9771, and MAE equal to 0.0044. For Canadian data set, the results are as follows: MSE equal to 5.0969e-07, RMSE equal to 7.1393e-04, MAPE criterion equal to 0.9571, and the MAE criterion equal to 2624e-04. Comparison of the proposed method with other competing methods show that better results are achieved by the proposed method in term of the error rate.
Keywords: Short-term electrical load forecasting, Electricity demand, empirical mode decomposition, wavelet transform, support vector regression -
نشریه مهندسی عمران و محیط زیست دانشگاه تبریز، سال پنجاه و دوم شماره 4 (پیاپی 109، زمستان 1401)، صص 173 -190
با توجه به مشکلات اجرای آزمایش ها بخصوص در سنگ های ضعیف و هزینه بر بودن این آزمایش ها، می توان با بررسی روابط بین ویژگی های مکانیکی و فیزیکی، هزینه آزمایشات تعیین خصوصیات مکانیکی را کاهش داد. در این پژوهش آزمایش های پتروگرافی، فیزیکی و مکانیکی بر روی 62 مغزه از سنگ های شیل و مارن در ساختگاه سد گدار-خوش انجام شد. در نهایت عملکرد روش های شبکه عصبی مصنوعی (ANN) رگرسیون چند متغیره (MVRA) و رگرسیون بردار پشتیبان (SVR) با تابع کرنل پایه شعاعی (RBF) جهت تخمین UCS، Es بر اساس سرعت موج تراکمی و خصوصیات فیزیکی مقایسه شد. نتایج پتروگرافی نشان داد که کانی ایلیت، فراوانترین نوع کانی رسی می-باشد. نسبت مدول الاستیسیته دینامیکی به استاتیکی نمونه ها برابر با 8.51 می باشد. همچنین نسبت پواسون دینامیکی به استاتیکی برابر با 1.41 می باشد. نتایج آنالیز آماری نشان داد که مدول الاستیسیته استاتیکی همبستگی بالایی با مدول الاستیسیته دینامیکی (R=0.91, RMSE=0.22, MAPE=0.14) و سرعت موج برشی همبستگی بالایی با سرعت موج تراکمی (R=0.98, RMSE=0.08, MAPE=0.03) دارند. نتایج رگرسیون چند متغیره نشان داد که هر دو پارامتر UCS و Es دارای همبستگی معنی داری با پارامترهای فیزیکی و سرعت موج تراکمی دارند. بطوریکه ارتباط UCS با این پارامترها بیشتر از ارتباط Es با این پارامتر ها می باشد. مقایسه عملکرد روش ها در تخمین خصوصیات استاتیک نشان داد که SVR دارای دقت بالاتری نسبت به رگرسیون چند متغیره و ANN می باشد.
کلید واژگان: خصوصیات استاتیکی و دینامیکی، سنگ های رسی، رگرسیون بردار پشتیبان، شبکه عصبی مصنوعی، آنالیز آماریJournal of Civil and Environmental Engineering University of Tabriz, Volume:52 Issue: 4, 2023, PP 173 -190Due to the difficulties of conducting tests, especially in weak rocks and the cost of these experiments, by examining the relationships between their mechanical and physical properties can be provided and reduce the cost of tests to identify mechanical properties (Minaeian and Ahangari, 2013; Azadan and Ahangari, 2014). In this study, petrographic, physical and mechanical experiments on 62 cores of shale and marl of Gurpi Formation were conducted in Godar-Khosh dam site, west of Iran. Non-destructive tests were performed on cores according to the ISRM standard. Physical properties such as water absorption, density and porosity of the samples were determined according to the ISRM standard. Also, uniaxial compressive strength (UCS) test according to the ASTM standard D2938 (ASTM, 1986) was performed. For each sample, the modulus of dynamic elasticity (Ed) and the dynamic Poisson ratio were calculated (Goodman, 1989). Using statistical analysis, artificial neural network (ANN( and support vector regression (SVR) with radial base kernel function, several relationships for estimating UCS, Es and shear wave velocity were presented. The root mean square error (RMSE), the mean absolute percentage error (MAPE) and the variance account for (VAF) were also used to evaluate the results.
Keywords: Static, dynamic properties, Clay rocks, Support Vector Regression, Artificial neural network, Statistical analysis -
در این مقاله به ارایه روشی برای پیش بینی سری زمانی پرداخته شده است. مدلی که در این مقاله ارایه شده بر پایه ترکیب کرنل ها و رگرسیون بردار پشتیبان است. رگرسیون بردار پشتیبان با استفاده از کرنل هایش توانایی بالایی در حل مسایل تخمین توابع دارد؛ اما این کرنل ها پارامترهایی دارند که نیاز به تنظیم دارند. در مدل پیشنهادی کرنل های مختلف بر روی داده ها اعمال می شوند. خروجی کرنل ها با اعمال یک ضریب، با هم ترکیب می شوند. این ترکیب باعث می شود یک فضای ثانویه جدیدی به دست آید. دلیل این امر این است که، ممکن است از بین کرنل های موجود فقط یک تعدادی از آن ها با ضریب خاصی برای صورت مساله مفید باشد و ما از این که کدام کرنل برای صورت مساله ما کارا است آگاه نیستیم. همچنین هرکدام از کرنل ها پارامتر هایی دارند که باید مقادیر بهینه آن ها برای دست یابی به نتیجه بهتر تعیین شوند؛ از این رو در مدل ارایه شده، یادگیری پارامتر های کرنل و وزن های آن ها توسط بهینه ساز گرگ خاکستری انجام می شود مدل پیشنهادی روی پنج مجموعه سری زمانی استاندارد پیاده سازی شده که نتایج تست براساس معیار RMSE برای سری زمانی DJ، 58/1، سری زمانیRadio ، 178/0، سری زمانی Sunspot ، 709/1، نسبت به روش های دیگر بهتر شده است. همچنین در انتها به تحلیل نتایج، ارزیابی آماری با آزمون ویلکاکسون رتبه علامت دار و ارایه رابطه برای یافتن اندازه پنجره در مدل پرداخته شده است.
کلید واژگان: پیش بینی سری زمانی، رگرسیون بردار پشتیبان، ترکیب توابع کرنل، بهینه سازیIn this paper, a method is presented for predicting time series. Time series prediction is a process which predicted future system values based on information obtained from past and present data points. Time series prediction models are widely used in various fields of engineering, economics, etc. The main purpose of using different models for time series prediction is to make the forecast with the greatest accuracy. The model presented in this paper is based on the combination of kernels and support vector regression. Support vector regression is highly capable of solving function estimation problems by using its kernels, but kernels’ parameters need to be adjusted. First we have preprocessing phase which includes normalizing data and separating data for testing and training. In proposed model, ten different kernels were used. Five kernels were selected as the best kernels by trial and error and these kernels are applied to data. There probably is only a few of the kernels that are useful for the problem, and we are not aware of which kernels are useful for our problem so kernel outputs aggregate by applying a coefficient. This combination creates a new secondary space. The output is given to support vector regression to construct a model that predicts values exactly ɛ accurate, which means the predicted values do not deviate more than ɛ from the original data. This model predicts values by using a leave one out model. Each kernel has parameters that need to be set to optimum values in order to get the best results. Hence in the proposed model, the kernel parameters and their weights are learned by the Gray Wolf Optimizer. This optimizer has been able to provide appropriate answers to many problems, especially challenging problems and has a superior ability to solve the high-dimension problems. By running program in consecutive iterations and examining the different values of the parameters, the optimizer learns the best of them which prediction error has been reduced, and finally returns their best value. The proposed model is implemented on five standard time series and compared to other method, test based on the RMSE criterion for DJ time series, improved by 1.58 point, Radio time series, improved by 0.178 point, and Sunspot time series, improved by 1.709 point. Finally, we analyzed the results, Statistical evaluation by Wilcoxon Signed-Rank Test where the p value is very low compared to the proposed method and CNN-FCM, AR_ model per scale, Multiresolution AR model and ANN methods, slightly lower for Wavelet-HFCM and ANFIS methods and slightly lower than one for SAE-FCM method and at the end provide a relation to find the window size in the model by obtaining the average of peak differences, valley differences, and consecutive peak, and valley differences for the actual values of the training data in exchange for their sequence number in time series.
Keywords: Time series prediction, Support vector regression, Ensemble kernel model, Optimization -
پیشبینی بار از مهم ترین جنبههای مدیریت موثر سیستمهای قدرت است و به عوامل مختلفی از جمله ابزار و منابع تولید برق توسط هر شرکت، تقاضای بار الکتریکی، عوامل آب وهوایی، عوامل اقتصادی و فعالیتهای انسانی بستگی دارد. براساس افق زمانی، پیشبینی بار را میتوان به سه گروه عمده پیشبینی کوتاهمدت، میانمدت و بلندمدت دستهبندی کرد. هدف اصلی این مقاله، پیشبینی کوتاهمدت مصرف برق، در شبکه برق منطقهای استان گیلان است. در این پژوهش، پس از جمعآوری دادهها شامل سرعت باد، رطوبت نسبی، دما، نقطه شبنم، تعطیلات، طول روز و تاثیر کرونا، پیشپردازش روی آنها انجام شده و با استفاده از الگوریتم خوشهبندی K_Means به پنج خوشه تقسیم می شوند. در ادامه روابط بین متغیرهای مستقل و وابسته مصرف برق در استان گیلان با استفاده از الگوریتمهای رگرسیون خطی1، شبکه عصبی مصنوعی2 و رگرسیون بردار پشتیبان3 به همراه روش بهینهسازی جستجوی شبکه4، مورد بررسی قرار گرفته و در نرمافزار Python و در محیط Google Colab، بررسی و مدلسازی شده است. در خوشهبندی، الگوریتمهای یادشده، روی تمامی خوشهها و مجموع آنها اعمال میشود. نتایج تحقیق در این مقاله نشان میدهد الگوریتم رگرسیون بردار پشتیبان، دقت بالاتر و زمان اجرای بیشتری نسبت به دو الگوریتم شبکه عصبی مصنوعی و رگرسیون خطی دارد. الگوریتم شبکه عصبی مصنوعی نسبت به رگرسیون خطی دارای خطای کمتر و زمان اجرای بیشتری است.کلید واژگان: پیش بینی مصرف برق، پیش بینی کوتاه مدت برق، رگرسیون بردار پشتیبان، رگرسیون خطی، شبکه عصبی مصنوعیLoad forecasting is one of the most important aspects of the effective management of power systems and depends on various factors such as the means and sources of electricity production by each company, electric load demand, weather factors, economic factors and human activities.. The main goal of this article is the STLF in the regional electricity grid of Guilan province. In this research, after collecting data including wind speed, relative humidity, temperature, dew point, holidays, day length and the effect of corona disease, pre-processing is done on them and they are divided into five clusters using K_Means clustering algorithm. In the following, the relationships between the independent and dependent variables of electricity consumption in Guilan province, using linear regression (LR) algorithms, artificial neural network (ANN) and support vector regression (SVR) along with the Grid search optimization method, were investigated and analyzed in Python software and modeled in the Google Colab environment. The results show that the SVR algorithm has higher accuracy and longer implementation time than the two algorithms of ANN and LR.Keywords: Electricity consumption forecasting, short-term electricity forecasting, Support Vector Regression, linear regression, Artificial Neural Network
-
پایش رسوبات معلق نقش مهمی در شناخت رفتار رودخانه، شناسایی کانون های فرسایش و رسوب و مدیریت بهتر اراضی آبخیزها ایفا می کند. درحال حاضر به دلیل هزینه های بالای پایش مستمر رسوبات معلق، برنامه ریزی و مدل سازی جهت مهار فرسایش با چالش های جدی روبروست. هدف از این پژوهش، توسعه فناوری و ارزیابی دستگاه بازتاب نوری اندازه گیر رسوب معلق با سامانه توام چند منبع نوری همراه با مدل سازی هوش مصنوعی (MLP , SVR) می باشد. دستگاه مذکور پس از ساخت، طی مراحل مختلف آزمایشی در آزمایشگاه هیدرولیک موسسه تحقیقات آب وزارت نیرو مورد بررسی قرارگرفت. بررسی عملکرد دستگاه طی دو مرحله واسنجی و صحت سنجی انجام شد. در فرایند بررسی، تعداد40 نمونه رسوب تولید و نمونه برداری شد که 70٪ آن ها برای آموزش دستگاه و 30٪ باقیمانده جهت صحت سنجی استفاده شد. از کدورت سنج مرجع و نمونه برداری دستی جهت آزمون درستی عملکرد دستگاه استفاده گردید. منحنی های ترسیم شده، بیان گر همبستگی بسیار خوب بین عدد نوری ثبت شده توسط دستگاه و غلظت رسوب معلق می باشد. به منظور ارتقاء نتایج پیش بینی دستگاه، از روش هوشمند مبتنی بر آمار رگرسیون ماشین بردار (SVR) و همچنین شبکه عصبی پرسپترون چند لایه (MLP) استفاده گردید. در نهایت نتایج حاصله توسط شاخص های میانگین خطای مطلق (MAPE) ، مجذور میانگین مربعات خطا (RMSE)، ضریب ناش ساتکلیف (NSE) ، ضریب همبستگی (R) و ضریب تبیین (R2) مورد ارزیابی قرار گرفتند. نتایج نشان داد مقادیر شاخص های ارزیابی برای مدل MLP بعنوان مدل بهینه، به ترتیب برابر با 023/0، 608/7، 997/0، 999/0 و 999/0 می باشد.
کلید واژگان: بازتاب نوری، شبکه عصبی پرسپترون چندلایه، کدورت سنج، رگرسیون بردار پشتیبان، هوش مصنوعیThe aim of this research is to construct and validate an optical sensor with a multi-beam ratio technology and artificial intelligence-based modelling (MLP & SVR) for suspended sediment measuring. After implementation of the new technology, the performance of the device was evaluated in two stages including calibration and validation. To attain this, various experimental tests carried out in the hydraulic laboratory of Water Research Institute of the Ministry of Energy. Reference turbidity meter and total suspended solids (TSS) were used to test the performance of the OBS technology. In calibration stage, 70% of TSS data were used and the remaining 30% of data were used to validate optical technology. The plotted calibration curves show a very good correlation between the optical voltage recorded by the sensors and the suspended sediment concentration. Also, SVR & MLP models were employed to improv results of suspended load prediction. The performance of optical device and also optical device with intelligence models were evaluated through four statistical indices namely, Mean Absolute Percentage Error (MAPE), Root mean square Error (RMSE), Nash–Sutcliffe coefficient (NSE), correlation coefficient (R) and coefficient of determination (R2). The results of this stage showed that the intelligence modelling could result in improvements of suspended load reported by optical technology. The best improvements obtained by MLP-optical technology. The results showed that values of validation indicators for MLP model are equal to 0.023, 7.608, 0.99, 0.99 and 0.99 respectively, which indicates the proper performance of the technology.
Keywords: Artificial Intelligence, Multi-Layer Perceptron Neural Network, Optical Back Scatter, Turbidity Meter, Support Vector Regression -
Blast-induced ground vibration (PPV) evaluation for a safe blasting is a long-established criterion used mainly by the empirical equations. However, the empirical equations are again considering a limited information. Therefore, using Machine Learning (ML) tools [Support Vector Machine (SVM) and Random Forest (RF)] can help in this context, and the same is applied in this work. A total of 73 blasts are monitored and recorded in this work. For the ML tools, the dataset is divided into the 80-20 ratio for the training and testing purposes in order to evaluate the performance capacity of the models. The prediction accuracies by the SVM and RF models in predicting the PPV values are satisfactory (up to 9% accuracy). The results obtained show that the coefficient of determination (R2) for RF and SVM is 0.81 and 0.75, respectively. Compared to the existing linear regressions, this work recommends using a machine learning regression model for the PPV prediction.
Keywords: Empirical Equation, Ground Vibration, Peak particle velocity, Random Forest Regression, Support Vector Regression -
Intrusion detection is one of the main challenges in wireless systems especially in Internet of things (IOT) based networks. There are various attack types such as probe, denial of service, remote to local and user to root. In addition to the known attacks and malicious behaviors, there are various unknown attacks which some of them have similar behaviors with respect to each other or mimic the normal behavior. So, classification of connections in IOT based networks is a hard and challenging task. In this paper, an intrusion detection framework is proposed for classification of various attacks and separation of them from the normal connections. The double discriminant embedding (DDE) method is used to transform the original feature space of data. This transform is implemented in two steps. In the first step, the difference between the features is maximized; and in the second one, the difference between classes is increased. The extracted features not only have less overlapping with respect to each other and contain less redundant information but also they provide more separation between different classes. The extracted features are fed to the support vector machine (SVM) with polynomial kernel for classification. The experiments on NSL-KDD dataset have shown improvement of the SVM classifier when the DDE features are used.Keywords: Intrusion detection, Support Vector Regression, double discriminant embedding, Internet of Things
-
پیش بینی مناسب بارش و دما با افق یک ماهه می تواند فرصتی استثنایی برای برنامه ریزی منابع آب و مقابله با سیل و خشکسالی در اختیار مدیران قرار دهد. اعمال روش های پس پردازش و اصلاح اریبی مناسب می تواند کارایی پیش بینی های عددی هواشناسی را تا حد قابل قبولی ارتقا بخشد. در این تحقیق ضمن ارزیابی پیش بینی های خام بارش و دمایS2S مرکز ECMWF در یکی از حوضه های آبریز مهم کشور، روش های متنوعی برای پس پردازش و اصلاح اریبی این پیش بینی ها مورد استفاده قرار گرفت و نتایج با معیارهای ارزیابی مختلف مقایسه گردید. تکنیک های نگاشت چندک (QM)، میانگین گیری مدل بیزین (BMA)، رگرسیون بردار پشتیبان (SVR)، رابطه تجربی اصلاح اریبی دما و روش های ترکیبی بر روی پیش بینی ها اعمال شد که از بین آن ها روش BMA هم در بهبود پیش بینی های دما و هم بارش اندکی موثرتر از سایر روش ها عمل نمود. در حالت خام، پیش بینی های بارش و دما تنها در 2 یا 3 ماه سال قابل استفاده ارزیابی شدند ولی اعمال روش های پس پردازش توانست دقت پیش بینی های بارش را در نیمی از ماه ها، به ویژه ماه های پرباران تا حد قابل قبولی ارتقا دهد و اعمال روش ترکیبی معادله تجربی-میانگین مدل بیزین در 10 ماه از سال با پیش بینی هایی بهتر از تخمین دمای ماه آتی با استفاده از آمار بلندمدت همراه بود.
کلید واژگان: پس پردازش پیش بینی های هواشناسی، اصلاح اریبی، میانگین گیری مدل بیزین، نگاشت چندک، رگرسیون بردار پشتیبانEfficient forecast of precipitation and temperature with a one-month horizon can provide managers with an exceptional opportunity to plan water resources and deal with floods and droughts. The application of proper post-processing and bias correction methods can much improve the accuracy of these predictions. In this study, the S2S (Sub seasonal to Seasonal) precipitation and temperature forecasts of ECMWF were evaluated in one of the important basins of Iran. A variety of methods were used for post-processing and bias correction of these predictions, and the results were compared with different evaluation criteria. Quantile mapping (QM), Bayesian model averaging (BMA), Support vector regression (SVR), an Empirical equation for bias correction of temperature, and some hybrid methods were applied to forecasts. The BMA outperformed the other methods in improving both temperature and precipitation forecasts. Raw precipitation and temperature forecasts were only applicable in 2 or 3 months of the year, but post-processing methods were able to accurately improve precipitation in half of the months, especially rainy months. The hybrid of empirical equation-BMA in 10 months of the year was led to better results than the estimate of the next month's temperature using climatological data.
Keywords: Post-processing, bias correction, Bayesian model averaging, Quantile Mapping, Support vector regression -
Journal of Electrical and Computer Engineering Innovations, Volume:8 Issue: 1, Winter-Spring 2020, PP 31 -40Background and Objectives
Stock price prediction has become one of the interesting and also challenging topics for researchers in the past few years. Due to the non-linear nature of the time-series data of the stock prices, mathematical modeling approaches usually fail to yield acceptable results. Therefore, machine learning methods can be a promising solution to this problem.
MethodsIn this paper, a novel machine learning approach, which works in two phases, is introduced to predict the price of a stock in the next day based on the information extracted from the past 26 days. In the first phase of the method, an automatic clustering algorithm clusters the data points into different clusters, and in the second phase a hybrid regression model, which is a combination of particle swarm optimization and support vector regression, is trained for each cluster. In this hybrid method, particle swarm optimization algorithm is used for parameter tuning and feature selection.
ResultsThe accuracy of the proposed method has been measured by 5 companies’ datasets, which are active in the Tehran Stock Exchange market, through 5 different metrics. On average, the proposed method has shown 82.6% accuracy in predicting stock price in 1-day ahead.
ConclusionThe achieved results demonstrate the capability of the method in detecting the sudden jumps in the price of a stock. The author(s). This is an open access article distributed under the terms of the Creative Commons Attribution (CC BY 4.0), which permits unrestricted use, distribution, and reproduction in any medium, as long as the original authors and source are cited. No permission is required from the authors or the publishers.
Keywords: Tehran Stock Exchange market, Automatic clustering, Feature selection, Particle swarm optimization, Support Vector Regression -
مجله آب و فاضلاب، پیاپی 126 (خرداد و تیر 1399)، صص 118 -129
پیش بینی هجوم آب شور به آبخوان ساحلی در اثر تغییر میزان برداشت از آب زیرزمینی یکی از پیش نیازهای مدیریت آب زیرزمینی است. این پژوهش قابلیت انواع مختلف مدل های ماشین بردار پشتیبان رگرسیونی (SVR) را برای پیش بینی میزان شوری در چاه پایش منتخب در یک آبخوان ساحلی کوچک تحت شرایط مختلف برداشت آب زیرزمینی بررسی می کند. مدل های SVR با مجموعه های ورودی (پمپاژگذرای تصادفی از چاه های آبده) حاصل از نمونه برداری ابرمکعب لاتین و خروجی (غلظت شوری در چاه پایش منتخب) آموزش یافته و آزمایش شدند. سپس، مدل های آموزش یافته و آزمایش شده برای پیش بینی میزان شوری در چاه پایش منتخب برای مجموعه داده های جدید پمپاژ استفاده شدند. قابلیت پیش بینی و تعمیم دهی عملی مدل ها در مقایسه با مدل رایج شبکه عصبی مصنوعی با استفاده از شاخص های ارزیابی مختلف بررسی شد. نتایج ارزیابی عملکرد مدل ها نشان داد که قابلیت پیش بینی مدل SVR چندجمله ای بر سایر مدل ها برتری دارد. همچنین همه مدل های SVR مورد بررسی به جز مدل SVR خطی، پیشروی آب شور را به طور قابل قبولی پیش بینی کردند. قابلیت پیش بینی و تعمیم دهی مدل های SVR چندجمله ای، استفاده از آنها را برای اتصال به الگوریتم بهینه سازی در شیوه بهینه سازی- شبیه سازی مبتنی بر مدل جانشین برای مدیریت آبخوان های ساحلی توصیه می کند.
کلید واژگان: آبخوان ساحلی، پیشروی آب شور، مدل جانشین، ماشین بردار پشتیبان رگرسیونی، قابلیت پیش بینیThe prediction of the intrusion of saline water into coastal aquifers as a result of changing the amount of groundwater extractions is a prerequisite for managing groundwater. This study investigates the capability of different types of Support Vector Regression (SVR) models to predict salinity concentrations at the selected well in the small coastal aquifer under different groundwater abstraction conditions. SVR models were trained and tested using input (random transient pumping from the production wells) derived from Latin Hypercube Sampling and output (salinity concentration at the selected well) datasets. The trained and tested models were then used to predict salinity concentrations at the selected well for new pumping datasets. The models ability for predicting and generalizing compared with commonly used artificial neural network (ANN) model was evaluated using different performance criteria. The results of the performance evaluation of the models showed that the predictive capability of the polynomial SVR model is superior to other models. Also, comparing different performance criteria for all SVR models, except for linear SVR model, proved their acceptable predictive performance. The prediction and generalisation ability of polynomial SVR, recommends using these models to connect to the optimization algorithm for a surrogate model based simulation-optimization approach in sustainable management of coastal aquifers.
Keywords: Coastal Aquifers, Saltwater intrusion, Surrogate Models, Support vector regression, Prediction Capability -
Settlement and deformation of the embankment dams are among the major damages caused by earthquakes, eventually leading to dam instability. Therefore, accurate assessment of the seismic settlement of embankment dams is of particular concern. This study aims to evaluate the settlement of embankment dams subjected to earthquake loads using regression-based methods. A wide-ranging real data on crest settlement of embankment dams caused by earthquakes was collected and analyzed. Yield acceleration of dam, maximum horizontal earthquake acceleration, fundamental period of dam body, predominant period of earthquake, and earthquake magnitude were considered as the most influential parameters affecting the seismic crest settlement of embankment dams. Using support vector regression method as well as multiple linear regression method, two models were developed to estimate earthquake induced crest settlement of embankment dams. Subsequently, sensitivity analysis was conducted in order to assess the behavior of the proposed models under different conditions. Finally, the accuracy of the proposed models was compared with the existing relationship for estimation of earthquake induced crest settlement of embankment dams. Although both MLR- and SVR-based models have an acceptable accuracy in estimation of the crest settlement of embankment dams under earthquake loading, the SVR-based model has a higher accuracy.Keywords: Embankment dam, earthquake, Crest settlement, Support vector regression
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.