support vector regression
در نشریات گروه علوم پایه-
This paper is mainly about creating a novel method for detecting potential subsurface structures in the study area for future investigation. This paper is divided into two sections. In the first section, for notifying the statistical status of data points, two types of support vector regression are proposed. In the second section, by using a fuzzy inference system, potential parts of the study area are detected. For this research, 812 magnetic surveying points were collected in the southern part of Iran with a range of magnetic between. -105.718 to 2.20 two types of SVR are proposed, and in both methods, firstly, an MLP neural network predicts magnetic rates by using easting, northing, and elevation, and in MLP_SVR by trial and error main parameters of SVR are chosen but in MLP_PSO_SVR optimized parameters of SVR are chosen by the PSO algorithm. Main parameters of support vector regression are epsilon, penalty term, and kernel function (in this study we choose RBF kernel function), In MLP_SVR, epsilon is 24, penalty term is 27 and sigma of RBF kernel is 12, and optimized parameters in second type are estimated 28.27 for epsilon, and 21.99 for penalty term, and 15.70 for sigma of RBF kernel,, and by this parameters, SVR is performed. In the second section, utilizing unique FIS platform is created, and parameters of this intelligent system are predicted magnetic rate, which is predicted by an MLP neural network, and depth. To obtain depth, Standard Euler deconvolution is offered, which uses least-squares as an inversion method. MLP_SVR puts 753 data points inside model and MLP_PSO_SVR puts 775 data points inside model which means MLP_PSO_SVR has 2.70 % better performance in comparison of MLP_SVR, in second section, the condition of the subsurface structure is defined, and the outcome of the model illustrates that in this area, if the magnetic rate is more than -80 and Simultaneously, the depth is less than 2000, that parts are proper area for future investigation. Main finding of this study are; (1) MLP_PSO_SVR causes that more data points in comparison of MLP_SVR be inside of Support vector regression model and this proposed type has better performance in comparison of MLP_SVR (2) particle swarm particle is great tool for optimizing main parameters of support vector regression (epsilon, penalty term, and sigma of kernel function) and The function of norm(sin(x)) causes that choosing of optimized parameters of support vector regression becomes attainable (3) fuzzy inference system creates novel procedure for notifying status of subsurface structure which can be used in future research in study area.
Keywords: Magnetic Surveying, Multilayer Perceptron, Support Vector Regression, Particle Swarm Optimi-Zation, Fuzzy Inference System -
ارائه یک مدل پیش بینی قوی و قابل اعتماد برای میزان دبی رسوبی رودخانه ها یک کار ضروری برای چندین دیدگاه محیطی و ژئومورفولوژیکی از جمله کیفیت آب، پایداری مهندسی بستر رودخانه و زیستگاه های آبی است. در این تحقیق، یک رویکرد هوشمند ترکیبی جدید مبتنی بر رویکرد مدل رگرسیون بردار پشتیبان برای پیش بینی دبی رسوبی رودخانه توسعه داده شده است. بدین منظور در این پژوهش از دو الگوریتم بهینه سازی شامل کرم شب تاب و گرگ خاکستری برای مدلسازی دبی رسوبی رودخانه بکار برده شد. جهت مدلسازی از آمار و اطلاعات ایستگاه هیدرومتری رودخانه کشکان واقع در استان لرستان بعنوان مطالعه موردی طی 7 سناریو ترکیبی از پارامترهای ورودی در سالهای 1373-1403 استفاده شد. به منظور ارزیابی عملکرد مدلها از معیارهای ارزیابی ضریب همبستگی، ریشه میانگین مربعات خطا، میانگین قدر مطلق خطا و ضریب نش ساتکلیف استفاده شد. نتایج نشان داد سناریو های ترکیبی در مدلهای مورد بررسی باعث بهبود عملکرد مدل می شود. همچنین نتایج حاصل از معیار ارزیابی نشان داد مدل رگرسیون بردار پشتیبان-کرم شب تاب دارای ضریب همبستگی 970/0 ، ریشه میانگین مرعات خطا (ton/day) 145/0 ، میانگین قدر مطلق خطا (ton/day) 080/0 و ضریب نش ساتکلیف 980/0 در مرحله صحت سنجی برخوردار است. در مجموع نتایج نشان داد استفاده از مدلهای هوشمند مبتنی بر رویکرد رگرسیون بردار پشتیبان می تواند رویکردی موثر در پایداری مهندسی رودخانه باشد.
کلید واژگان: کشکان، رگرسیون بردار پشتیبان، رسوبات معلق، مدلسازیProviding a robust and reliable predictive model for river sediment discharge is an essential task for several environmental and geomorphological perspectives, including water quality, riverbed engineering sustainability, and aquatic habitats. In this research, a new hybrid intelligent approach based on the support vector regression model approach has been developed to predict river sediment discharge. For this purpose, in this research, two optimization algorithms including firefly and gray wolf were used to model the sediment discharge of the river. In order to model, the statistics and information of the Kashkan river hydrometric station located in Lorestan province were used as a case study in 7 combined scenarios of input parameters in 1403-1373. In order to evaluate the performance of the models, the evaluation criteria of correlation coefficient, root mean square error, average absolute value of error, and Nash Sutcliffe coefficient were used. The results showed that the combined scenarios in the studied models improved the performance of the model. Also, the results of the evaluation criteria showed that the support vector regression model-firefly has a correlation coefficient of 0.970, the root mean error rate (ton/day) is 0.145, the mean absolute error value (ton/day) is 0.080 and the coefficient Nash Sutcliffe has 0.980 in the validation stage. In total, the results showed that the use of intelligent models based on the support vector regression approach can be an effective approach in the sustainability of river engineering.
Keywords: Kashkan, Support Vector Regression, Suspended Sediments, Modeling -
This paper proposes a novel approach for generating high-resolution energy spectra using cost-effective Sodium iodide Thallium activated (NaI(Tl)) detectors. It employ a multi-output regression chain structure based on support vector regression (SVR) to map NaI(Tl) spectra to their corresponding HPGe spectra. The suggested framework utilizes a regression chain strategy to enhance regression models that lack support for multi-output regression. This involves initially employing one regressor for each energy channel of the HPGe spectrum. Subsequently, multiple regressors are integrated to forecast all energy channels of HPGe spectrum. Each regressor in the chain receives the entire NaI spectrum as input. Then, for each subsequent regressor, input is further augmented by concatenating the outputs of all preceding regressors in the chain. Despite being trained on a limited radioisotope library, the model exhibits exceptional performance across diverse measured test spectra containing multiple radioisotopes. Among the various kernel functions employed (linear, radial basis function (RBF), and polynomial), the RBF and polynomial kernels yielded superior performance compared to the linear kernel. By enabling HPGe spectrum prediction using NaI(Tl) detectors, this study highlights a significant advancement in radiation detection capabilities, addressing cost and operational considerations.Keywords: Multi-Output Regression, Nai Detector, Hpge Detector, Gamma Spectroscopy, Support Vector Regression, Radioisotope
-
مدل بندی و برآوردی کارا از تابع روند در برآورد تغییرنگار و پیش گویی داده های فضایی از اهمیت بالایی برخوردار است. در این مقاله برای مدل بندی تابع روند از روش رگرسیون بردار پشتیبان استفاده شده است. سپس داده ها روندزدایی شده و برآورد تغییرنگار و پیش گویی انجام می شود. بر روی یک مجموعه داده واقعی، نتایج پیش گویی حاصل از روش پیشنهادی با روش پیش گویی اسپلاین و کریگیدن از طریق اعتبارسنجی متقابل مقایسه شده است. کمینه بودن ریشه دوم میانگین توان های دوم خطا معیار انتخاب روش مناسب پیش گویی است. نتایج پیش گویی برای چند موقعیت با مقادیر معلوم که بنا به دلایلی از مجموعه داده ها کنار گذاشته شده اند و برای موقعیت های جدید به دست آمده اند. نتایج بیانگر دقت بالای پیش گویی با روش پیشنهادی نسبت به کریگیدن و اسپلاین است.
کلید واژگان: تغییرنگار، کریگیدن، پیش گویی فضایی، رگرسیون بردار پشتیبان، تابع هستهModeling and efficient estimation of the trend function is of great importance in the estimation of variogram and prediction of spatial data. In this article, the support vector regression method is used to model the trend function. Then the data is de-trended and the estimation of variogram and prediction is done. On a real data set, the prediction results obtained from the proposed method have been compared with Spline and kriging prediction methods through cross-validation. The criterion for choosing the appropriate method for prediction is to minimize the root mean square of the error. The prediction results for several positions with known values were left out of the data set (for some reason) and were obtained for new positions. The results show the high accuracy of prediction (for all positions and elimination positions) with the proposed method compared to kriging and spline.
Keywords: Variogram, Kriging, Spatial Prediction, Support Vector Regression, Kernel Function -
تحلیل داده های با بعد بالا با استفاده از روش های رگرسیون کلاسیک انجام پذیر نیست و ممکن است نتایج آن گمراه کننده باشد.در این تحقیق سعی شده است با معرفی تکنیک های جدید و قدرتمندی مانند رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون ستیغی و لاسو، به واکاوی این گونه داده ها پرداخته شود. در این راستا، با تحلیل دو مجموعه داده بعد بالا (داده های مربوط به تولید ریبوفلاوین و شبیه سازی شده) با روش های معرفی شده، به ارزیابی کاراترین مدل با استفاده از سه معیار (مجذور همبستگی، میانگین توان دوم خطا و میانگین انحراف درصد خطای مطلق) با توجه به نوع داده ها پرداخته می شود.
کلید واژگان: داده های با بعدبالا، رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون ستیغی، رگرسیون لاسوThe high-dimensional data analysis using classical regression approaches is not applicable, and the consequences may need to be more accurate. This study tried to analyze such data by introducing new and powerful approaches such as support vector regression, functional regression, LASSO and ridge regression. On this subject, by investigating two high-dimensional data sets (riboflavin and simulated data sets) using the suggested approaches, it is progressed to derive the most efficient model based on three criteria (correlation squared, mean squared error and mean absolute error percentage deviation) according to the type of data.
Keywords: Functional regression, High dimensional data, Lasso regression, Ridge regression, Support vector regression -
International Journal Of Nonlinear Analysis And Applications, Volume:14 Issue: 3, Mar 2023, PP 87 -102Forecasting is one of the important topics in the analysis of time series, as the importance of forecasting in the economic field has emerged in order to achieve economic growth. Therefore, accurate forecasting of time series is one of the most important challenges that we seek to make the best decision, the aim of the research is to suggest employing hybrid models to predict daily crude oil prices. The hybrid model consists of integrating the linear component, which represents Box Jenkins models, and the non-linear component, which represents one of the methods of artificial intelligence, which is the artificial neural network (ANN), support vector regression (SVR) algorithm and it was shown that the proposed hybrid models in the prediction process when conducting simulations for the time series and for different sample sizes and when applying them on the daily crude oil price data, it was more efficient than the single models, as the comparison between the single models and the proposed hybrid models was done by means of the comparison scale, the mean square error (MSE), the results showed that the proposed hybrid models gave more accurate and efficient results, in addition to its ability to predict crude oil prices well.Keywords: ARIMA, Artificial Neural Network, Time Series Forecasting, Support Vector Regression, Hybrid Model
-
مشهورترین تکنیک تحلیل داده های تابعی رویکرد مولفه های اصلی تابعی است که ابزاری مهم برای کاهش بعد نیز است. رگرسیون بردار پشتیبان شاخه ای از یادگیری ماشین و ابزار قدرتمندی برای تحلیل داده است. در این مقاله با استفاده از رگرسیون مولفه اصلی تابعی براساس تاوان های مشتق دوم، ریج و لاسو و با توجه به رگرسیون بردار پشتیبان با چهار هسته (خطی، چند جمله ای، سیگمویید و شعاعی) در داده های طیف سنجی به مدل سازی متغیر وابسته روی متغیرهای پیش بین پرداخته شده است. بر اساس نتایج بدست آمده طبق معیارهای نیکویی برازش پیشنهادی، مدل رگرسیون بردار پشتبان با هسته خطی و خطای بهینه شده $0.2$ مناسب ترین برازش را به داده ها داشته است.
کلید واژگان: تحلیل داده های تابعی، رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون مولفه اصلی، یادگیری ماشینThe most popular technique for functional data analysis is the functional principal component approach, which is also an important tool for dimension reduction. Support vector regression is branch of machine learning and strong tool for data analysis. In this paper by using the method of functional principal component regression based on the second derivative penalty, ridge and lasso and support vector regression with four kernels (linear, polynomial, sigmoid and radial) in spectroscopic data, the dependent variable on the predictor variables was modeled. According to the obtained results, based on the proposed criteria for evaluating the goodness of fit, support vector regression with linear kernel and error equal to $0.2$ has had the most appropriate fit to the data set.
Keywords: Functional data analysis, Functional regression, Machine learning, Principal component regression, Support vector regression -
This article has been compiled to identify the best model of housing price forecasting using machine learning methods with maximum accuracy and minimum error. Five important machine learning algorithms are used to predict housing prices, including Nearest Neighbor Regression Algorithm (KNNR), Support Vector Regression Algorithm (SVR), Random Forest Regression Algorithm (RFR), Extreme Gradient Boosting Regression Algorithm (XGBR), and the Long Short-Term Memory Neural Network Algorithm (LSTM). This research has been done using the data of the Statistics Center of Iran, which contains information on the purchase and sale of residential units in Tehran in the years 2014 to 2020 and includes 998299 transactions and 11 features. Loss of data, batch data conversion, normalization, etc. are performed on the housing data set to obtain the final and error-free data set. To divide the data set into training and test data sets, the important and practical method of cross-validation or K-Fold has been used because of its simplicity and effectiveness and as a universally valid method. Various evaluation criteria such as MSE, RMSE, MAE,ME and R2 were used to compare the models and identify the best model. Comparison of models in terms of all evaluation criteria in all K-fold subsets proves the stability and superiority of the Extreme Gradient Boosting Regression model.
Keywords: Housing price forecasting, nearest neighbor regression, random forest regression, support vector regression, long short-Term memory neural network, and extreme gradient boosting regression. -
مقاومت تک محوری و مدول الاستیسیته سنگ ها در مهندسی ژیوتکنیک، مکانیک سنگ و مهندسی زمین شناسی، جزو پارامترهای حیاتی در طراحی می باشد. بدین منظور از دو روش رگرسیون اجزا اصلی و روش هیبریدی الگوریتم بهینه سازی ذرات بر مبنای ماشین های برداری رگرسیون استفاده شده است. پارامترهای استفاده شده در این مدلسازی شامل سرعت موج فشاری، نسبت پواسون و تخلخل دینامیکی می باشد. مدل سازی بر مبنای نتایج حاصل از آزمایش مقاومت تک محوری فشاری و التراسونیک بر روی 115 نمونه سنگ آهک انجام شده است. دقت مدل های توسعه یافته با استفاده از شاخص های آماری شامل ضریب همبستگی، مربع متوسط خطای نرمال شده و متوسط خطای مطلق مورد بررسی قرار گرفت. نتایج بدست آمده نشان داد که دقت هر دو روش در تخمین پارامترهای هدف بالا می باشد. مقدار الگوریتم بهینه سازی ذرات به منظور تعیین بهینه حالت محدودیت جعبه و حالت اپسیلون مورد استفاده قرار گرفت. مقدار ضریب همبستگی، مربع متوسط خطای نرمال شده و متوسط خطای برای محموعه آموزش در مدل سازی مقاومت تک محوری با روش رگرسیون اجزا اصلی به ترتیب 0.78، 22.45 و 0.363 بدست آمد. مقادیر حاصل برای مجموعه تست در این حالت به ترتیب 0.76، 22.51 و 0.357 بدست آمده است. مقدار ضریب همبستگی، مربع متوسط خطای نرمال شده و متوسط خطای برای محموعه آموزش در مدل سازی مقاومت مدول الاستیسیته با روش رگرسیون اجزا اصلی به ترتیب 0.71، 34.23 و 0.421 بدست آمد. مقادیر حاصل برای مجموعه تست در این حالت به ترتیب 0.7، 34.23 و 0.43 بدست آمده است.مدل سازی در روش رگرسیون ماشین برداری به استفاده از چهار تابع کرنل خطی، درجه دوم، مکعبی و گوسین انجام شد. نتایج بدست آمده نشان می دهد تابع کرنل درجه دوم نتایج بهتری در تخمین مقاومت فشاری تک محوری و مدول الاستیسیته ارایه می کند. مقدار ضریب همبستگی، مربع متوسط خطای نرمال شده و متوسط خطای برای محموعه آموزش در مدل سازی مقاومت تک محوری با استفاده از تابع کرنل در ماشین های بردار پشتیبان به ترتیب 0.83، 16.98 و 0.329 بدست آمد. مقادیر حاصل برای مجموعه تست در این حالت به ترتیب 0.76، 22.15 و 0.296 بدست آمده است. مقدار ضریب همبستگی، مربع متوسط خطای نرمال شده و متوسط خطای برای محموعه آموزش در مدل سازی مقاومت مدول الاستیسیته با روش رگرسیون اجزا اصلی به ترتیب 0.73، 29.11و 0.45 بدست آمد. مقادیر حاصل برای مجموعه تست در این حالت به ترتیب 0.7 ، 25.67 و 0272 بدست آمده است.مدل سازی در روش رگرسیون ماشین برداری به استفاده از چهار تابع کرنل خطی، درجه دوم، مکعبی و گوسین انجام شد. به علاوه، مقایسه نتایج حاصل از رگرسیون اجزا اصلی و ماشین برداری رگرسیون نشان می دهد که ماشین برداری رگرسیون نتایج بهتری را ارایه می نماید.
کلید واژگان: مقاومت فشاری تک محوری، مدول یانگ دینامیکی، ماشینبرداری پشتیبان، رگرسیون اجزا اصلی، آزمایش التراسونیکIn geotechnical engineering, rock mechanics and engineering geology, depending on the project design, uniaxial strength and static Youngchr('39')s modulus of rocks are of vital importance. The direct determination of the aforementioned parameters in the laboratory, however, requires intact and high-quality cores and preparation of their specimens have some limitations. Moreover, performing these tests is time-consuming and costly. Therefore, in this study, it was tried to precisely predict the desirable parameters using physical characteristics and ultrasonic tests. To do so, two methods, i.e. principal components regression and support vector regression, were employed. The parameters used in modelling included density, P- wave velocity, dynamic Poisson’s ratio and porosity. Accordingly, the experimental results conducted on 115 limestone rock samples, including uniaxial compressive and ultrasonic tests, were used and the desired parameters in the modelling were extracted using the laboratory results. By means of correlation coefficient (R2), normalized mean square error (NMSE) and Mean absolute error (MAE), the developed models were validated and their accuracy were evaluated. The obtained results showed that both methods could estimate the target parameters with high accuracy. In support vector regression, Particle Swarm Optimization method was used for determining optimal values of box constraint mode and epsilon mode, and the modelling was conducted using four kernel functions, including linear, quadratic, cubic and Gaussian. Here, the quadratic kernel function yielded the best result for UCS and cubic kernel function yielded the best result for Es. In addition, comparing the results of the principal components regression and the support vector regression indicated that the latter outperformed the former.
Keywords: Uniaxial compressive strength, Static young’s module, Support vector regression, Principal components regression, Ultrasonic test -
در این مقاله، با استفاده از تکنیک طیف سنجی فروشکست القاییده لیزری، غلظت های عناصر موجود در آلیاژهای استاندارد آلومینیوم به طور کمی اندازه گیری شده است. لیزر تپی Nd:YAG در طول موج nm 1064 روی نمونه های استاندارد آلومینیوم تابیده شده است و با استفاده از پلاسمای ایجاد شده، تحلیل ها انجام شده است. از بین روش های مختلف تحلیل جهت براورد غلظت عناصر موجود در نمونه های آلومینیم، روش های شبکه عصبی مصنوعی، الگوریتم تخمین گر بردار پشتیبان، میانگین متحرک خودبرگشت تجمعی، مدل رگرسیون بردار پشتیبان مبتنی بر کرنل و مدل ترکیبی KSVR-ARIMA، برای پیش بینی غلظت عناصر آهن، مس، روی، منیزیم، منگنز و سیلیس مورد استفاده قرار گرفته اند و نتایج به دست آمده از این روش ها با هم مقایسه شده اند. نتایج به دست آمده نشان می دهد که روش ترکیبی KSVR-ARIMA، بهترین مقادیر پیش بینی را با کمترین خطا برای اغلب عناصر اشاره شده گزارش می کند.کلید واژگان: طیف نمایی فروشکست القائیده لیزری، آلومینیوم، شبکه عصبی مصنوعی، آریما، رگرسیون بردار پشتیبانIn this paper, by using of laser induced breakdown spectroscopy (LIBS) method, the elemental concentrations existed in standard aluminum alloys are measured quantitatively. Pulse laser of Nd:YAG at 1064 nm is irradiated on Al standard samples and analysis is performed by created plasma. Among different methods for estimation of concentration of existed elements in aluminum samples, artificial neural network (ANN), Support vector regression, autoregressive integrated moving average model (ARIMA), kernelized support vector regression (KSVR) and combined method of KSVR-ARIMA are utilized for prediction of element concentrations of Fe, Cu, Zn, Mg, Mn, and Si and obtained results from these methods are compared together. The extracted results show that the combined method of KSVR-ARIMA reports the best prediction values by the least error for the most of the elements.Keywords: Laser Induced Breakdown Spectroscopy, Aluminum, Artificial neural network ARIMA, Support vector regression
-
تخمین سرعت امواج فشارشی و برشی در صنعت نفت از اهمیت بیشتری برخوردار است. برخلاف سرعت موج تراکمی، سرعت موج برشی در تمامی چاه های یک میدان به دلیل تحمیل هزینه های بیشتر اندازه گیری نمی شود. بنابراین در صنعت نفت و گاز استفاده از روشی که با هزینه کمتر و دقت بیشتر سرعت موج برشی را تخمین بزند، اجتناب ناپذیر است. در این مطالعه، ابتدا برای تخمین سرعت موج برشی در یک چاه، همبستگی سایر نگاره های موجود در آن چاه (یعنی نگاره های صوتی، چگالی، تخلخل نوترون، مقاومت، پرتو گاما، حجم دولومیت، حجم کوارتز و اشباع آب) با سرعت موج برشی مورد بررسی قرار گرفت و مشخص شد که نگاره های سرعت موج تراکمی، چگالی، حجم دولومیت و حجم کوارتز همبستگی بیشتری با سرعت موج برشی دارند و این نگاره ها به عنوان ورودی برای تخمین سرعت موج برشی با استفاده از روش های مختلف انتخاب شدند. سپس از میان روش های مختلف، روشی که بهترین تطابق را با داده های واقعی موج برشی داشته باشد، به عنوان روش بهینه انتخاب شده و از این روش برای تخمین سرعت موج برشی در سایر چاه ها که فاقد نگاره موج برشی هستند استفاده می گردد. در این مقاله از روش رگرسیون چندگانه و الگوریتم های یادگیری ماشین (رگرسیون بردار پشتیبان، شبکه عصبی فازی تطبیقی و شبکه عصبی عمیق) برای تخمین سرعت موج برشی استفاده شد. نتایج ما نشان می دهند که روش شبکه عصبی عمیق با داشتن 97 درصد همبستگی بین داده های سرعت موج برشی واقعی و تخمینی نسبت به سایر روش ها جواب بهتری ارایه داده است. بنابراین برای تخمین سرعت موج برشی در سایر چاه ها که فاقد نگاره موج برشی هستند از روش پیشنهادشده در این مطالعه (شبکه عصبی عمیق) استفاده شد. برای صحت سنجی نتایج حاصل از شبکه عصبی عمیق در چاه های فاقد سرعت موج برشی، از مدل تجربی کاستاگنا استفاده شد که نتایج نشان دهنده تطابق خوبی میان این دو مدل است.
کلید واژگان: سرعت موج برشی، رگرسیون چندگانه، رگرسیون بردار پشتیبان، شبکه عصبی فازی تطبیقی، شبکه عصبی عمیقEstimation of compressional and shear wave velocities is very important in the oil and gas industry. Unlike compressional wave velocity, shear wave velocity is not measured in all wells of a field due to its higher costs. Therefore, using an alternative method that estimates the shear wave velocity at a lower cost and with acceptable accuracy is inevitable. In this study, to estimate the response variable in a well, the correlation of several logs in that well (i.e., acoustic logs, density, neutron porosity, resistivity, gamma ray, dolomite volume, quartz volume, and water saturation) with target log investigated. It was found that the compressional wave velocity, density, dolomite volume, and quartz volume logs are more correlated with shear wave velocity. Therefore, these logs were selected as input features for estimating shear wave velocity using different approaches. In the next step, among the various methods, The estimated values obtained from a method that has the best match with the actual shear wave velocity is introduced as the optimal model. Afterward, it is performed to estimate the shear wave velocity in other wells that do not have a shear wave velocity log. In this paper, multiple regression methods and machine learning algorithms (support vector regression, adaptive Neuro-fuzzy inference system, and deep artificial neural network) were applied to predict the shear wave velocity. In this study, data from seven wells were used. Due to the fact that only in well #7 shear wave velocity has been measured, and in six other wells this feature has not been recorded, this field data limitation has caused the data of well #7 to be divided into training, testing, and validation data. In multiple regression methods (linear and interaction models), support vector regression, and adaptive Neuro-fuzzy inference system, Randomly, 70% of the data has been used for training and 30% for testing, but in the artificial neural network method, Randomly, 70% of the data has been used for training, 15% for validation and 15% for network testing. For all methods, the root means square error and correlation between actual and estimated data are calculated. Linear model, interaction model, support vector regression, adaptive Neuro-fuzzy inference system, and deep artificial neural network have provided 91, 92, 89, 94, and 98% correlation in training data, and 88, 89, 86, 90 and 92% in testing data, respectively. Also, the RMSE for each of the mentioned methods is 125.59, 115.86, 148.23, 84.36, and 80.49 (m/s) in the training data and 139.77, 133.44, 166.03, 126.15, and 98.04 (m/s) in the testing data, respectively. Our results show that deep artificial neural network has provided a better solution than other methods. Hence, in this study deep artificial neural network has been proposed to estimate the shear wave velocity in other blind wells. Moreover, the Castagna empirical model was used to validate the obtained results from the deep artificial neural network in these wells, which show a good fit between the two models.
Keywords: Shear wave velocity, Multiple regression, Support vector regression, adaptive neuro-fuzzy inference system, deep artificial neural network -
مطالعه سیالات درگیر اغلب به صورت آزمایشگاهی و با هدف ارتقا صحت و دقت تجزیه های صورت گرفته انجام می شود. از آنجا که استفاده کاربردی از داده های حاصل از این مطالعات آزمایشگاهی می تواند در فرآیند اکتشاف کانسارها و یا دستیابی به اطلاعات اکتشافی تکمیلی از کانسارهای کشف شده سودمند باشد، در این مطالعه تخمین و مدل سازی پارامترهای ترمودینامیکی سیال درگیر (دمای همگنی، دمای یوتکتیک و شوری) در کانسار مس پورفیری سونگون انجام و در گام نخست، با استفاده از تخمین گر رگرسیون بردار پشتیبان، مدل سه بعدی این پارامترها تهیه شده است. دقت مدل سازی صورت گرفته جهت تخمین داده های سیالات درگیر شامل دمای همگنی، دمای یوتکتیک و شوری سیال درگیر به ترتیب برابر 76، 71 و 93 درصد می باشد. سپس براساس شرایط ترمودینامکی مساعد برای نهشت کالکوپیریت (بازه دمایی 300 تا 400 درجه سانتی گراد و شوری متوسط تا بالا)، از این مدل سه بعدی برای تهیه مدل پیش گویانه کانی زایی استفاده شده است. مقایسه مدل پیش گویانه با مدل بلوکی زمین شناسی عیار مس در محدوده کانسار نشان داد که تطابق مطلوبی بین این دو مدل وجود دارد. در نتیجه می توان 1) از مدل تهیه شده در ادامه فرآیند اکتشاف و با هدف اکتشافات تکمیلی بهره مند شد و 2) از این روش، برای شناسایی مناطق پرپتانسیل کانسارهایی که هنوز در مراحل اکتشافات مقدماتی هستند استفاده کرد.
کلید واژگان: الگوریتم یادگیری ماشین، رگرسیون بردار پشتیبان، سیالات درگیر، کانسار مس پورفیری سونگون، مدل پیش-گویانهIntroductionThe background of 3D modeling of fluid inclusion data goes back to use of inverse distance weighting (IDW) method in the Caixiashan Pb and Zn deposit (Sun et al., 2011). This method in spite of having some advantages such as simplicity in basis is associated with disadvantages such as uncertainty in selection of weighting function and ignoring data distribution. Today, new methods have been proposed for estimation including the support vector machine method (Dutta et al., 2010). One of this method’s capabilities is in dealing with small data sets (Dutta, 2006; Zhang et al., 1998). In this study, fluid inclusion thermodynamic parameters have been estimated using support vector regression method. Predictive model of mineralization has been provided acording to 3D models resulted for fluid inclusion data and also assumption of proper thermodynamic conditions for chalcopyrite deposition in the Sungun porphyry copper deposit.
Material and MethodsIn this study, a total of 173 data sets of fluid inclusions were obtained from 59 locations. This dataset using genetic algorithm method divided into training and testing sets (80% and 20%, respectively). Modeling of fluid inclusion thermodynamic parameters has been done by support vector regression method. The SVR is based on the statistical learning theory and the structural risk minimization.
Results and discussionAfter preparing and determination of training and test datasets, radial basis kernel function (RBF) was selected in order to estimate and model the fluid inclusion thermodynamic parameters using the support vector regression method. Better functionality was the main reason of using this kernel. In the next step, parameters were needed to be carefully determined to obtain a model with high generalization ability. In this regard, the grid search method with cross validation was used to determine optimal values for the model parameters. Model was then trained using the training dataset and finally evaluated on the test dataset. Then fluid inclusion thermodynamic parameters for each block of deposit were estimated using support vector regression method. According to mineralogical and fluid inclusion studies in the Sungun porphyry copper deposit, it has been determined that chalcopyrite deposition is related to fluids with moderate to high salinity and temperatures of 300-400 °C. The predictive model was prepared based on these conditions and estimated thermodynamic Parameters in block model. In this model, each arbitrary block has been labeled on a scale of 1 to 4 (based on the favorable conditions for chalcopyrite deposition). These labels are possibility index for copper deposition. According to possibility index, proper zones have been determined in 3D model. In order to performance evaluation of support vector regression method, the predictive model was compared with 3D model of copper grade. The results of this comparison showed that prepared predictive 3D model has high consistent with copper grade block model.
ConclusionIn this study, 3D modeling of fluid inclusion data was performed to estimate the thermodynamic parameters affecting mineralization (homogenization and eutectic temperatures and salinity) using support vector regression method to determine potential mineralization points in the area. Using the 3D models, we found the homogenization and eutectic temperatures and fluids salinity (in different ranges of these factors) in the Sungun porphyry copper deposit. To evaluate the 3D modeling efficiency in advancing the exploration process of the porphyry deposits, the conformity between mineralization and thermodynamic variations of the fluid inclusions was investigated and, based on it; a tool called “Predictive Model” was presented for the evaluation of the occurrence of mineralization in different parts of the region. A comparison of the SVR-based predictive model and the copper grade block model shows acceptable conformity in low, medium, and high-grade regions.
Keywords: Machine learning algorithm, Support Vector Regression, Fluid inclusion, Sungun Porphyry Copper Deposit, Predictive Model -
پیش بینی تغییرات آب و هوایی کره زمین با استفاده از مقادیر ثبت شده در دوره آماری حاضر نیازمند روشی دقیق بوده که بتوان نوسانات این تغییرات را به خوبی شناسایی کرده و با الگوگیری از این تغییرات مقادیر پارامتر مورد نظر را برای سال ها و یا دوره های آینده پیش بینی نمود. در این مطالعه شش مدل رگرسیون چند متغیره، ANN، SVR، ANFIS، SVM و GP جهت ریزمقیاس نمایی مقادیر متوسط دمای روزانه ایستگاه همدیدی ارومیه با استفاده از 26 پارامتر پیش بینی کننده منتج از گزارش پنجم IPCC مورد بررسی و مقایسه قرار گرفت. مقادیر دمای متوسط روزانه ایستگاه مورد بررسی از تاریخ 12 مارس 1961 (29 اسفند 1384) تا تاریخ 20 دسامبر 2005 (29 آذر 1384) انتخاب گردید. در تمامی روش های ذکر شده با استفاده از آزمون پیرسون از بین 26 پارامتر پیش بینی کننده ، 16 پارامتر که همبستگی بالایی با مقادیر دمای متوسط روزانه داشته انتخاب گردید. جهت بررسی مقادیر خطای ناشی از مدل سازی از سه معیار ضریب تبیین، مجذور میانگین مربعات خطا و معیار کارایی مدل استفاده شد. نتایج بررسی دقت و میزان خطای مدل ها نشان داد که در بین مدل های هوشمند GP، ANN، ANFIS و SVM، مدل برنامه ریزی ژنتیک کمترین مقدار خطا را داشته و در بین مدل های رگرسیونی (رگرسیون چندمتغیره و رگرسیون بردار پشتیبان) روش رگرسیون بردار پشتیبان، کمترین میزان خطا و بیشترین میزان دقت را در شبیه سازی مقادیر دمای روزانه ایستگاه همدیدی ارومیه داشته است. به طور کلی نتایج شبیه سازی مقادیر دما روزانه نشان دهنده دقیق تر بودن روش های رگرسیونی نسبت به روش های هوشمند می باشد. از آنجا که این مطالعه تنها با استفاده از داده های ایستگاه همدیدی ارومیه انجام گرفته است، لذا نتایج حاصله تنها برای ایستگاه مذکور اعتبار داشته و با اطمینان نمی توان نتایج را برای تمامی ایستگاه ها تعمیم داد.
کلید واژگان: الگوریتم ژنتیک، درجه حرارت، دریاچه ارومیه، ماشین بردار پشتیبان، ریز مقیاسPrediction of climate change using the recorded data from reference periods requires precise methods that are able to accurately detect fluctuations and predict changes for future periods. In this study, six multivariate regression models, ANN, SVR, ANFIS, SVM and GP, were investigated and compared for down scaling the daily mean temperature of the Urmia synoptic station, using 26 prediction parameters taken from the fifth IPCC report. The average daily temperature values measured from 12/03/1961 to 20/12/2005 were used for the analysis. 16 of the 26 parameters having a high correlation with the average daily temperature values were selected for all methods using the Pearson correlation test. To investigate the modeling errors, the coefficient of determination, Root Mean Square Error, and effectiveness criteria were used. The results of the evaluation of the accuracy and modeling error showed that among the smart models, GP, ANN, ANFIS and SVM, the Genetic Programming model has the least amount of errors, and in the regression model (multivariate regression and support vector regression) support vector regression has the lowest error rate and the highest accuracy of simulated daily temperature values of the Urmia station. In general, the results of the simulation of the mean daily temperature indicate that regression has better accuracy than smart methods. Since in this study, we only used the data from the Urmia synoptic station, so the results are only valid for this station, and it is not safe to generalize the results for all stations.
Keywords: Down Scaling, Genetic Algorithm, Support vector regression, Temperature, Urmia Lake -
Support Vector Regression (SVR) solves regression problems based on the concept of Support Vector Machine (SVM). In this paper, a new model of SVR with probabilistic constraints is proposed that any of output data and bias are considered the random variables with uniform probability functions. Using the new proposed method, the optimal hyperplane regression can be obtained by solving a quadratic optimization problem. The proposed method is illustrated by several simulated data and real data sets for both models (linearand nonlinear) with probabilistic constraints.Keywords: Probabilistic constraints, Support Vector Machine, Support Vector Regression, Quadratic programming, Probability function, Monte Carlo simulation
-
Support vector regression (SVR) is a learning method based on the support vector machine (SVM) that can be used for curve fitting and function estimation. In this paper, the ability of the nu-SVR to predict the catalytic activity of the Fischer-Tropsch (FT) reaction is evaluated and the result is compared with two other prediction techniques including: multilayer perceptron (MLP) and subtractive clustering-adaptive neuro-fuzzy inference system (SUB-ANFIS). The Fischer-Tropsch synthesis (FTS) was studied in a fixed bed micro-reactor under different operating conditions. An extensive experimental data set of MgO supported Fe-Co-Mn catalyst was used to predict the FTS. The input variables of three aforesaid models were: reactor temperature, H2/CO ratio and total pressure, while the CO conversion (catalytic activity) was used as an output variable. Finally, the achieved results from these approaches were compared. The results reveal that thenu-SVR model has more accurate (MSE = 0.0014) than the MLP (MSE = 0.0097) and ANFIS (MSE = 0.0043) approaches.
Keywords: Support vector regression, Fischer, Tropsch (FT) reaction, multilayer perceptron, Adaptive neuro fuzzy inference system, Operating conditions
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.