support vector regression
در نشریات گروه آمار-
مدل بندی و برآوردی کارا از تابع روند در برآورد تغییرنگار و پیش گویی داده های فضایی از اهمیت بالایی برخوردار است. در این مقاله برای مدل بندی تابع روند از روش رگرسیون بردار پشتیبان استفاده شده است. سپس داده ها روندزدایی شده و برآورد تغییرنگار و پیش گویی انجام می شود. بر روی یک مجموعه داده واقعی، نتایج پیش گویی حاصل از روش پیشنهادی با روش پیش گویی اسپلاین و کریگیدن از طریق اعتبارسنجی متقابل مقایسه شده است. کمینه بودن ریشه دوم میانگین توان های دوم خطا معیار انتخاب روش مناسب پیش گویی است. نتایج پیش گویی برای چند موقعیت با مقادیر معلوم که بنا به دلایلی از مجموعه داده ها کنار گذاشته شده اند و برای موقعیت های جدید به دست آمده اند. نتایج بیانگر دقت بالای پیش گویی با روش پیشنهادی نسبت به کریگیدن و اسپلاین است.
کلید واژگان: تغییرنگار، کریگیدن، پیش گویی فضایی، رگرسیون بردار پشتیبان، تابع هستهModeling and efficient estimation of the trend function is of great importance in the estimation of variogram and prediction of spatial data. In this article, the support vector regression method is used to model the trend function. Then the data is de-trended and the estimation of variogram and prediction is done. On a real data set, the prediction results obtained from the proposed method have been compared with Spline and kriging prediction methods through cross-validation. The criterion for choosing the appropriate method for prediction is to minimize the root mean square of the error. The prediction results for several positions with known values were left out of the data set (for some reason) and were obtained for new positions. The results show the high accuracy of prediction (for all positions and elimination positions) with the proposed method compared to kriging and spline.
Keywords: Variogram, Kriging, Spatial Prediction, Support Vector Regression, Kernel Function -
تحلیل داده های با بعد بالا با استفاده از روش های رگرسیون کلاسیک انجام پذیر نیست و ممکن است نتایج آن گمراه کننده باشد.در این تحقیق سعی شده است با معرفی تکنیک های جدید و قدرتمندی مانند رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون ستیغی و لاسو، به واکاوی این گونه داده ها پرداخته شود. در این راستا، با تحلیل دو مجموعه داده بعد بالا (داده های مربوط به تولید ریبوفلاوین و شبیه سازی شده) با روش های معرفی شده، به ارزیابی کاراترین مدل با استفاده از سه معیار (مجذور همبستگی، میانگین توان دوم خطا و میانگین انحراف درصد خطای مطلق) با توجه به نوع داده ها پرداخته می شود.
کلید واژگان: داده های با بعدبالا، رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون ستیغی، رگرسیون لاسوThe high-dimensional data analysis using classical regression approaches is not applicable, and the consequences may need to be more accurate. This study tried to analyze such data by introducing new and powerful approaches such as support vector regression, functional regression, LASSO and ridge regression. On this subject, by investigating two high-dimensional data sets (riboflavin and simulated data sets) using the suggested approaches, it is progressed to derive the most efficient model based on three criteria (correlation squared, mean squared error and mean absolute error percentage deviation) according to the type of data.
Keywords: Functional regression, High dimensional data, Lasso regression, Ridge regression, Support vector regression -
مشهورترین تکنیک تحلیل داده های تابعی رویکرد مولفه های اصلی تابعی است که ابزاری مهم برای کاهش بعد نیز است. رگرسیون بردار پشتیبان شاخه ای از یادگیری ماشین و ابزار قدرتمندی برای تحلیل داده است. در این مقاله با استفاده از رگرسیون مولفه اصلی تابعی براساس تاوان های مشتق دوم، ریج و لاسو و با توجه به رگرسیون بردار پشتیبان با چهار هسته (خطی، چند جمله ای، سیگمویید و شعاعی) در داده های طیف سنجی به مدل سازی متغیر وابسته روی متغیرهای پیش بین پرداخته شده است. بر اساس نتایج بدست آمده طبق معیارهای نیکویی برازش پیشنهادی، مدل رگرسیون بردار پشتبان با هسته خطی و خطای بهینه شده $0.2$ مناسب ترین برازش را به داده ها داشته است.
کلید واژگان: تحلیل داده های تابعی، رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون مولفه اصلی، یادگیری ماشینThe most popular technique for functional data analysis is the functional principal component approach, which is also an important tool for dimension reduction. Support vector regression is branch of machine learning and strong tool for data analysis. In this paper by using the method of functional principal component regression based on the second derivative penalty, ridge and lasso and support vector regression with four kernels (linear, polynomial, sigmoid and radial) in spectroscopic data, the dependent variable on the predictor variables was modeled. According to the obtained results, based on the proposed criteria for evaluating the goodness of fit, support vector regression with linear kernel and error equal to $0.2$ has had the most appropriate fit to the data set.
Keywords: Functional data analysis, Functional regression, Machine learning, Principal component regression, Support vector regression -
This article has been compiled to identify the best model of housing price forecasting using machine learning methods with maximum accuracy and minimum error. Five important machine learning algorithms are used to predict housing prices, including Nearest Neighbor Regression Algorithm (KNNR), Support Vector Regression Algorithm (SVR), Random Forest Regression Algorithm (RFR), Extreme Gradient Boosting Regression Algorithm (XGBR), and the Long Short-Term Memory Neural Network Algorithm (LSTM). This research has been done using the data of the Statistics Center of Iran, which contains information on the purchase and sale of residential units in Tehran in the years 2014 to 2020 and includes 998299 transactions and 11 features. Loss of data, batch data conversion, normalization, etc. are performed on the housing data set to obtain the final and error-free data set. To divide the data set into training and test data sets, the important and practical method of cross-validation or K-Fold has been used because of its simplicity and effectiveness and as a universally valid method. Various evaluation criteria such as MSE, RMSE, MAE,ME and R2 were used to compare the models and identify the best model. Comparison of models in terms of all evaluation criteria in all K-fold subsets proves the stability and superiority of the Extreme Gradient Boosting Regression model.
Keywords: Housing price forecasting, nearest neighbor regression, random forest regression, support vector regression, long short-Term memory neural network, and extreme gradient boosting regression.
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.