functional regression
در نشریات گروه آمار-
تحلیل داده های با بعد بالا با استفاده از روش های رگرسیون کلاسیک انجام پذیر نیست و ممکن است نتایج آن گمراه کننده باشد.در این تحقیق سعی شده است با معرفی تکنیک های جدید و قدرتمندی مانند رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون ستیغی و لاسو، به واکاوی این گونه داده ها پرداخته شود. در این راستا، با تحلیل دو مجموعه داده بعد بالا (داده های مربوط به تولید ریبوفلاوین و شبیه سازی شده) با روش های معرفی شده، به ارزیابی کاراترین مدل با استفاده از سه معیار (مجذور همبستگی، میانگین توان دوم خطا و میانگین انحراف درصد خطای مطلق) با توجه به نوع داده ها پرداخته می شود.
کلید واژگان: داده های با بعدبالا، رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون ستیغی، رگرسیون لاسوThe high-dimensional data analysis using classical regression approaches is not applicable, and the consequences may need to be more accurate. This study tried to analyze such data by introducing new and powerful approaches such as support vector regression, functional regression, LASSO and ridge regression. On this subject, by investigating two high-dimensional data sets (riboflavin and simulated data sets) using the suggested approaches, it is progressed to derive the most efficient model based on three criteria (correlation squared, mean squared error and mean absolute error percentage deviation) according to the type of data.
Keywords: Functional regression, High dimensional data, Lasso regression, Ridge regression, Support vector regression -
تحلیل داده های تابعی برای توسعه رویکردهای آماری در داده هایی مورد استفاده قرار می گیرد که دارای ماهیت تابعی و پیوسته هستند و چون این توابع به فضاهای با بعد بی نهایت تعلق دارند، استفاده از روش های متداول در آمار کلاسیک برای تحلیل آن ها، با چالش روبرو است. مشهورترین تکنیک تحلیل داده های آماری، رویکرد مولفه های اصلی تابعی می باشد که ابزاری مهم برای کاهش بعد است، در این مقاله با استفاده از روش رگرسیون مولفه اصلی تابعی براساس جریمه مشتق دوم، ریج و لاسو به تحلیل داده های تابعی آب و هوای کانادا و داده های تابعی طیف سنج پرداخته خواهد شد. بدین منظور برای تعیین مقدار بهینه پارامتر جریمه در روش های مورد استفاده از اعتبار سنجی متقابل تعمیم یافته ، که معیاری معتبر و کارآمد است ، استفاده می گردد.
کلید واژگان: اعتبار سنجی متقابل تعمیم یافته، رگرسیون تابعی، رگرسیون مولفه اصلی، تحلیل داده های تابعیFunctional data analysis is used to develop statistical approaches to the data sets that are functional and continuous essentially, and because these functions belong to the spaces with infinite dimensional, using conventional methods in classical statistics for analyzing such data sets is challenging.
The most popular technique for statistical data analysis is the functional principal components approach, which is an important tool for dimensional reduction. In this research, using the method of functional principal component regression based on the second derivative penalty, ridge and lasso, the analysis of Canadian climate and spectrometric data sets is proceed. To do this, to obtain the optimum values of the penalized parameter in proposed methods, the generalized cross validation, which is a valid and efficient criterion, is applied.Keywords: Functional Data Analysis, Functional Regression, Generalized Cross Validation, Principal Component Regression -
مشهورترین تکنیک تحلیل داده های تابعی رویکرد مولفه های اصلی تابعی است که ابزاری مهم برای کاهش بعد نیز است. رگرسیون بردار پشتیبان شاخه ای از یادگیری ماشین و ابزار قدرتمندی برای تحلیل داده است. در این مقاله با استفاده از رگرسیون مولفه اصلی تابعی براساس تاوان های مشتق دوم، ریج و لاسو و با توجه به رگرسیون بردار پشتیبان با چهار هسته (خطی، چند جمله ای، سیگمویید و شعاعی) در داده های طیف سنجی به مدل سازی متغیر وابسته روی متغیرهای پیش بین پرداخته شده است. بر اساس نتایج بدست آمده طبق معیارهای نیکویی برازش پیشنهادی، مدل رگرسیون بردار پشتبان با هسته خطی و خطای بهینه شده $0.2$ مناسب ترین برازش را به داده ها داشته است.
کلید واژگان: تحلیل داده های تابعی، رگرسیون بردار پشتیبان، رگرسیون تابعی، رگرسیون مولفه اصلی، یادگیری ماشینThe most popular technique for functional data analysis is the functional principal component approach, which is also an important tool for dimension reduction. Support vector regression is branch of machine learning and strong tool for data analysis. In this paper by using the method of functional principal component regression based on the second derivative penalty, ridge and lasso and support vector regression with four kernels (linear, polynomial, sigmoid and radial) in spectroscopic data, the dependent variable on the predictor variables was modeled. According to the obtained results, based on the proposed criteria for evaluating the goodness of fit, support vector regression with linear kernel and error equal to $0.2$ has had the most appropriate fit to the data set.
Keywords: Functional data analysis, Functional regression, Machine learning, Principal component regression, Support vector regression -
گاهی در عمل داده ها به صورت تابعی از یک متغیر دیگر هستند که به این نوع داده ها، داده های تابعی گفته می شود. اگر متغیر پاسخ اسکالر و به صورت رسته ای یا گسسته باشد و متغیرهای کمکی به صورت تابعی، آنگاه برای تحلیل این نوع داده ها از مدل خطی تابعی تعمیم یافته استفاده می شود.در این مقاله یک مدل بریده شده خطی تابعی تعمیم یافته بررسی و برای به دست آوردن برآورد پارامترهای مدل از یک رهیافت ماکسیمم درستنمایی استفاده می شود. درنهایت در یک مطالعه شبیه سازی و دو مثال کاربردی مدل و روش های ارایه شده پیاده سازی می شوند.
کلید واژگان: عملگر کوواریانس، توابع ویژه، رگرسیون تابعی، مدل خطی تابعی تعمیم یافته، بسط کارهونن لوئه وSometimes, in practice, data are a function of another variable, which is called functional data. If the scalar response variable is categorical or discrete, and the covariates are functional, then a generalized functional linear model is used to analyze this type of data. In this paper, a truncated generalized functional linear model is studied and a maximum likelihood approach is used to estimate the model parameters. Finally, in a simulation study and two practical examples, the model and methods presented are implemented.
Keywords: Covariance operator, Eigenfunctions, Functional regression, Generalized functional linear model, Karhunen–Loève expansion
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.