kernel function
در نشریات گروه آمار-
مدل بندی و برآوردی کارا از تابع روند در برآورد تغییرنگار و پیش گویی داده های فضایی از اهمیت بالایی برخوردار است. در این مقاله برای مدل بندی تابع روند از روش رگرسیون بردار پشتیبان استفاده شده است. سپس داده ها روندزدایی شده و برآورد تغییرنگار و پیش گویی انجام می شود. بر روی یک مجموعه داده واقعی، نتایج پیش گویی حاصل از روش پیشنهادی با روش پیش گویی اسپلاین و کریگیدن از طریق اعتبارسنجی متقابل مقایسه شده است. کمینه بودن ریشه دوم میانگین توان های دوم خطا معیار انتخاب روش مناسب پیش گویی است. نتایج پیش گویی برای چند موقعیت با مقادیر معلوم که بنا به دلایلی از مجموعه داده ها کنار گذاشته شده اند و برای موقعیت های جدید به دست آمده اند. نتایج بیانگر دقت بالای پیش گویی با روش پیشنهادی نسبت به کریگیدن و اسپلاین است.
کلید واژگان: تغییرنگار، کریگیدن، پیش گویی فضایی، رگرسیون بردار پشتیبان، تابع هستهModeling and efficient estimation of the trend function is of great importance in the estimation of variogram and prediction of spatial data. In this article, the support vector regression method is used to model the trend function. Then the data is de-trended and the estimation of variogram and prediction is done. On a real data set, the prediction results obtained from the proposed method have been compared with Spline and kriging prediction methods through cross-validation. The criterion for choosing the appropriate method for prediction is to minimize the root mean square of the error. The prediction results for several positions with known values were left out of the data set (for some reason) and were obtained for new positions. The results show the high accuracy of prediction (for all positions and elimination positions) with the proposed method compared to kriging and spline.
Keywords: Variogram, Kriging, Spatial Prediction, Support Vector Regression, Kernel Function -
هنگامی که داده ها از یک الگوی خطی ثابت تبعیت نکنند و به شکل پویایی بر حسب زمان یا مکان الگوهای متنوعی داشته باشند، مدل های با ضرایب متغیر به عنوان مهم ترین ابزار برای کشف الگوهای پویا در آنها مطرح می شوند. این مدل ها تعمیم طبیعی مدل های کلاسیک پارامتری هستند که با تفسیر پذیری خوب، محبوبیت زیادی در تجزیه و تحلیل داده ها به دست آورده اند. انعطاف پذیری و تفسیر پذیری بالای این مدل ها سبب کاربرد زیاد آنها در داده های واقعی شده است. در این مقاله ضمن مرور مختصری بر مدل های با ضرایب متغیر به روش برآورد پارامتر با استفاده از تابع هسته و اسپلاین مکعبی پرداخته و فاصله اطمینان و آزمون فرض برای توابع پارامترها به دست می آوریم. در نهایت با استفاده از داده های واقعی نرخ تورم ایران در سالهای 1368 تا 1396، کاربرد و قابلیت های مدل با ضرایب متغیر را در تفسیر نتایج نشان می دهیم چالش اصلی عدم برازش مناسب مدل داده های پانلی و نیز مدل های با واریانس غیر ثابت سربهای زمانی مثل مدل های آرچ و گارچ و مشتقات آنها به این داده هاست که استفاده از مدل های با ضرایب متغیر را توجیه می نماید.
کلید واژگان: مدل با ضرایب متغیر، تابع هسته، اسپلاین مکعبی، نرخ تورم ایرانVarying coefficient Models are among the most important tools for discovering the dynamic patterns when a fixed pattern does not fit adequately well on the data, due to existing diverse temporal or local patterns. These models are natural extensions of classical parametric models that have achieved great popularity in data analysis with good interpretability.The high flexibility and interpretability of these models have led to use in many real applications. In this paper, after presenting a brief review of varying coefficient models, we use the parameter estimation method using the kernel function and cubic spline then confidence band and hypothesis testing are investigated. Finally, using the real data of Iranchr(chr('39')39chr('39'))s inflation rate from 1989 to 2017, we show the application and capabilities of the varying coefficient model in interpreting the results. The main challenge in this application is that the panel or longitudinal models or even time series models with heterogeneous variances such as ARCH and GARCH models and their derived models did not fit adequately well on this dataset which justify the use of varying coefficient model.
Keywords: Varying coefficients model, Kernel function, Cubic Splines, Iran's Inflation rate -
سطح زیر منحنی راک یک معیار مرسوم برای ارزیابی عملکرد طبقه بندی بیومارکر ها است. در عمل یک بیومارکر قدرت طبقه بندی محدودی دارد لذا برای بهبود عملکرد طبقه بندی، علاقه مند به ترکیب مقادیر مربوط به بیومارکر ها به صورت خطی و غیرخطی هستیم در این مطالعه ضمن معرفی انواع توابع زیان، به معرفی روش Ramp AUC و برخی ویژگی های آن به عنوان یک مدل آماری مبتنی بر سطح زیر منحنی راک پرداخته می شود. این مدل جهت ترکیب بیومارکرها به شکل خطی یا غیرخطی باهدف بهبود عملکرد طبقه بندی و مینیمم کردن تابع زیان تجربی بر اساس تابع زیان Ramp AUC ارایه شده است. به عنوان مثال کاربردی، در این مطالعه از داده های 378 بیمار دیابتی مراجعه کننده به مراکز دیابتی اردبیل و تبریز در سال 1394-1393 استفاده شده است. جهت طبقه بندی بیماران دیابتی از لحاظ وضعیت محدودیت عملکردی بر مبنای بیومارکر های جمعیت شناختی و بالینی از روش RAUC استفاده گردید. اعتبارسنجی مدل به روش آموزش و آزمایش انجام شد. بر اساس نتایج گروه آزمایش، مقادیر سطح زیر منحنی به دست آمده برای مدل RAUC با ترکیبات خطی از بیومارکرها در قالب هسته خطی برابر 0.81 و با هسته تابع پایه شعاعی برابر 1.00 می باشد. نتایج بیانگر وجود یک الگوی غیرخطی قوی در داده ها می باشد به طوری که ترکیبات غیرخطی از بیومارکرها عملکرد طبقه بندی بالاتری نسبت به ترکیبات خطی را دارا می باشند.
کلید واژگان: تابع هسته، تابع زیان، سطح زیر منحنی راک، طبقه بندی، محدودیت عملکردیAndishe-ye Amari, Volume:24 Issue: 2, 2020, PP 95 -103The Area under the ROC Curve (AUC) is a common index for evaluating the ability of the biomarkers for classification. In practice, a single biomarker has limited classification ability, so to improve the classification performance, we are interested in combining biomarkers linearly and nonlinearly. In this study, while introducing various types of loss functions, the Ramp AUC method and some of its features are introduced as a statistical model based on the AUC index. The aim of this method is to combine biomarkers in a linear or non-linear manner to improve the classification performance of the biomarkers and minimize the experimental loss function by using the Ramp AUC loss function. As an applicable example, in this study, the data of 378 diabetic patients referred to Ardabil and Tabriz Diabetes Centers in 1393-1394 have been used. RAUC method was fitted to classify diabetic patients in terms of functional limitation, based on the demographic and clinical biomarkers. Validation of the model was assessed using the training and test method. The results in the test dataset showed that the area under the RAUC curve for classification of the patients according to the functional limitation, based on the linear kernel pf biomarkers was 0.81 and with a kernel of the radial base function (RBF) was equal to 1.00. The results indicate a strong nonlinear pattern in the data so that the nonlinear combination of the biomarkers had higher classification performance than the linear combination.
Keywords: kernel function, loss function, Area under the ROC Curve, classification, functional limitation
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.