kernel function
در نشریات گروه کشاورزی-
هدف از پژوهش حاضر، بررسی و مقایسه صحت پیش بینی ژنومی روش ماشین بردار پشتیبان (SVM) بر اساس توابع کرنل مختلف شامل خطی (SVM-lin)، شعاعی (SVM-rad)، چند جمله ای (SVM-pol) و حلقوی (SVM-sig)، و روش GBLUP در مدل های کنش ژنی صرفا افزایشی و افزایشی-انحراف غالبیت با در نظر گرفتن سطوح مختلف واریانس غالبیت بود. بدین منظور، ژنومی حاوی شش کروموزوم و به طول 600 سانتی مورگان شبیه سازی شد. روی هر کروموزوم، 1000 نشانگر چندشکلی تک نوکلئوتیدی (SNP) با فواصل یکسان و 100 جایگاه صفت کمی (QTL) به طور تصادفی در نظر گرفته شد. واریانس فنوتیپی و وراثت پذیری به ترتیب برابر با 1 و 4/0 در نظر گرفته شد. واریانس انحراف غالبیت برابر با 10/0، 15/0، 20/0، 25/0، 30/0 و 35/0 در نظر گرفته شد. صحت پیش بینی به عنوان ضریب همبستگی پیرسون بین ارزش ژنتیکی واقعی (TGV) یا ارزش اصلاحی واقعی (TBV) و ارزش ژنتیکی ژنومی (GEGV) یا ارزش اصلاحی ژنومی (GEBV) تعریف شد. روش مرسوم GBLUP در تمام سناریوهای مختلف واریانس غالبیت، صحت پیش بینی GEBV و GEGV بالاتری را نشان داد. در بین رویکردهای مختلف SVM، در مدل صرفا افزایشی و افزایشی- انحراف غالبیت بر اساس صحت پیش بینی GEGV، رویکردهای SVM-rad و SVM-sig به ترتیب بالاترین عملکرد را نشان دادند. بر اساس صحت پیش بینی GEBV، با افزایش واریانس غالبیت، این برتری به شدت کاهش یافت، به طوری که در واریانس غالبیت بیشتر از 30/0، رویکردهای SVM-lin و SVM-sig به ترتیب صحت پیش بینی GEBV اندکی بالاتر و برابر با SVM-rad نشان دادند. به طورکلی، در برازش فنوتیپ روی نشانگرها با روش ناپارامتری SVM، استفاده از تابع کرنل شعاعی در مدل پیشنهاد می شود.
کلید واژگان: ارزش اصلاحی ژنومی، تابع کرنل، تجزیه ژنومی، صحت پیش بینی، ماشین بردار پشتیبانIntroductionPredicting quantitative traits is a fundamental aspect of plant and animal breeding. Genomic selection is a precise and efficient approach that estimates genetic merit using high-density single nucleotide polymorphisms (SNPs). However, most genomic selection procedures primarily focus on additive effects to calculate the genomic estimated breeding value (GEBV) for selection candidates. Nonetheless, incorporating non-additive effects offers several advantages: (i) it enhances the accuracy of GEBV predictions and subsequent selection responses, (ii) it facilitates optimized mate allocation among selection candidates, and (iii) it enables improved utilization of non-additive genetic variation through tailored crossbreeding or purebred breeding strategies. One of the most challenging factors affecting the accuracy of genomic evaluation is the selection of an appropriate statistical method to estimate marker effects with high accuracy. The most common parametric methods for genomic evaluation are the genomic best linear unbiased predictor (GBLUP) and Bayesian methods, which use the co-variance structure between individuals and regression of phenotype on markers to predict the genetic values of individuals, respectively. However, in recent years, non-parametric methods of machine learning have been widely used for genomic evaluation in animal and plant breeding programs. This study aimed to evaluate and compare the accuracy of genomic predictions using GBLUP and support vector machine (SVM) methods. The SVM models employed various kernel functions, including linear (SVM-lin), Gaussian radial (SVM-rad), polynomial (SVM-pol), and cyclic (SVM-sig). Both purely additive and additive + dominance deviation gene action models were considered under varying levels of dominance variance.
Materials and methodsA simulated genome comprising six chromosomes with a total length of 600 cM was used for this study. Each chromosome contained 1,000 evenly spaced SNPs and 100 randomly distributed quantitative trait loci (QTLs). Phenotypic variance ( ) and narrow-sense heritability ( ) were set to 1 and 0.4, respectively. Dominance variance ( ) levels were evaluated at 0.10, 0.15, 0.20, 0.25, 0.30, and 0.35. Prediction accuracy was calculated as the Pearson correlation coefficient between the true genetic value (TGV) or true breeding value (TBV) and their respective genomic estimates (GEGV or GEBV). The correlations were represented as and , respectively. In addition, the practical significance of differences in prediction accuracy among the studied statistical methods was assessed using Cohen’s d effect size during 100 replicates.
Results and discussionThe conventional GBLUP method consistently exhibited higher prediction accuracy for both GEBV and GEGV across all scenarios. Among the SVM approaches, the SVM-rad and SVM-sig kernels showed superior performance in predicting GEGV under both purely additive and additive + dominance deviation models. However, for GEBV prediction, their performance declined with increasing dominance variance. When dominance variance exceeded 0.30, SVM-lin and SVM-sig demonstrated prediction accuracy comparable to or slightly better than SVM-rad. The differences in prediction accuracy between GBLUP and SVM-rad were minimal (d=0.218) in the purely additive model but reached their peak (d=0.492 and d=0.404) in the additive + dominance deviation model at the highest dominance variance ( ). This disparity occurred because, as dominance variance increased, the GBLUP method exhibited slightly greater changes in accuracy compared to the SVM-rad method. Furthermore, with higher dominance variance, the difference in prediction accuracy for GEBV between the SVM methods and both GBLUP and SVM-rad substantially decreased. For example, in the purely additive model ( ), Cohen’s d was 2.608 and 2.336, respectively, while in the additive + dominance deviation model ( ), d dropped to 0.309 and 0.189, respectively. Using the additive + dominance deviation model significantly improved GEBV prediction accuracy, particularly when dominance variance contributed substantially to phenotypic variance. This improvement is due to dominance deviation, which arises from interactions between alleles at a locus. While additive effects are represented as breeding values, which partially incorporate dominance effects, genomic evaluations that explicitly consider dominance effects can further enhance GEBV accuracy.
ConclusionsThe choice of kernel function in SVM models plays a pivotal role in the accuracy of GEBV and GEGV predictions. Overall, when applying the nonparametric SVM method to fit markers to phenotypes, the Gaussian radial kernel function is recommended for optimal performance. However, as the dominance variance increased, the performance of SVM-lin and SVM-sig methods improved significantly and the performance gap with GBLUP and SVM-rad decreased. This indicated the potential capacity of SVM in investigating non-additive effects, especially in situations where the contribution of dominance in explaining phenotypic variance increases.
Keywords: Genomic Breeding Value, Kernel Function, Genomic Analysis, Prediction Accuracy, Support Vector Machine -
در سال های اخیر با رشد فناوری، روش های نوین برای حل مسایل غیرخطی نظیر پیش بینی جریان رودخانه ها به صورت قابل ملاحظه ای توسعه یافته است. از جمله روش هایی که اخیرا توسط محققان مختلف در این زمینه مورد استفاده قرار گرفته است مدل های ماشین بردار پشتیبان (SVM) و سیستم استنتاج عصبی فازی تطبیقی (ANFIS) می باشد. در این مطالعه از روش های مذکور برای پیش بینی جریان ماهانه رودخانه های نازلوچای و سزار در دوره آماری 1395-1335 استفاده شد. در ابتدا الگوهای ورودی در دو حالت الف) استفاده از داده های جریان و در نظر گرفتن نقش حافظه و ب) تاثیر دادن ترم پریودیک آماده و به مدل ها معرفی گردید. مدل سازی براساس 80 درصد داده های تاریخی ثبت شده صورت گرفت (576 ماه) و با 20 (144 ماه) درصد بقیه ارزیابی گردید. عملکرد مدل های به کار رفته با شاخص های آماری مجذور میانگین مربعات خطا (RMSE)، نش- ساتکلیف (NS) و میانگین قدر مطلق خطای نسبی (MARE)، مورد بررسی قرار گرفت. نتایج حاصل نشان داد که روش SVM با تابع کرنل RBF بیش ترین دقت را در پیش بینی جریان ماهانه هر دو رودخانه داشته و استفاده از ترم پریودیک توانسته است عملکرد آن را به طور قابل ملاحظه ای افزایش دهد. همچنین کارایی مدل ANFIS نیز با استفاده از ترم پریودیک بهبود یافته و در محل ایستگاه تپیک در الگوی M7 و برای جریان رودخانه سزار با الگوی M6 کمترین خطا را در پیش بینی جریان داشته است. به طور کلی نتایج این مطالعه نشان داد که روش SVM از عملکرد بهتری نسبت به مدل ANFIS در پیش بینی جریان برخوردار بوده و انتخاب تابع کرنل مناسب تاثیر مستقیمی بر کارایی آن دارد.
کلید واژگان: اثر پریودیک، تابع خود همبستگی جزئی، تابع عضویت، تابع کرنلIn recent years by growing technology, new methods have been substantially developed to solve nonlinear problems such as river flow forecasting. Among the available various methods, Support Vector Machine (SVM) and Adaptive Neuro-Fuzzy Inference System (ANFIS) models have been recently used by many researchers. In this study, these methods were used to predict the monthly flow of NazluChai and Sezar Rivers during 1956-2016 period. Firstly, the data were prepared in two modes: (a) using flow data and considering the role of memory; (b) influencing the periodic term. Modeling was done by 80% of the data (576 months) for training and the remaining 20% (144 months) for testing. The root mean square error (RMSE), Nash-Sutcliffe (NS) and mean absolute relative error (MARE) metrics were used to evaluate the performance of the proposed models. The results showed that the SVM method with the RBF kernel function had the best performance in predicting monthly flow of the studied rivers. In addition, the periodic term significantly increased the prediction accuracy of the SVM-RBF model. Also, the performance of the ANFIS method was improved by using the periodic term and this model had the least error in estimating the monthly flow of the Saesar and Nazlu chi Rivers in M6 and M7 patterns, respectively. In general, the results of this study showed that the SVM method performs better than the ANFIS model in monthly flow prediction and the selection of appropriate kernel function has a direct effect on its efficiency.
Keywords: Periodic effect, Partial autocorrelation function, Membership function, Kernel function -
تحلیل فراوانی دبی اوج سیلاب با پهنای باندمتغیر و ثابت روش چگالی هسته ای / مطالعه موردی: رودخانه دزTraditional method in flood frequency analysis is parametric approach. This method lacks the ability to describe multimodal and Asymmetric densities. In order to overcome this problem¡ the nonparametric models can be used. Two methods of nonparametric approach are: fixed and variable kernel density. In fixed kernel density method¡ the probability density function can be estimated by selecting a kernel function and optimal bandwidth and in variable kernel density method the probability density function can be estimated by selecting a kernel function and bandwidth at each observation point. Cross validation and Rule of thumb are common methods for estimating the optimum bandwidth. In this paper¡ besides mentioned methods Plug in bandwidth method is used and nonparametric flood frequency analysis is performed using annual maximum flood data of the Dez river. Finally results were compared with parametric method. According to RMSE¡ it is concluded that plug in bandwidth is the most accurate method for estimating optimum bandwidth. As well as Nonparametric method based on variable kernel density is more accurate than fixed kernel density and both types of these models are more accurate than LP3 distribution.Keywords: Bandwidth, Flood frequency, Kernel function, Nonparametric, Parametric
-
در این تحقیق با استفاده از زنجیره مارکف مرتبه اول اقدام به شبیه سازی مقادیر شوری در نه عمق و ده کلاس شوری در پسته زارهای شهرستان اردکان گردید. با استفاده از ماتریس احتمال انتقال، توزیع یکنواخت و تابع کرنل اقدام به شبیه سازی 500000 هزار پروفیل گردید. نتایج نشان داد در حالتی که از تابع کرنل برای شبیه سازی استفاده گردید نسبت به حالتی که از توزیع یکنواخت جهت تولید داده های مصنوعی استفاده گردید خصوصیات آماری (از قبیل میانگین، انحراف معیار، کشیدگی و چولگی) داده های شبیه سازی شده بیشتر شبیه داده های مشاهداتی بودند. همچنین در حالتی که شبیه سازی از عمق به سطح نسبت به حالتی که شبیه سازی از سطح به عمق صورت گرفت عملکرد مدل بهتر می باشد. به طورکلی رویکرد شبیه سازی با استفاده از زنجیره مارکف قادر است روابط بین کلاس های مختلف را به خوبی در شبیه سازی در نظر بگیرد.کلید واژگان: تابع کرنل، ماتریس احتمال انتقال، توزیع یکنواختIn this research, a first order Markov chain model was applied to simulate soil salinity in nine standard depths and 10 classes in the cultivated pistachio areas of Ardakan city. Transition probability matrix, kernel and uniform distribution were used to simulate 500000 soil profiles. Results indicate kernel function could reproduce soil salinity values with statistical criteria (i.e. mean, standard deviation, skewness and kurtosis) more closely to the observed data when compared to data simulated by uniform function. Moreover, simulation processes from down-up is more accurate than that of up-down method. Overall, Makov simulation technique is able to consider the relationship between different classes.Keywords: Kernel function, transition probability matrix, uniform distribution
-
برای تحلیل فراوانی بارندگی، می توان از دو روش پارامتری و غیر پارامتری استفاده کرد. روش های معمول و مرسوم تحلیل فراوانی براساس روش های پارامتری استوار هستند. معمولا برای برآورد پارامتر ها در روش های پارامتری از روش های مختلفی نظیر گشتاورهای معمولی، حداکثر درست نمایی و گشتاورهای وزنی احتمال استفاده می شود. در این مقاله از روش حداکثر درست نمایی و روش جدید گشتاور خطی که حالت خاصی از روش گشتاورهای وزنی احتمال است، برای تحلیل فراوانی بارندگی استفاده شده است و نتایج حاصل از آن با روش غیر پارامتری توابع هسته نظیر نرمال، لوگ نرمال، مثلثی و مستطیلی بر روی بارندگی های ماهانه و سالانه پنج ایستگاه ایران شامل اصفهان، بوشهر، تهران، جاسک و مشهد مقایسه شده است، مقایسه شد. در این پژوهش بارندگی های ماهانه و سالانه با استفاده از روش گشتاور خطی و حداکثر درست نمایی، به سیزده تابع توزیع مختلف از جمله لجستیک، مقادیر حدی تعمیم یافته و غیره برازش یافتند. نتایج حاصل از تحلیل فراوانی بارندگی نشان داد، که روش گشتاور خطی در مقایسه با روش حداکثر درست نمایی دارای حداقل مقادیر متوسط انحراف نسبی و متوسط مربع انحراف نسبی بود، بهترین برازش را به داده های بارندگی های ماهانه و سالانه داشت. هم چنین، روش گشتاور خطی بهترین برازش را برای بارندگی سالانه بوشهر، جاسک و مشهد در مقایسه با روش غیرپارامتری هسته مستطیلی، مثلثی و نرمال داشت. بنابراین می توان از روش گشتاور خطی به عنوان روش مناسب برای تحلیل فراوانی پارامترهای دیگر نظیر سیلاب، خشک سالی و غیره در برنامه ریزی های مدیریت منابع آب و مهندسی هیدرولوژی استفاده کرد.
کلید واژگان: توابع هسته، گشتاور معمولی، گشتاور وزنی، لجستیک، نزولاتThere are two parametric and nonparametric approaches for frequency analysis of hydrological data. Current methods of frequency analysis are based on the parametric methods. Moments، maximum likelihood and probability weighted moments are from various parametric methods for frequency analysis. In this research، maximum likelihood and L-moment methods are used for precipitation frequency analysis. L-moment is a new method for frequency analysis and one of the specific kinds of probability weighted moments. The results of frequency analysis with L-moment are compared with maximum likelihood method and kernel functions of nonparametric methods of normal، log-normal، rectangular and triangular kernel function. In this research، monthly and annual precipitations are fitted to thirteen distribution functions such as Logistic، Generalized Extreme Value and etc. with estimation of L-moment and maximum likelihood methods. The results showed that L-moment parametric method is best fitted to monthly and annual data due to mean relative deviation and mean square relative deviation goodness of fit tests compared to maximum likelihood parametric method. The L-moment parametric method is also best fitted to Boushehr، Jask and Mashhad annual data due to mean relative deviation and mean square relative deviation goodness of fit tests compared to kernel nonparametric methods with rectangular، triangular and normal functions. Therefore، L-moment method is a suitable method for frequency analysis of other hydrological parameters such as flood and drought for planning of water resource management and hydrological analysis.Keywords: Kernel function, Logistic, Moments, Precipitation, Weighted moment
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.