non-linear regression
در نشریات گروه آب و خاک-
سابقه و هدفاخیرا توابع انتقالی شبه پیوسته (PC-PTF) برای برآورد منحنی نگه داشت آب خاک (SWRC) معرفی شده است. این توابع به شدت به قدرت الگوریتم های یادگیری ماشین حساس هستند. روش درخت M5 مشابه درخت های رگرسیون است، که توابع خطی در برگ های آن قرار دارند و دارای قدرت بالایی در ایجاد توابع انتقالی است. با این وجود تاکنون از این روش برای ایجاد PC-PTF برای طیف وسیعی از بافت های خاک استفاده نشده است. همچنین، کارایی برخی متغیرهای ساختمان خاک در بهبود PC-PTFها بررسی نشده است. علاوه بر این، وابستگی توزیع خطای PC-PTFها به عوامل مختلف مورد بررسی عمیق قرار نگرفته است. بنابراین اهداف این مطالعه ایجاد توابع انتقالی شبه پیوسته با استفاده از روش M5، بررسی تاثیر متغیرهای ساختمان خاک بر عملکرد این توابع و بررسی وابستگی خطای این توابع به عوامل مختلف بود.مواد و روش هاتعداد 120 نمونه خاک از استان های تهران و همدان از عمق 15 تا 60 سانتی متری با کاربری زراعی، باغی و مرتع برداشت شد. بافت خاک، جرم مخصوص ظاهری (BD) ، SWRC، هدایت هیدرولیکی اشباع (Ks) ، مواد آلی (OM) ، میانگین وزنی قطر خاکدانه ها (MWD) و مقاومت فروروی در مکش 300 هکتوپاسکال (PR300) اندازه گیری شد. 13 تابع انتقالی شبه پیوسته، با هر کدام از روش های درخت M5 و رگرسیون غیر خطی، در قالب 3 گروه متغیر ورودی، برای برآورد SWRC ایجاد شد. توزیع خطای تمام توابع انتقالی شبه پیوسته براساس آماره مجذور میانگین مربعات خطا بر روی مثلث بافت خاک ترسیم شد.یافته هادر تابع اول، مکش خاک به عنوان تنها تخمین گر مورد استفاده قرار گرفت. رگرسیون غیرخطی مدل قابل قبولی برای تابع اول با ضریب تعیین 718/0 ایجاد کرد. در توابع شبه پیوسته 3 تا 6 اجزای بافت، BD و رطوبت FC (مکش 300 هکتوپاسکال) و PWP (مکش 15000 هکتوپاسکال) برای برآورد SWRC مورد استفاده قرار گرفتند. ضریب تعیین این توابع 719/0 تا 990/0 به دست آمد که بهبود عملکرد برآورد SWRC را نشان داد. در روش M5، استفاده از رطوبت FC موجب بهبود قابل توجه عملکرد مدل گردید و با مجذور میانگین مربعات 015/0 و cm3cm-3 020/0، و ضرب تعیین 987/0 و 973/0 به ترتیب در مراحل آموزش و اعتبارسنجی، یک مدل بهینه را ایجاد کرد. در روش M5، هر تابعی که از Ks و MWD به عنوان تخمین گر استفاده کرد، بهبود معنی داری نسبت به تابع 4 که از اجزای بافت خاک و BD به عنوان تخمین گر استفاده کرده بود، نشان داد. مقادیر آماره آکائیک در هر دو مرحله آموزش و اعتبارسنجی در روش M5 نسبت به رگرسیون غیرخطی، به ترتیب به میزان 37 تا 283 درصد و 111 تا 157 درصد کمتر به دست آمد. توزیع خطا بر روی مثلث بافت خاک، هیچ وابستگی به بافت خاک نشان نداد، ولی به روش ایجاد توابع شبه پیوسته و متغیرهای ورودی مرتبط بود.نتیجه گیریمی توان با روش های هوش مصنوعی قدرتمند یک مدل جامع برای SWRC ایجاد کرد، که باعث عدم نیاز کاربران به مدل های مختلف SWRC مانند ون گنوختن برای خاک های مختلف خواهد بود. استفاده از مجموعه ای از متغیرهای بافت و ساختمان خاک باعث افزایش دقت برآورد SWRC می گردد. ولی آن دسته از متغیرهای ساختمانی، که شاخصی از توزیع اندازه منافذ هستند، برای برآورد SWRC مناسب تر بودند. تاثیر بیشتر FC، در بهبود برآورد SWRC نسبت به PWP، کارایی بیشتر رطوبت در مکش های میانی در برآورد SWRC را نشان داد. الگوریتم قوی روش درخت M5 برخی الگوهای روابط میان متغیرهای ورودی و خروجی که توسط روش رگرسیون غیرخطی قابل تشخیص نبود، را تشخیص داد. با توجه به وابستگی توزیع خطا بر روی مثلث بافت خاک، به روش ایجاد توابع شبه پیوسته و متغیرهای ورودی، باید نقشه های توزیع خطا را بر اساس فاکتورهای مذکور دسته بندی نمودکلید واژگان: رگرسیون غیرخطی، رطوبت ظرفیت زراعی، نقشه خطای تخمین، ماده آلی، هدایت هیدرولیکی اشباعBackground and ObjectivesRecently, pseudo-continuous transfer functions (PC-PTFs) have been introduced for estimating soil water retention curve (SWRC). The M5 tree method is similar to regression trees, where linear functions are located in its leaves, and it has a high capability in creating transfer functions. These functions are highly sensitive to the power of machine learning algorithms. However, so far, the powerful M5 tree method has not been used to develop PC-PTFs for a wide range of soil textures. Additionally, the effectiveness of some soil structural variables in improving PC-PTFs has not been investigated, so far. Furthermore, the dependency of the error distribution of PC-PTFs on soil textural triangles to various factors has not been deeply examined. Therefore, the objectives of this study were to develop PC-PTFs using the M5 method, investigate the effect of soil structural variables on the performance of these functions, and examine the error dependence of these functions on different factors.Materials and MethodsA total of 120 soil samples were collected from depths of 10 to 60 centimeters, with agricultural, orchard, and pastureland uses of Tehran and Hamedan provinces, and soil texture, bulk density (BD), SWRC, saturated hydraulic conductivity (Ks), organic matter (OM), mean weight diameter (MWD) of soil aggregates, and penetration resistance at 300 hectopascals (PR300) were measured. Thirteen PC-PTFs, in three groups of inputs, were developed to estimate SWRC, using M5 tree and non-linear regression methods. The error distribution of all PC-PTFs was plotted on the soil texture triangle, according to root mean square error (RMSE).ResultsIn the first function, soil suction was used as the only estimator. A non-linear regression model produced an acceptable model for the first function with a R2 of 0.718. In PC-PTFs 3 to 6, components of soil texture, BD, and FC (at 300 hPa matric suction) and PWP (at 15000 hPa matric suction) moisture contents were used to estimate SWRC. The R2for these functions ranged from 0.719 to 0.990, indicating an improvement in the performance of SWRC estimation. In the M5 method, the use of FC significantly improved the model performance and created an optimal model, resulting in RMSE of 0.015 and 0.020 cm³cm⁻³, and R² of 0.987 and 0.973 in the training and validation stages, respectively. In the M5 method, any function using Ks and MWD as estimators showed significant improvement compared to PC-PTF4, which used soil texture components and BD as estimators. The AIC values in both training and validation stages in the M5 method were 37% to 283% and 111% to 157% lower compared to non-linear regression, respectively. The error distribution on the soil texture triangle showed no dependence on soil texture but was related to the method of creating PC-PTFs and relevant input variables.ConclusionsA powerful artificial intelligence methods can be employed to create a comprehensive model for SWRC. This would eliminate the need for users to rely on various SWRC models such as van Genuchten for different soils. Incorporating a set of soil texture and structure variables increases the accuracy of SWRC estimation. However, among structural variables, those indicating pore size distribution were more suitable for SWRC estimation. The greater impact of FC compared to PWP demonstrated the higher efficiency of moisture in intermediate matric suctions for SWRC estimation. The robust algorithm of the M5 tree method identified some patterns of relationships between input and output variables that were not detectable by non-linear regression. Considering the dependence of error distribution on the soil texture triangle to the method of creating PC-PTFs and input variables, categorizing error distribution maps should be done based on the mentioned factors.Keywords: Estimation Error Map, Field Capacity Moisture Content, Non-Linear Regression, Organic Matter, Saturated Hydraulic Conductivity
-
با توجه به تغییر اقلیم و خشک سالی های اخیر، مدیریت صحیح سامانه های آبیاری و منابع آب، بسیار با اهمیت است. از طرفی رسیدن به میزان محصول بهینه با توجه به کمبود آب، مستلزم برآورد درست میزان آب مورد نیاز گیاه است به طوری که مانع از هدر رفت آب و یا ایجاد تنش آبی در گیاه شود.در این پژوهش، میزان تبخیر-تعرق گیاه مرجع طی سه سال زراعی با استفاده از لایسیمتر اندازه گیری شد. سپس با نرم افزار Ref-ET، میزان تبخیر-تعرق مرجع با 16 معادله تجربی با استفاده از داده های هواشناسی، برآورد شد. معنی دار بودن اختلاف مقادیر اندازه گیری و برآورد شده با استفاده از نرم افزار SPSSسنجیده شد که معادله های تجربی هارگریوز و پریستلی تیلور و پنمن (فایو) به عنوان مناسب ترین روش ها برای منطقه رشت انتخاب شدند. سپس، برای داده های به دست آمده از دو سال زراعی و با اعمال رگرسیون غیرخطیدر نرم افزار SPSS، ضرایب بهینه برای دو معادله ی هارگریوز و پریستلی تیلور برآورد شد و با استفاده از داده های به دست آمده در سال سوم واسنجی صورت گرفت. مقادیر RMSEو nRMSEبرای ارزیابی محاسبه شد که به ترتیب برای معادله هارگریوز بهینه شده 20/0 میلی متر بر روز و 60/4 درصد و برای معادله پریستلیتیلور بهینه شده به ترتیب 22/0 میلی متر بر روز و 5/4 درصد به دست آمد.
کلید واژگان: بهینه سازی، پریستلی تیلور، رشت، رگرسیون غیرخطی، هارگریوزRegardingthe climate change and recent droughts, the proper management of irrigation systems and water resources is very important. However, achieving the optimum crop yields due to lack of water requires, the accuracy estimating the amount of water by the plants to prevent water loss and or water stress in plants is needed. In this study, the reference evapotranspiration using lysimeter was measured during three cropping seasons. Applying Ref-ET software, the reference evapotranspiration with 16 empirical equations using meteorological data were estimated, the significant difference between measured and estimated was determined using SPSS software. The empirical equations Hargreaves, Priestley-Taylor and Penman (FAO) were determined as the most suitable methods for the studied area. For the obtained data from two growing seasons and by applying nonlinear regression in SPSS software, optimized coefficients for the two Priestley-Taylor and Hargreaves equations were estimated, and then by using obtained data in the third year, thevalidation was done and RMSE as well as nRMSE values were calculated to assess the equations that for optimized Hargreaves were 0.20 mm/day and 4.60% and for optimized Priestley-Taylor equation were 0.22 mm/day and 4.5%, respectively.
Keywords: Hargreaves, Non-linear regression, Optimization, Priestly-Taylor, Rasht -
با وجود مطالعات متنوع در زمینه پیش بینی ضریب انتشار طولی (LDC) در رودخانه های طبیعی، نبود مطالعه ای جامع برای بررسی اثر الگوهای متنوع از پارامترهای هیدرولیکی و هندسی بر این پدیده احساس می شود. همچنین دقت نا مناسب مدل های ارائه شده برای پیش بینی LDC یا کاربرپسند نبودن برخی آنها از دیگر چالش های موجود در این زمینه است. بنابراین هدف اصلی این پژوهش، بررسی الگوهای متنوع پیش بینی LDC با استفاده از تحلیل رگرسیونی است. برای این منظور مراحل واسنجی و صحت سنجی مدل های تخمین LDC با استفاده از الگوهای متنوعی از اطلاعات هیدرولیکی و هندسی چندین رودخانه در آمریکا انجام پذیرفت. نتایج این پژوهش مشخص کرد که از بین الگوهای متنوع ورودی، الگوی شامل پارامتر انحنای رودخانه دارای بهترین عملکرد برای مدل پیش بینی LDC می باشد؛ هرچند که دبی تاثیری بر عملکرد مدل نداشت. همچنین با حذف عدد ثابت از معادله به دست آمده، عملکرد مدل بهبود یافت. مدل مذکور در مراحل واسنجی و صحت سنجی از ضریب تعیین (R2) به ترتیب معادل 993 /0 و 938 /0 برخوردار بود. در نهایت بر مبنای مقایسه بین مدل توسعه داده شده در این پژوهش و دیگر مطالعات، مشخص شد که این مدل دارای عملکرد بهتری نسبت به دیگر مدل ها برای تخمین LDC است.کلید واژگان: رگرسیون غیرخطی، رودخانه، انتشار آلودگی، ضریب انتشار طولیInvestigating the process of pollutant dispersion in natural rivers is important in pollution control and its distribution and management of aquatic environments. The process of pollution distribution is a function of dispersion coefficient that has been used in Advection-Diffusion equation. Since the one-dimensional models are applied for river water quality modeling, the first step in modeling the quality of river water is determining the Longitudinal Dispersion Coefficient (LDC). Many methods such as empirical, analytical, statistical, field measurements, and more sophisticated approaches, i.e., artificial intelligence techniques have been suggested for LDC estimation. By now, Laboratory methods are associated with many limitations. These methods are along with high costs and detrimental effects on the aquatic environment due to the application of some specific and harmful tracers. Artificial Intelligence Models have had a good prediction for LDC in recent years, but uncertainty in these models, as an annoying factor, always limited their results for practical purposes. These techniques act exactly like a black box model. Also, although different studies have been carried out for LDC estimation in natural rivers, the absence of a comprehensive study to investigate the effects of different patterns of dimensionless hydraulic and geometric parameters on LDC is still felt. Another challenge is the inaccuracy and less user-friendliness of the provided models to predict LDC. Thus, the main objective of this study is to investigate different types of LDC prediction by application of regression analysis.
The data used in this study for estimation of LDC contains 61 datasets of hydraulic parameters such as velocity U (m/s), shear velocity u*(m/s) and flow rate (Q), and also the geometric specifications measuring in cross-section of rivers like water depth H(m), stream width (W) and curvature of the river σ. This dataset was taken from different sections of 31 rivers in the United States of America. This information was used as input parameters (about 70 percent, i.e 43 data for calibration and 30 percent, i.e. 18 data for testing) for the non-linear regression model.
Many of researchers have used equations based on establishing a relationship between LDC and hydraulic-geometric specifications of rivers. Some researchers have used other parameters such as Q and σ to improve LDC estimation. So, in this research, all combination of input parameters for application of non-linear equations have been investigated. Non-linear equations could be changed to linear equations by a logarithmic method. Thus, all of the unknown coefficients of equations could be known by a linear Least Squares Regression.
Calibration and test steps were carried out using various patterns of hydraulic and geometric data of the rivers in the United States of America. The obtained equations have been compared by the statistics of regression method such as coefficient of determination (R2), t-value, p-value and Variance Inflation Factor (VIF). Higher values of t-value led to the lower value of p-value that indicated the importance of parameter in equation. VIF shows the existence of multi-collinearity in equation. Results showed that the pattern including the river curvature parameter had the best performance for LDC prediction model, while discharge parameter had the least effects on the LDC prediction model. Also, if the constant number is eliminated from the equation, the models performance is increased. The R2 of calibration and test stages of the best tuned model were 0.993 and 0.938, respectively. Selected equations in this research (with the best performance) compared with the models suggested by other researchers based on Root Mean Square Error (RMSE), Mean Related Error (MRE), Developed Discrepancy Ratio (DDR), and Threshold Statistics (TS) indices. The comparison of the developed model with the past studies revealed that it had a better performance in LDC estimation. Although the model proposed by Zeng and Huai (2014) had the second best performance, its statistical indices (RMSE and MRE)were about 2 and 83 times greater than that those obtained for the developed model. The best model based on the DDR graphic statistic has the largest crest and lowest width. So the comparison of models based on DDR indicated that the developed model in this research had the best performance. Also, the graph of the TS showed that the model developed in this research had the lowest threshold of errors in 100 percent of datasets. Thus, this research provides an LDC estimator model that outperforms the other existence equations.Keywords: Non-linear regression, Longitudinal Dispersion Coefficient, River, Pollution Dispersion
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.