quantile regression
در نشریات گروه آب و خاک-
سابقه و هدف
گرمایش جهانی موجب تغییر در فراسنج های دما و به تبع آن افزایش وقوع رویدادهای فرین از جمله سیل و خشکسالی می-شود که در اغلب موارد، از آب و هوای شدید حاصل می شوند؛ لذا مطالعه و بررسی تغییرات آینده مقادیر حدی پارامترهای هواشناسی و هیدرولوژیکی از جمله دما، بیشتر از مقدار میانگین یا میانه، حائز اهمیت می باشد. بنابراین، هدف از این پژوهش، بررسی اثرات تغییر اقلیم بر روند تغییرات فصلی دماهای حدی (مقادیر بسیار بالا و بسیار پایین) در ایستگاه های ساحلی استان مازندران بر مبنای مدل های CMIP6 و روش رگرسیون چندک می باشد.
مواد و روش هادر این پژوهش، به منظور بررسی روند مقادیر حدی دما در استان مازندران برای دوره ی آینده از برونداد سری ششم مدل-های تغییر اقلیم (Coupled Model Intercomparison Project phase 6, CMIP6) استفاده گردید. برای این منظور از دو دسته داده شامل کمینه و بیشینه دمای 4 ایستگاه سینوپتیک اصلی استان شامل بابلسر، قراخیل، رامسر و نوشهر و نیز برونداد مدل NorESM2-MM از مدل های CMIP6 در دو دوره ی آینده ی نزدیک (2055-2026) و آینده ی دور (2100-2071) و برای سه سناریو خوش بینانه (SSP126)، حد متوسط (SSP245) و بدبینانه (SSP585) استفاده گردید. به منظور مقیاس کاهی داده های مدل در ایستگاه های هواشناسی مورد مطالعه، از روش های مختلف موجود در نرم افزار مقیاس کاهی CMhyd استفاده گردید و خروجی داده های دما برای روشی که از دقت بالاتری برخوردار بود، برای بررسی روند انتخاب گردید. در گام بعد، برای بررسی روند فصلی مقادیر حدی دما از روش رگرسیون چندک استفاده گردید و نتایج مورد تحلیل و بررسی قرار گرفت.
یافته هانتایج مقیاس کاهی با استفاده از روش های مختلف نشان داده است که روش Variance Scaling بهترین عملکرد را در بین روش-های موجود در CMhyd دارد. به طورکلی نتایج بیانگر بی هنجاری مثبت دما افزایش دمای سالانه نسبت به دوره ی پایه در سناریوهای SSP126=1.3، SSP245=2.56 و SSP585=3.2 درجه سلسیوس در استان مازندران در تمام ماه های سال تا پایان قرن بیست و یکم است. شدت بی هنجاری در ماه های گرم بیشتر از ماه های سرد است .تحت سناریو خوش بینانه، مقادیر حدی متغیرهای دما در فصل های بهار و پاییز در آینده ی دور، حداکثر تا 1 درجه در هر دهه کاهش خواهد یافت. با این حال، میانگین کمینه دما در همه سناریوها (از جمله سناریو خوش بینانه) افزایشی است و کاهش صرفا برای مقادیر حدی پیش نگری شده است. اما تحت سناریوهای حد متوسط و بدبینانه، افزایش مقادیر حدی دما در تمامی فصل ها وجود خواهد داشت که شدت آن برای سناریو بدبینانه و در فصل بهار (15/0 درجه سانتیگراد در سال) بیشتر خواهد بود.
نتیجه گیریبا توجه به نتایج می توان بیان کرد افزایش قابل ملاحظه دماهای حدی در شبانه روز خصوصا در ماه های گرم سال، باعث افزایش تبخیر و تعرق خواهد شد و در کنار کاهش بارندگی در ماه های گرم، باعث کاهش منابع آب در بخش های مختلف استان مازندران و فشار به آب های زیرزمینی می شود. بنابراین، تدوین و اجرای برنامه های مدیریتی مناسب در جهت نیاز هر منطقه، به منظور سازگاری با دماهای حدی و عواقب سوء آن، اهمیت بسیار دارد.
کلید واژگان: دما، مدل های CMIP6، سناریوهای SSP، روند، رگرسیون چندکBackground and objectivesGlobal warming cause changes in temperature variables and consequently increase in the occurrence of extreme events like as floods and droughts, result from extreme weather in most cases; Therefore, it is important to study and investigate the future changes of extreme values of meteorological and hydrological parameters, including temperature, more than the average or median value. Therefore, the purpose of this research is to investigate the effects of climate change on the trend of seasonal changes in extreme temperatures (very high and very low values) in coastal stations of Mazandaran province based on CMIP6 models and quantile regression method.
Materials and methodsIn this research, in order to investigate the trend of extreme values of temperature in Mazandaran province for the future periods, the output of the sixth generation of climate change models (Coupled Model Intercomparison Project phase 6, CMIP6) was used. For this purpose, minimum and maximum temperature of 4 main synoptic stations of the province, including Babolsar, Qarakhil, Ramsar and Nowshahr, and also the output of the NorESM2-MM climate model from the CMIP6 in near future (2026-2055) and far future (2071-2100) at three optimistic (SSP126), moderate (SSP245) and pessimistic (SSP585) scenarios was used. In order to downscaling climate model data at the studied meteorological stations, various methods in the CMhyd downscaling software were used, and the Temperature data output for the method that had higher accuracy, was selected to analysis of trend. In the next step, the quantile regression method was used to investigate the seasonal trend of temperature extreme values and the results were analyzed.
ResultsThe results of downscaling using different methods have shown that the Variance Scaling method has the best performance among the available methods in CMhyd. In general, the results show a positive temperature anomaly (annual temperature increase compared to the base period in SSP126=1.3, SSP245=2.56, SSP585=3.2 oC) in Mazandaran province in all months of the year until the end of the 21st century. The intensity of the anomalies is higher in the warm months than in the cold ones. Under the optimistic scenario, the extreme values of the temperature variables in the spring and autumn seasons will decrease by a maximum of 1 degree per decade in the distant future. However, the average minimum temperature is increasing in all scenarios (including the optimistic scenario) and the decrease is only predicted for extreme values. But under the average and pessimistic scenarios, there will be an increase in the temperature extreme values in all seasons, so that its intensity will be greater for the pessimistic scenario and in the spring season (0.15 oC per year).
ConclusionAccording to the results, it concluded that the significant increase in extreme temperature during the day and night, especially in the warm months of the year, will increase evapotranspiration, and along with the decrease in rainfall in the hot months, it will cause a decrease in water resources in different parts of Mazandaran province and pressure on the groundwater. Therefore, it is very important to formulate and implement appropriate management programs according to the needs of each region, in order to adapt to extreme temperatures and their adverse consequences.
Keywords: Temperature, CMIP6 models, SSP scenarios, Trend, Quantile Regression -
زمینه و هدف
تغییرات اقلیمی ناشی از پیشرفت و صنعتی شدن جوامع بشری موجب تغییر در شدت و فراوانی بارش های شدید و سیل آسا شده است که خسارت های غیرقابل جبرانی را به همراه داشته است. به منظور کاهش این خسارت ها لازم است تغییرات مقادیر حدی بارش و عوامل موثر بر آن در هر منطقه شناسایی شود. روش های رگرسیون چندک قادر هستند روندها را نه تنها در میانه، بلکه در دامنه های مختلف سری داده ها بررسی کنند. بنابراین هدف از این پژوهش، بررسی روند فصلی مقادیر مختلف از بارش و نیز بررسی رابطه ی پارامترهای اقلیمی کمینه دما، بیشینه دما، کمینه رطوبت نسبی، بیشینه رطوبت نسبی و بیشینه سرعت باد بر روی مقادیر مختلف بارش در اقلیم های مختلف ایران می باشد.
روش پژوهش:
در گام اول، سری زمانی روزانه داده های اقلیمی شامل بارش، کمینه و بیشینه دما، کمینه و بیشینه رطوبت نسبی و بیشینه سرعت باد برای یک دوره ی 45 ساله در فصل های مختلف برای 5 ایستگاه سینوپتیک بابلسر، شیراز، بندرعباس، خرم آباد و تربت حیدریه تشکیل شد. در انتخاب ایستگاه های مطالعاتی سعی شد از ایستگاه های با اقلیم های متفاوت و با طول دوره ی آماری مناسب انتخاب گردد. سپس به بررسی روند تغییرات فصلی مقادیر مختلف بارش در چندک های مختلف (چندک های 01/0، 05/0، 1/0، 25/0، 5/0، 75/0، 9/0، 95/0 و 99/0) با استفاده از روش رگرسیون چندک در تمامی ایستگاه های مطالعاتی پرداخته شد. در گام بعدی، رابطه ی پارامترهای اقلیمی بر روی مقادیر مختلف بارش (مقادیر بارش کم تا بسیار بالا) در فصل های مختلف برای هر یک از ایستگاه ها، با استفاده از روش رگرسیون چندکی بررسی شد. سپس نتایج مورد تجزیه و تحلیل قرار گرفت.
یافته هانتایج بررسی روند تغییرات بارش روزانه نشان داد که مقادیر بالای بارش در فصل بهار، در ایستگاه های بندر عباس، شیراز و تربت حیدریه به صورت معنی دار کاهش یافته اما مقادیر بسیار بالای بارش (چندک های 95/0 و 99/0) در ایستگاه های بابلسر و خرم آباد افزایش یافته است. همچنین، مقادیر بارش های بسیار بالای روزانه در تابستان، در ایستگاه بندرعباس کاهش اما در ایستگاه های تربت حیدریه و خرم آباد به طور قابل توجهی افزایش یافته است. در حالی که در فصل زمستان، مقادیر مختلف بارش در تمامی فصل ها دارای روند کاهشی بوده و تنها یک شیب مثبت معنی دار در مقادیر بارش های بسیار بالا (چندک 99/0) در ایستگاه بابلسر وجود داشت. در بررسی پارامترهای موثر بر بارش های حدی نتایج نشان داد که مقدار تاثیر بر روی وقوع بارش های شدید به نسبت بیشتر از بارش های کم تا میانه بوده است. پارامترهای کمینه دما، کمینه رطوبت، بیشینه رطوبت و بیشینه سرعت باد تاثیر مثبت و پارامتر بیشینه دما تاثیر منفی را بر روی بارش های شدید در فصل ها و ایستگاه های مختلف داشته است. بیشترین ضرایب تاثیر مثبت در فصل بهار برای سرعت باد در بابلسر (8/1)، در فصل تابستان برای سرعت باد در بابلسر (8/3)، کمینه و بیشینه دما در بندرعباس (03/4- و 53/1)، برای فصل پاییز برای بیشینه رطوبت و سرعت باد در بابلسر (57/2 و 99/2) و سرعت باد در خرم آباد (54/1) و برای فصل زمستان، برای سرعت باد در بابلسر و بندرعباس (94/1 و 6/2)، و کمینه دما در تربت حیدریه (96/0) بوده است. همچنین، بیشترین ضرایب تاثیر منفی بیشینه دما در فصل های پاییز و زمستان (88/0- و 72/0-) در بابلسر و نیز فصل پاییز (63/0-) در شیراز بوده است.
نتایجتغییرات معنی دار افزایشی و کاهشی بارش بیشتر مربوط به مقادیر بارش های شدید بوده که در فصل ها و اقلیم های مختلف متفاوت می باشد. همچنین بارش های ایستگاه های نزدیک سواحل شمالی و جنوبی به مقدار بیشتری تحت تاثیر پارامترهای اقلیمی بوده اند. به طور کلی می توان بیان کرد که بارش های سیلابی تحت تاثیر پارامترهای اقلیمی سرعت باد، رطوبت و دما به ترتیب اهمیت بوده و این تاثیر بسته به موقعیت های مکانی و زمانی و تحث تاثیر عوامل مختلف، متفاوت است. بنابراین، اعمال برنامه ریزی دقیق برای استفاده ی درست از بارش دریافتی و مدیریت بهینه در منطقه مورد نظر با استفاده از نتایج چنین مطالعاتی ضرورت دارد.
کلید واژگان: بارش، پارامترهای اقلیمی، رگرسیون چندک، روند، مقادیر حدیBackground and AimClimate changes caused by the progress and industrialization of human societies have caused changes in the intensity and frequency of heavy precipitation and floods, which have caused irreparable damages. In order to reduce these damages, it is necessary to identify the changes in the threshold values of precipitation and factors affecting it each region. Quantile regression methods are able to examine the trends not only in the median, but also in different ranges of the data series. Therefore, the purpose of this research is to investigate the seasonal trend of different amounts of precipitation and also to investigate the relationship between the climatic parameters of minimum temperature, maximum temperature, minimum relative humidity, maximum relative humidity and wind speed on different amounts of precipitation in different climates of Iran.
MethodIn the first step, the daily time series of climate data including precipitation, minimum and maximum temperature, minimum and maximum relative humidity and wind speed for a period of 45 years in different seasons for 5 synoptic stations of Babolsar, Shiraz, Bandar Abbas, Khorram Abad and Torbat Heydarieh were formed. In the selection of study stations, we tried to select stations with different climates and with appropriate statistical period. Then, to investigate the trend of seasonal changes of different amounts of precipitation in different quantiles (quantiles 0.01, 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95 and 0.99) was analyzed using the quantile regression method in all study stations. In the next step, the relationship between the climatic parameters on different amounts of precipitation (low to very high amounts of precipitation) in different seasons was investigated for each of the stations using the quantile regression method. Then the results were analyzed.
ResultsThe results of examining the changes trend of daily precipitation are showed that the high amounts of precipitation in the spring season in Bandar Abbas, Shiraz, and Torbat Heydarieh stations were reduced significantly, but very high amounts of precipitation (0.95 and 0.99 troughs) in the station Babolsar and Khorramabad have increased. Also, very high daily precipitation amounts in summer have decreased in Bandar Abbas station but increased in Torbat Heydarieh and Khorram Abad stations, significantly. While in the winter season, different amounts of precipitation in all seasons have a decreasing trend and there was only a significant positive slope in very high amounts of precipitation (slope of 0.99) in Babolsar station. In the investigation of the parameters affecting the extreme precipitation, the results showed that the amount of impact on the occurrence of heavy rainfall was relatively higher than low to median rainfall. The parameters of minimum temperature, minimum humidity, maximum humidity and wind speed have a positive effect and the maximum temperature parameter has a negative effect on heavy rainfall in different seasons and stations.The highest positive effect coefficients were in spring for wind speed in Babolsar (1.8), in summer for wind speed in Babolsar (3.8), minimum and maximum temperature in Bandar Abbas (-4.03 and 1.53), in Autumn season for maximum humidity and wind speed in Babolsar (2.57 and 2.99) and wind speed in Khorram Abad (1.54) and in winter, for wind speed in Babolsar and Bandar Abbas (1.94 and 6. 2), and minimum temperature in Torbat Heydarieh (0.96). Also, the highest negative effect coefficients of maximum temperature were in autumn and winter seasons (-0.88 and -0.72) in Babolsar and autumn season (-0.63) in Shiraz.
ConclusionThe significant changes in increasing and decreasing precipitation are mostly related to the amounts of heavy precipitation, which are different in different seasons and climates. Also, the precipitation of the stations near the north and south coasts have been influenced by climatic parameters to a greater extent. In general, it can be said that flood precipitations are influenced by climatic parameters such as wind speed, humidity and temperature in order of importance and this effect is different depending on the location and time and the influence of different factors. Therefore, it is necessary to apply accurate planning for the correct use of received rainfall and optimal management in the target area using the results of such studies.
Keywords: Climatic Parameters, Extreme Values, Precipitation, Quantile regression, Trend -
مقدمهمدیریت هوشمند منابع آب بهترین راهکار برای معضل کمبود آب در سرتاسر جهان است. پیش بینی میزان مصرف یک پیش نیاز اصلی برای اطلاع از میزان آب مورد نیاز در آینده است. انواع مختلفی از ویژگی ها، از سابقه مصرف تا پارامترهای هواشناسی را می توان برای پیش بینی آب مصرفی بکار گرفت. در این مقاله، به معرفی یک مدل پیش بینی برای میزان مصرف آب مشترکین شهری در شهر یزد خواهیم پرداخت.روشچارچوب پیش بینی پیشنهادی از رکوردهای سامانه قبوض مصرف در شهر یزد برای استخراج سوابق مصرف مشترکین بهره می گیرد. به علاوه، منابع اطلاعاتی دیگری مانند تقویم کاری، میزان آب تولیدی (ورودی به شبکه شهری)، پارامترهای هواشناسی، ارزش مالی املاک مشترکین، و میزان فشار جریان آب ورودی به ملک مشترکین در پیش بینی مورد استفاده قرار می گیرند. این چهارچوب تغییرات در الگوی رفتار مصرف مشترکین را تعقیب می کند و آنها را گروه بندی می نماید تا بتواند مواردی را که رفتار غیرمتعارف دارند از میان آنها حذف کند. گروه های پاک شده (بدون موارد با مصرف نامتعارف) با استفاده از یک روش تخمین مبتنی بر چندک با سه خط برش مورد تحلیل قرار گرفته و براساس آنها میزان مصرف مشترکین در ماه آتی محاسبه می شود.یافته هانتایج آزمایشات نشان می دهند که مدل پیشنهادی با خطای کمتر از 10% می تواند میزان مصرف آتی را پیش بینی کند. به علاوه، این روش قادر است مشترکین با الگوی مصرف نامتعارف را نیز شناسایی کند.نتیجه گیریاز میان روش های مورد بررسی، روش هایی توانسته اند با کمترین خطا میزان مصرف را پیش بینی کنند که به موارد غیرمتعارف مقاوم بوده اند. براساس بررسی های صورت گرفته این موارد ریشه در جابحایی ساکنین منازل دارند و بعد از جایگزینی یک مشترک کم مصرف/پرمصرف با یک مشترک پرمصرف/کم مصرف بروز می کنند. با الهام از این حقیقت و حذف اولین ماه های تغییر الگوی مصرف از دادگان و آموزش مدل یادگیری با باقیمانده موارد، می توان یک الگوریتم پیش بینی با دقت بالا داشت که در اکثر موارد خطای بسیار کمی داشته باشد.کلید واژگان: پیش بینی میزان مصرف، رگرسیون، جنگل تصادفی، ناهنجاری، رگرسیون چندکSmart water resource management is the best short-time solution for water resource shortage aroundthe world. Predicting water demand is the major prerequisite to be aware of the required water within ashort time. The proposed prediction framework uses the billing records of water consumers in Yazd cityto extract consumption history. In addition, external data resources such as business calendar data, urbanwater production, meteorological parameters, the financial value of buildings, and in-stream pressureare collected and employed in the prediction model. The proposed framework tracks the changes inconsumption behaviors of consumers, which are grouped according to their volume of water usage toremove consumers with anomalous consumption behaviors. The cleaned grouped records ofconsumption are utilized in the fitting of a quantile regressor with three breakpoints to forecast the waterdemand of the consumers for the next month. Results of the experiments showed that the proposedmodel’s prediction percentage error is less than 10%. Besides, the model is able to recognize consumerswith anomalous consumption behaviors.Keywords: Consumption Prediction, Regression, Random Forest, Anomaly, Quantile Regression
-
رویدادهای اقلیمی مانند سیل، طوفان و خشکسالی اغلب از آب و هوای حدی حاصل می شوند. بیشتر مطالعاتی که در زمینه ی تشخیص روند صورت گرفته است بر اساس تحلیل تغییرات در میانگین داده ها می باشند و اطلاعاتی در مورد نحوه ی تغییرات در محدوده های متفاوت از دامنه ی داده های مورد مطالعه در اختیار قرار نمی دهند؛ لذا برای بررسی روند تغییرات در محدوده های مختلف از سری زمانی داده های اقلیمی روش رگرسیون چندک پیشنهاد گردید. رگرسیون چندک این توانایی را دارد که روند تغییرات در چندک های مختلف از سری داده را بررسی کند؛ لذا در این پژوهش روند تغییرات در چندک های مختلف از سری زمانی داده های کمینه و بیشینه ی دما، بارش و حداکثر سرعت باد روزانه در ایستگاه سینوپتیک بابلسر برای دوره ی زمانی 62 ساله (1399-1338) به صورت فصلی و سالانه تحلیل گردید. نتایج نشان داد که کمینه و بیشینه ی دما و سرعت باد در تمام فصل های سال به صورت معنی دار افزایش یافته است. شدت این روند های افزایشی در چندک های پایینی حدی از کمینه دما و چندک های بالایی حدی از بیشینه ی دما در فصل زمستان بیشتر بوده است. اما داده های سرعت باد در چندک های بالایی خصوصا بالایی حدی با شدت بسیار بیش تری نسبت به چندک های پایینی خصوصا در فصل پاییز افزایش یافته اند. متغیر بارش نیز تغییرات محسوسی در دوره ی 62 ساله نداشته است. در مقیاس سالانه بیشترین افزایش برای کمینه و بیشینه ی دما در چندک های پایینی حدی به ترتیب 28/4 و 85/2 درجه ی سانتیگراد و برای سرعت باد در چندک های بالایی حدی به اندازه ی 24/8 متر بر ثانیه بوده است
کلید واژگان: تغییر اقلیم، روند، داده های اقلیمی، رگرسیون چندک، بابلسرClimatic events such as floods, storms and droughts are often caused by extreme weather. Therefore, it is important to study the trend of different ranges of climatic data rather than just average. Most trend detection studies are based on the analysis of changes in mean data and do not provide information on how changes occur in different ranges of the used data range. Therefore, to investigate the trend of changes in different ranges of the time series of climatic data, quantile regression method was proposed. The quantile regression has the ability to examine the changes trend in different quantiles of the data series. Therefore, in this study, we was analyzed the changes trend in the different quantiles of temperature minimum and maximum, precipitation and maximum daily wind speed data time series in Babolsar synoptic station for a period of 62 years (1959- 2020) seasonally and annually. The results showed that the minimum and maximum temperature and wind speed increased significantly in all seasons. The intensity of these increasing trend was higher in the extreme lower quantiles of the daily minimum temperature and extreme upper quantiles of daily maximum temperature in winter. But the wind speed data, in the upper quantiles especially extreme upper quantiles have increased to a much greater intensity than the lower quantiles, especially in autumn. The precipitation did not change significantly in the 62-year period. On an annual scale, the maximum increase for the minimum and maximum temperatures was in the extreme lower quantiles 4.28 and 2.85 degrees centigrade, respectively, and for the wind speed, it was in the extreme upper quantiles 8.24 meters per second.
Keywords: climate change, Trend, Climatic Data, quantile regression, Babolsar -
به منظور تصمیم گیری مناسب جهت اجرای اقدامات مدیریتی نیاز است تا علاوه بر خروجی مدل دامنه عدم قطعیت آن نیز برآورد گردد. در تحقیق حاضر کارایی روش های ناپارامتریک LEC (Local Errors and Clustering)، رگرسیون چندک و جنگل تصادفی در برآورد عدم قطعیت مدل یکپارچه HBV در حوضه چهل چای استان گلستان بررسی گردید. پس از بهینه سازی پارامترهای مدل HBV با استفاده از روش تکامل تصادفی جوامع، مدل برای دوره های واسنجی و صحت سنجی اجرا و مقادیر باقیمانده ها محاسبه گردید. نتایج نشان داد با در نظر گرفتن متغیرهای دبی برآوردی، دبی مشاهداتی، مقدار بارش و مقادیر باقیمانده ها در حوضه مورد مطالعه داده های ورودی در چهار خوشه فازی قرار می گیرند. نتایج برآورد عدم قطعیت نشان داد بزرگترین و کوچکترین مقدار دامنه عدم قطعیت به ترتیب توسط روش های LEC در حالتی که توسط ماشین بردار رگرسیون آموزش دیده باشد و روش جنگل تصادفی، بدست آمده است. با توجه به مقادیر شاخص های ارزیابی PICP (Prediction Interval Coverage Probability)، MPI (Mean Prediction Interval) و(Average Relative Interval Length) ARIL بهترین عملکرد مربوط به روش رگرسیون چندک و سپس روش LEC در حالتی که آموزش داده نشده است، بود. در مقایسه با روش های ناپارامتریک، روش(Generalized Liklihod Uncertainty Estimation) GLUE با توجه به مقادیر هر سه معیار ارزیابی عملکرد مناسبی نداشت.کلید واژگان: بارش رواناب، جنگل تصادفی، رگرسیون چندک، GLUEDespite modern scientific knowledge and computational power in hydrology, the key to properly addressing hydrologic uncertainty remains a critical and challenging one. Here, we applied lumped HBV hydrological model to describe the uncertainty in runoff prediction in Chehl-Chay watershed in Golestan province. We applied a new framework for uncertainty analysis that is rooted on ideas from predicting model residual uncertainty. The uncertainty calculated by local Errors and Clustering (EEC) is compared with estimates from two non parametric methods (quantile regression (QR) and random forest (RF)) and a parametric method (GLUE). Firstly, the model parameters were optimized by Shuffled Complex Evolution approach and model residuals of test data were computed. Fuzzy clustering in EEC is carried out by the fuzzy c-means method and employs four clusters, predictive discharges, observed discharges, rainfall values and residuals in study basin. The results of this case study show that the uncertainty estimates obtained by EES which is trained by SVM gives wider uncertainty band and RF gives narrower uncertainty band. The best overall uncertainty estimates according to the PICP, MPI and ARIL indices were obtained with QR and then EEC. In comparison with non-parametric, with respct to all indices nonparametric methods had better performance than GLUE method.Keywords: Rainfall -runoff, Random forest, quantile regression, GLUE
-
سابقه و هدفدر کنار محدودیت های اولیه آزمون های متداول بررسی روند بارش(رگرسیون خطی معمولی، من-کندال، سن و...)، این روش ها فقط به برآورد میانگین یا میانه شرطی می پردازند و کوانتایل های مختلف را در نظر نمی گیرند. بررسی روند تغییرات تابع توزیع احتمال تجربی (EPDF) و تابع توزیع تجمعی تجربی (ECDF) می تواند منجر به دستیابی به اطلاعات کامل تری در مقایسه با روش های متداول شود. در این مطالعه هدف کاربرد رگرسیون کوانتایل در برآورد تغییرات EPDF و ECDF بارش سالانه در پنج ایستگاه در شمال کشور و تحلیل ان ها می باشد.مواد و روش هابا استفاده از رگرسیون کوانتایل خطوط رگرسیون برای کوانتایلها (95/0-05/0 با گام 01/0) برآورد گردید. بر اساس شیب خطوط رگرسیون کوانتایل و نیز معنی داری آماری آن ها در سطح 05/0 نمودار شیب-کوانتایل رسم و بررسی شد. با در نظر گرفتن کوانتایل های منتخب 9/0، 7/0، 5/0، 3/0 و 1/0 نمودار روند بارش سالانه در سری های مختلف ارایه شد و نتایج تحلیل گردید. با کاربرد مفهوم رگرسیون کوانتایل نمودارهای EPDF و ECDF سال اول و سال آخر دوره آماری ثبت شده در هر سری برآورد شده و نمودار آن تعیین گردید و مقایسه بین آن ها گرفت.یافته هابا در نظر گرفتن سطح 05/0 معنی داری آماری، تعداد خطوط با شیب های مثبت در همه سری های از تعداد خطوط با شیب های منفی به مراتب بیشتر بوده است. بررسی نمودار خطوط رگرسیون کوانتایل نشان می دهد برای سری داده های مشهد خطوط روند برای کوانتایل های بالایی کاهشی و برای کوانتایل های پایینی افزایشی است در حالیکه برای سایر سری ها خطوط بالایی روند افزایشی و خطوط پایینی روند کاهشی را نشان می دهند. همچنین در سری داده های گرگان، بندر انزلی، تبریز و ارومیه بزرگی شیب خطوط روند در کوانتایل های پایینی از بزرگی شیب خطوط روند در کوانتایل های بالایی بیشتر است اما برای سری مشهد این الگو به شکل معکوس برقرار است. بررسی مقایسه ای نمودارهای ECDF در ابتدا و انتهای دوره بیانگر آنست که سری داده های تبریز، گرگان و ارومیه و تا حدی بندر انزلی ECDF ها دارای تفاوت مشهود در کران پایینی سطوح احتمال مورد بررسی هستند اما برای سری داده های مشهد این تفاوت محدود می باشد. بررسی الگوی تغییراتEPDF نشان می دهد برای هر پنج سری پارامتر مکان نسبتا ثابت است اما تغییرات پارامتر مقیاس موجب تیزتر شدنEPDF انتهای دوره سری داده مشهد و مسطح تر شدن سری های داده های گرگان، بندر انزلی، تبریز و ارومیه شده است. بعلاوه برای سری داده های مشهد و بندر انزلی بیش ترین تغییرات در انتهایEPDF و برای سری داده های گرگان، تبریز و ارومیه تغییرات در ابتدایEPDF مشاهده می شود.نتیجه گیریکاربرد رگرسیون کوانتایل می تواند بدون تاثیر از محدودیت های روش های متداول تحلیل روند منجر به دسترسی به طیف وسیع تری از نتایج کاربردی شود. بین علامت شیب خطوط رگرسیون در کوانتایل های بالایی و پایینی در هر پنج سری تفاوت کاملا مشخصی وجود دارد که نشان می دهد روش های متداول نمی توانند ابزاری مناسب برای بررسی روند رویدادهای حدی باشد. نتایج این تحقیق نشان می دهد که رگرسیون کوانتایل یک ابزار مفید جهت تحلیل تغییرات EPDF و ECDF داده ها در طول سری زمانی است و این تحلیل نتایج کاملا مفیدتری در مقایسه با روش های متداول بررسی روند ارایه می دهد.کلید واژگان: رگرسیون کوانتایل، تغییرات، بارش سالانه، تابع توزیع احتمال تجربی، تابع توزیع تجمعی تجربیBackground And ObjectivesIn addition to the limitations of conventional for investigation of rainfall trend tests (OLR, Mann-Kendall, Sen), these are only provided to estimate the conditional mean or median and do not consider different quantiles. Investigation of trend of changes of empirical probability distribution function (EPDF) and empirical cumulative distribution function (ECDF) can lead to more detailed information in comparison with conventional methods. The objectives of this study are application of quantile regression for estimation of changes in EPDF and ECDF of five annual rainfall series in northern Iran and interpreting their results.Materials And MethodsThe linear regression lines were estimated using quantile regression considering quantiles (0.05-0.95 with 0.01 steps). Then slope-quantiles curve were extracted based on slopes of quantile regression lines and considering 0.05 statistical significance level. The graphs of trends of different annual rainfall series were presented considering selected quantiles 0.9, 0.7, 0.5, 0.3 and 0.1 and the results were analyzed. The curves of EPDF and ECDF belonging to first and last years of data recorded periods estimated with concept of quantile regression and their curves were plotted and comparison between first and last year curves were done.ResultsThe numbers of lines with positive slopes were considerably more than negative slopes considering 0.05 statistical significance level. Investigation of quantile regression lines showed decreasing and increasing trend lines for upper and lower quantiles respectively for Mashhad series but increasing and decreasing trend lines for upper and lower quantiles of other series. In addition, the magnitude of slope lines for lower quantiles were more than those belonging to upper quantiles for Gorgan, Bandar-Anzali, Tabriz and Urmia series but there were inverse pattern for Mashhad series. Comparative assessment of ECDF curves belonging to first and last recoded years revealed apparent difference in lower level of probability for Tabriz, Gorgan, Urmia and (to some extent) Bandar-Anzali but a limited difference for Mashhad series. Assessment of changes pattern of EPDF showed relatively constant location parameters but changes in scale parameters that resulted in peakness for last year EPDF of Mashahad but flatness for Gorgan, Bandar-Anzali, Tabriz and Urmia series. In addition, most of the changes related to end part of EPDF for Mashhad and Bandar-Anzali series while related to beginning for Gorgan, Tabriz and Urmia series.ConclusionThequantile regression can be used without affecting the limitations of conventional methods for trend analysis to access a wider range of applied analysis. There were apparent differences between signs of quantile regression lines belonging to upper and lower levels in all of five investigated series that showed Conventional methods could not be a useful tool for trend assessment of extreme events. The results of this study showed quantile regression is a suitable method to analyses changes in EPDF and ECDF of time series and this type of analysis present more useful results with comparison to conventional trend analysis methods.Keywords: Quantile Regression, Changes, Annual Rainfall, Empirical Probability Distribution Function, Empirical Cumulative Distribution Function
-
سابقه و هدفارزیابی بار معلق رسوبی رودخانه ها بسیار مهم است. کیفیت آب رودخانه ها و محیط زیست تحت تاثیر بار رسوب می باشد. همچنین طراحی سازه های هیدرولیکی و سایر تاسیسات آبرسانی، مدیریت حوزه آبخیز و اجرای برنامه های حفاظت خاک و مشکلات عمده ی دیگر ناشی از آورد رسوب رودخانه ها به تخمین صحیح بار رسوب وابسته است. از آنجایی که برآورد مستقیم بار رسوبی بسیار دشوار و وقت گیر است، لذا این امر سبب شد محققان به برآورد غیرمستقیم بار رسوبی که به روش های گوناگون امکان پذیر است روی آورند. یکی از راه های آسان برآورد غیرمستقیم بار رسوبی، منحنی سنجه رسوب است. این روش تنها می تواند معرف یک مقدار رسوب در یک دبی معین باشد و به علت عوامل مختلفی در طبیعت ممکن است چندین مقدار بار رسوبی برای یک دبی مشخص وجود داشته باشد. بر این اساس در پژوهش حاضر از روش های رگرسیون چندک و جنگل تصادفی که بتوانند مقدار بار رسوب را برای یک مقدار دبی معین در احتمالات مختلف تخمین بزنند استفاده شد. با به کار گیری این دو روش می توان احتمال وقوع بار رسوب در رویدادهای استثایی و سیلاب های عظیم را تحلیل کرد.مواد و روش هادر این پژوهش از مدل های منحنی سنجه رسوب، رگرسیون چندک و جنگل تصادفی به منظور برآورد بار رسوب چهار ایستگاه جنگلده، نوده، ارازکوسه و قزاقلی واقع در رودخانه ی گرگانرود در استان گلستان استفاده گردید. به این منظور داده های دبی- رسوب متناظر چهار ایستگاه مورد مطالعه به دو بخش 75% برای آموزش و 25% برای آزمون تفکیک شدند. در روش منحنی سنجه، مقدار رسوب با استفاده از معادله ی توانی برازش داده شده بین دبی و رسوب متناظر، حاصل گردید. الگوریتم های رگرسیون چندک و جنگل تصادفی با استفاده از نرم افزار آماری R اجرا گردیدند. مقدار بهینه پارامترهای متغیر این دو روش با استفاده از آزمون و خطا تعیین شد. با اجرای مدل، مقدار رسوب مربوط به یک دبی در سطوح احتمال مختلف (1% تا 99%) محاسبه شد.یافته هابا به کارگیری این دو روش، بار رسوبی در چندک های 5/2، 50 و 5/97% تعیین و دامنه عدم قطعیت در هر ایستگاه مشخص شد. روش جنگل تصادفی در ایستگاه های جنگلده و نوده با مقدار RMSE به ترتیب برابر 96 و 210 تن بر روز و رگرسیون چندک در ایستگاه های ارازکوسه و قزاقلی با مقدار RMSE به ترتیب 6453 و 24886 تن بر روز به عنوان بهترین روش برآورد بار رسوبی انتخاب شدند. مقدار معیار ارزیابی RMSE رسوب برآورد شده توسط منحنی سنجه رسوب کلاسیک در ایستگاه های جنگلده، نوده، ارازکوسه و قزاقلی به ترتیب برابر 199، 288، 7505 و 25811 تن بر روز به دست آمد.نتیجه گیرینتایج نشان داد منحنی سنجه رسوب کلاسیک علاوه بر اینکه قادر به برآورد بار رسوبی در دامنه ی عدم قطعیت های مختلف برای یک مقدار دبی معین نیست، بار رسوبی را نیز با مقدار خطای بیشتری برآورد می کند. با استفاده از روش های رگرسیون چندک و جنگل تصادفی برای یک دبی معین مقدار رسوب در احتمالات مختلف قابل پیش بینی است و این امر کمک زیادی به برنامه ریزی صحیح و جامع برای ساخت سازه های آبی می کند و از این طریق، خطرات تخریب این تاسیسات را که ناشی از سیلاب های عظیم می باشد کاهش می دهد.کلید واژگان: منحنی سنجه رسوب، رگرسیون چندک، جنگل تصادفی، رودخانه ی گرگانرودBackground And ObjectivesAssessment of suspended sediment load is very important. Water quality and environmental is under impression of sediment load. As well as the design of hydraulic structures and other water supply facilities, watershed management, soil conservation programs and another major problem caused by sediment yield is dependent on the accurate estimation of sediment load. As a direct estimation of sediment load is very difficult and time consuming, so this led the researchers to estimate sediment load as indirect that it is possible to resort to various methods. One easy way to indirectly estimate the sediment load is sediment rating curve. It can only represent invariable amount of sediment in flow and due to various factors in nature may be there is several sediment load for a known flow rate. On the basis of this study quantile regression and random forest methods was used that can estimate sediment load for a given flow rate in the various probability. The use of these two methods can be analyzed sediment load in great flood and special events.Materials And MethodsIn this study, sediment rating curve models, quantile regression and random forest was used to estimate sediment load in four stations Gorganrood River Jangaldeh, Nodeh, Arazkoose and Ghazaghli in Golestan province. For this purpose, flow and sediment data was collected at four studied stations and separated into two parts, 75% for training and 25% for testing. The rating curve was obtained using fitted power equation between discharge and sediment load. Quantile regression and random forest algorithms were implemented using R statistical software. The optimal values of the variable parameters of the two methods were determined using trial and error method. By running the model, the amounts of sediment associated with specified flow were calculated in different probability level (1% to 99%).ResultsUsing these two methods, sediment load was estimated in quantiles 2.5, 50 and 97.5%, respectively and range of uncertainty was determined in each station. In Jangaldeh and Nodeh stations random forest were selected as best method with RMSE criterion 96 and 210 tons per day and quantile regression were selected as best method with RMSE criterion 6453 and 24886 tons per day in Arazkoose and Ghazaghli stations. Classic rating curve method estimate sediment load in Jangaldeh, Nodeh, Arazkoose and Ghazaghli stations with RMSE 199, 288, 7505 and 25811 tons per day respectively.ConclusionThe results showed that classic sediment rating curve not only unable to estimate the sediment load in the range of uncertainties in specified flow rate but also estimates sediment load with more error. Quantile regression and random forest methods can be estimate sediment load in various probabilities for a specified flow and this has contributed greatly to accurate and comprehensive planning for the construction of hydraulic structures and in this way, the dangers of the destruction of the facility reduction due to the great flood.Keywords: Sediment rating curve, Quantile Regression, random forest, Gorganrood River
-
The sediment rating curve is the most widely used method to estimate river suspended sediment load that shows the relation between conditional mean of suspended sediment load and river discharge using Ordinary Least Square (OLS) regression and is be applied to estimate suspended sediment load as a function of the river discharge. The OLS regression model is sensitive to outliers and when its assumptions including assumptions related to the residuals analysis are not satisfied, is not acceptable. Quantile regression is a statistical method that can be used to overcome these limitations in sediment rating curve analysis. In this study, quantile regression method was used to estimate sediment rating curve using data from Alang-Darreh hydrometry station in Golestan province (recorded period years 1987-2001) and the results were compared with the conventional OLS regression method. The results show that application of OLS regression in sediment rating curve analysis led to bias estimation while quantile regression without OLS regressions limiting assumptions can be appropriately show the effect of river discharge on different quantiles of suspended sediment load distributions especially in upper and lower tail. In addition, it was found that a the magnitude of impact of river discharge belonging to upper, lower and central quantiles of suspended sediment load respectively and with increase in river discharge, the suspended sediment load show more skewness to the right. Moreover, the quantile regression concept is presented as a very important tool to extract the probability density and cumulative distribution functions of suspended sediment load for specific value of river discharge.Keywords: Ordinary Least Square Regression, Sediment Rating Curve, Quantile Regression
-
سابقه و هدفبررسی روند تغییرات سیلاب حوضه ها در اغلب موارد تنها بر اساس تحلیل روند متغیر دبی اوج سیلاب با استفاده از آزمون های رایج پارامتری و ناپارامتری (رگرسیون خطی معمولی، من-کندال، سن و...) است. در کنار محدودیت های اولیه این روش ها معمولا به برآورد میانگین یا میانه شرطی می پردازند و کوانتایل های مختلف را در نظر نمی گیرند در حالیکه برآورد دامنه مناسبی از کوانتایل های شرطی منجر به درک بسیار مناسبی از الگوی تغییرات می شود. هدف این تحقیق کاربرد روش رگرسیون کوانتایل برای برآورد روند زمانی (کوانتایل های شرطی) متغیرهای دبی اوج، حجم و تداوم سیلاب می باشد که این تحلیل منجر به درک مناسب تری از تغییرات متغیرهای حداکثر سیلاب های سالانه می شود.مواد و روش هادر گام اول سری زمانی حداکثر سیلاب سالانه ایستگاه هیدرومتری تله زنگ در جنوب غربی ایران با طول دوره آماری 55 سال مدنظر قرار گرفت و سری زمانی دبی اوج، حجم و تداوم حداکثر سیلاب سالانه استخراج گردید. در گام بعدی با استفاده از رگرسیون خطی معمولی تحلیل روند سری های متغیرهای حداکثر سیلاب سالانه انجام شد و کارایی مدل رگرسیون خطی با استفاده از معیارهای دقت برازش، آزمون معنی داری و تحلیل باقیمانده ها مورد بررسی قرار گرفت. سپس با در نظر گرفتن بازه (95/0-05/0 با گام 01/0) خطوط رگرسیون کوانتایل برای تحلیل روند متغیرهای حداکثر سیلاب سالانه برآورد شد و معیارهای دقت برازش و معنی داری آماری برای این خطوط تعیین گردید. با در نظر گرفتن کوانتایل های منتخب 95/0، 85/0، 75/0، 65/0، 55/0، 45/0، 35/0، 25/0، 15/0 و 05/0 نمودار خطوط رگرسیون کوانتایل برای متغیرهای سیلاب ترسیم شد.یافته هانتایج رگرسیون خطی معمولی بیانگر روند مثبت برای متغیرهای سیلاب است اما تحلیل های تکمیلی نشان داد این روش نمی تواند ابزار مناسبی برای تحلیل روند متغیرهای سیلاب در این تحقیق باشد. کاربرد رگرسیون کوانتایل در مقایسه با رگرسیون خطی معمولی منجر به دسترسی به طیف وسیعی از شیب خطوط روند شده است. برای هر سه متغیر مورد بررسی 15% شیب خطوط رگرسیون کوانتایل بیشتر از شیب برآورد شده با روش رگرسیون خطی و در سایر موارد کمتر از ان بوده است. بررسی خطوط رگرسیون کوانتایل نشان می دهد خطوط رگرسیون کوانتایل برای متغیر حجم سیلاب در کوانتایل های کران بالایی و برای متغیرهای دبی اوج و تداوم سیلاب در کوانتایل های کران بالایی و بازه میانی از نظر آماری معنی دار بوده اند و در کران پایینی کوانتایلها تعداد معدودی از رابطه های خطی قابل پذیرش شده اند به طوریکه برای متغیرهای دبی اوج، حجم و تداوم سیلاب به ترتیب 59%، 31% و 73/0 موارد خطوط رگرسیون کوانتایل در سطح 05/0 از نظر آماری معنی دار بوده اند.دقت برازش خطوط رگرسیون کوانتایل در کران بالایی و بازه میانی کوانتایل ها بیشتر از کران پایینی می باشد.نتیجه گیریکاربرد رگرسیون کوانتایل می تواند بدون تاثیر از محدودیت های روش های متداول تحلیل روند متغیرهای سیلاب منجر به دسترسی به طیف وسیع تری از نتایج کاربردی تحلیل روند شود. همچنین تفاوت مشخصی بین شیب روند متغیرهای سیلاب برای کوانتایل های مختلف (بخصوص کوانتایل های کران بالا) در مقایسه با شیب برآورد شده توسط رگرسیون خطی معمولی وجود دارد بنابراین روش رگرسیون خطی معمولی نمی تواند ابزاری مناسب برای بررسی روند رویدادهای حدی باشد. نتایج نشان می دهد روند متغیرهای حدی سیلاب به مراتب بیشتر از روند برآورد شده با رگرسیون خطی معمولی می باشد و به عبارتی رگرسیون خطی در این تحقیق منجر به کم برآوردی شیب روند افزایشی متغیرهای سیلاب شده است. همچنین تحلیل چند متغیره روند سیلاب با استفاده از رگرسیون کوانتایل مشخص می کند به دلیل وجود روند قابل توجه در شرایط حدی برای هر سه متغیر سیلاب، تغییرات در پتانسیل خطر سیلاب به مراتب بیشتر از نتایج به دست آمده با استفاده از تحلیل تک متغیره می باشد.کلید واژگان: رگرسیون کوانتایل، رگرسیون خطی معمولی، روند، متغیرهای سیلابBackground And ObjectivesInvestigation of the basin floods in most cases is only based on flood peak trend analysis using conventional parametric or non-parametric (ordinary linear regression (OLR), Mann-Kendall, Sen) tests. In addition to the primary restrictions, these methods usually are provided to estimate the conditional mean or median and do not consider different quantiles while assessing the appropriate domain of conditional quantiles leads to a very good understanding of trend pattern. The objective of this study is using quantile regression (QR) to estimate the time trend (conditional quantiles) of flood variables including peak, volume and duration that result in better understanding of variables of annual maximum floods (AMF).Materials And MethodsIn the first step, AMF time series of Taleh-Zang hydrometry station located in southwestern Iran was considered and the time series of AMF peak flow, volume and duration were extracted.In the next step, trend analysis of AMF variables time series performed using OLR and their efficiency were investigated using fitting precision criteria, statistical significant test and residuals analysis. Then, QR lines were estimated for AMF variables trend analysis considering (0.05-0.95 with 0.01 steps) and their fitting precision criteria and statistical significant test were determined. Considering selected quantiles0.05, 0.15, 0.25, 0.35, 0.45, 0.55, 0.65, 0.75, 0.85 and 0.95 QR lines were plotted for AMF variables.ResultsThe OLR results indicated positive trends for AMF variables but complementary analysis showed that this method cannot be a suitable analysis for AMF variables trend analysis in this research. The QR application resulted in wide range of line slopes in comparison with OLR method. For all three variables 15% of estimated line slopes using QR were more than their estimation by OLR. Investigation of QR lines indicated statistical significant regression lines of AMF volume were related to upper bound quantiles while for AMF peak and duration were related to quantiles mid bound plus upper bound and there were a few acceptable QR lines for lower bound for all three variables so that for AMF peak, volume and duration 59%, 31% and 73% of QR lines were statistical significant considering 0.05 significance level. The fitting precisions of QR lines of upper and mid bounds were more than lower bound.ConclusionThe quantile regression can be used without affecting the limitations of conventional methods for AMF variables trend analysis to access a wider range of applied trend analysis. Also there are certain differences between AMF variables trend slopes (especially for upper bound quantiles) in comparison with those estimated with OLR therefore the OLR method could not be a useful tool for trend assessment of extreme events. The results show trend of extreme flood variables are significantly more than those estimated by OLR and in other words the OLR led to underestimation of AMF variables increasing trend slope. Moreover, multiple variables flood trend analysis using QR revealed that considering significant trends for three flood variables, the flood potential risk are significantly more than those estimated using single variable analysis.Keywords: Quantile Regression, Ordinary Linear Regression, Trend, Flood Variables
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.