multivariable linear regression
در نشریات گروه آب و خاک-
سابقه و هدف
از جمله عوامل حایز اهمیت در مدیریت و برنامه ریزی منابع آب پیش بینی مقدار رواناب می باشد. با افزایش دقت در پیش بینی رواناب رودخانه مدیریت و برنامه ریزی کارآمدتری صورت می گیرد بنابراین بهبود مدلسازی پیش بینی رواناب امری ضروری است.اولین هدف از این مطالعه ارزیابی کارایی مدلهای رگرسیون چندمتغیره خطی، درخت تصمیم M5 و سری زمانی در پیشبینی رواناب رودخانه است. هدف دوم بررسی مقیاس زمانی مدلسازی (ماهانه و فصلی) و نیز تاثیر ورودی های مدل (یک متغیر با گام های تاخیر و چند متغیر با گامهای تاخیر) بر دقت مدلهای مورد مطالعه است.
مواد و روش هادر این پژوهش حوضه آبریز ناورود واقع در غرب استان گیلان جهت منطقه مطالعاتی انتخاب گردیده است. داده های مورد نیاز دو ایستگاه خرجگیل در سال های 1398-1368 و خلیان در سال های 1397-1375 شامل دبی، بارش و دما در مقیاس زمانی ماهانه از آب منطقه ای استان گیلان جمع آوری شده است. مقدار رواناب توسط داده های دریافت شده در بازه زمانی ماهانه و فصلی با استفاده سه مدل رگرسیون چند متغیره خطی، سری زمانی و درخت تصمیم M5 در دو رویکرد متفاوت پیش بینی شده است. رویکرد اول متغیرهای ورودی به مدل شامل دبی، بارش و دما با 3 گام تاخیر زمانی و در رویکرد دوم تنها متغیر دبی با 3 گام تاخیر زمانی بوده است. شاخص های ارزیابی در این پژوهش شامل میانگین انحراف خطا (MBE)، ضریب کارایی نش (NSE) و ضریب تعیین (R^2) می باشد.یافته ها
یافته هادر رویکرد اول و در پنجره زمانی ماهانه مدل درخت تصمیم M5 با شاخص MBE، NSE 04/0-، 80/0 (آموزش) و 01/0، 72/0 (آزمون) در ایستگاه خرجگیل و 01/0-، 79/0 (آموزش) و 00/0، 82/0 (آزمون) در ایستگاه خلیان بعنوان مدل منتخب انتخاب می گردد. در گام زمانی فصلی نیز مقادیر شاخص ها برای مدل درخت تصمیم M5 در ایستگاه خرجگیل برابر . برابر 02/0، 78/0 (آموزش) 02/0-، 86/0 (آزمون) و در ایستگاه خلیان نیز 01/0-، 79/0 (آموزش) و 00/0، 86/0 (آزمون) می باشد و این مدل در گام زمانی فصلی در رویکرد اول نیز بهترین مدل مورد مطالعه بوده است. رویکرد دوم در هر دو گام زمانی ماهانه و فصلی منجر به یافته های متفاوتی شده است. در رویکرد دوم در گام زمانی ماهانه مقادیر شاخصها برای مدل سری زمانی در دو مرحله آموزش و آزمون در ایستگاه خرجگیل بهترتیب برابر 05/0- ، 47/0 و 10/0، 52/0 و در ایستگاه خلیان برابر با 02/0-، 63/0 و 02/0، 49/0 بوده است. در گام زمانی فصلی نیز مقادیر شاخص های مدل منتخب در دو مرحله آموزش و آزمون در ایستگاه خرجگیل 42/0-، 58/0 و 06/0، 83/0 و خلیان 09/0، 40/0 و 10/0-، 62/0 می باشد. در گام زمانی فصلی نیز مدل سری زمانی مدل منتخب در رویکرد دوم می باشد
نتیجه گیرینتایج حاصل از این پژوهش حاکی از آن است که در رویکرد اول در هر دو ایستگاه و در هر دو گام زمانی مدل درخت تصمیم M5 دقت بالاتری در پیش بینی نسبت به دو مدل دیگر از خود نشان داده است در حالیکه در رویکرد دوم مدل درخت تصمیم نتایج با دقت بالا از خود نشان نمی دهد و در مقابل مدل سری زمانی دقت بالاتری نسبت به دو مدل دیگر در هر دو ایستگاه و هر دو گام زمانی داشته است. یافته های این مطالعه بر این موضوع تاکید دارد که رویکرد مورد استفاده در انتخاب ورودی های مدل می تواند به شکل کامل موثری دقت مدلسازی و مدل منتخب را تحت تاثیر قرار دهد.
کلید واژگان: رواناب، پیش بینی، سری زمانی، رگرسیون چند متغیره خطی، درخت تصمیم گیری M5Background and ObjectivesOne of the essential factors in the programming and management of water resources is predicting the amount of runoff. Increasing the accuracy in predicting runoff will increase the efficiency of programming and management; therefore, improving the modeling of discharge prediction is a requisite issue. The first aim of this study is to evaluate the efficiency of the multivariable linear regression, M5 decision tree, and time series in predicting the river runoff. The second aim is to analyze the modeling time step (monthly or seasonal) and the effects of model inputs (one delay steps variable against several delay steps variable) on the accuracy of the studied models.
Material and MethodsNavrood watershed located in the west part of Gilan province is chosen for the study area in this research. Required data is collected from Kharjgil (1368-1398) and Kholian (1375-1397), including monthly river flow, rainfall, and temperature from Gilan regional water company. The amount of runoff is predicted in two approaches by the received data in monthly and seasonal time steps sing three models of multivariable linear regression, time series, and M5 decision tree. In the first approach, input variables to the model were river flow, rainfall, and temperature with three steps delay. In the second approach, the only variable was river flow with three steps delay. The model evaluation criteria in this research are the mean bias error (MBE), Nash-Sutcliffe efficiency (NSE), and coefficient of determination (R^2).
ResultsIn the first approach and in monthly timestep, M5 decision tree is selected model with MBE-NSE equal to -0.04,0.80 (train) and 0.01,0.72 (test) in Kharjgil station, and -0.01,0.79 (train) and 0.00,0.86 (test) in Kholian station. In the seasonal time step, the criteria for the M5 decision tree in Kholian station are equal to 0.02,0.78 (train), -0.02,0.86 (test), and in Kholian station are -0.01,0.79 (train), 0.00,0.86 (test). This model was the best in this study for the first approach in the seasonal time step. The second approach has led to different findings considering both monthly and seasonal time steps. In the second approach, the criteria in monthly time step for time series model during train and test in Kharjgil station are respectively -0.05,0.47 and 0.10,0.52 and in Kholian are -0.02,0.63 and 0.2,0.49. The selected model criteria for seasonal time step considering train and test are -0.42,0.58 and 0.06,0.83 in Kharjgil station, and 0.09,0.40 and -0.10,0.62 in Kholian station. The time series model is selected in the second approach in the seasonal time step.
ConclusionThe findings of this research have shown that in both stations and time steps, the M5 decision tree model has shown a higher accuracy in prediction than the two other models in the first approach. Meanwhile, the decision tree model does not show accurate results in the second approach. Alternatively, compared to two other models in both stations and both time steps, the time series model had a higher accuracy. Findings of this research have emphatically shown that specific approaches in choosing the model's inputs can effectively influence the selected model and the accuracy of modeling.
Keywords: Runoff, Time series, Multivariable linear regression, Decision tree M5
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.