stochastic dynamic programming
در نشریات گروه علوم انسانی-
مقدمه و اهداف
درنظرگرفتن خاصیت فسادپذیری و همچنین قابلیت جایگزینی، یکی از مهم ترین چالش های طراحی و بهینه سازی تصمیمات سیستم های مدیریت موجودی توسط فروشنده (VMI) است. این چالش زمانی بیشتر موردتوجه قرار می گیرد که در تقاضا محصول عدم قطعیت وجود داشته باشد. بر این اساس، هدف اصلی این پژوهش، ارائه رویکرد برنامه ریزی پویا تصادفی برای کنترل بهینه تصمیمات در این سیستم های VMI با عدم قطعیت پویا تقاضا است که توسط آن سطح سفارش دهی و موجودی محصولات فسادپذیر در شبکه دوسطحی شامل فروشنده و خریداران بهینه می شود.
روش هاپس از تعریف مسئله موردنظر این پژوهش در توسعه سیستم های VMI، با توجه به عدم قطعیت و خاصیت فسادپذیری، مسئله در یک چارچوب چنددوره ای مدل سازی شده و از رویکرد برنامه ریزی پویا تصادفی (SDP) برای فرمولاسیون آن استفاده می شود. در مدل پیشنهادی، تابع هدف، بیشینه کردن سود انتظاری است که در آن هزینه های مختلف ازجمله سفارش دهی و نگهداری به حساب می آید که هزینه نگهداری وابسته به عمر باقی مانده محصول است؛ به این معنا که هرچه محصول به پایان عمر خود نزدیک شود، هزینه نگهداری آن افزایش می یابد. مدل SDP پیشنهادی این پژوهش به شیوه بازگشتی اجرا می شود و از نرم افزار متلب برای پیاده سازی آن استفاده می شود. هر مرحله از مدل SDP به صورت یک مدل بهینه سازی ساده تر خطی است که با حل کننده CPLEX به صورت کارا حل می شود.
یافته هانتایج عددی نشان دهنده کارایی روش SDP برای حل این مسئله است و با استفاده از آن می توان با کنترل هزینه های مختلف در یک سیستم VMI و تصمیمات بهینه در مراحل مختلف تحت هر وضعیت، سود در پایان دوره های زمانی را بهبود داد. جایگزینی کالا در صورت مواجهه با کمبود موجب می شود که نخست در صورت کمبود در یک مرکز و ناتوانایی تامین کننده برای تامین آن، مرکز، موجودی مازاد خود را عرضه کند تا از کمبود جلوگیری شود. دوم، درصورتی که موجودی انبار یک مرکز توزیع به تاریخ انقضا نزدیک شود، از فساد آن جلوگیری می شود. به طورکلی این امکان موجب کاهش هزینه های کمبود و هزینه فسادپذیری می شود. نتایج مرتبط با طول عمر محصول نشان می دهد که در صورت لحاظ کردن طول عمر باقی مانده محصول در سیستم کنترل موجودی مبتنی بر سیستم VMI می توان از اطلاعات بین لایه توزیع و تامین برای کاهش قیمت، جابه جایی موجودی آن به یک مرکز دیگر و حتی تغییر سیاست کنترل موجودی استفاده کرد تا نه تنها از فسادپذیری محصول جلوگیری شود، بلکه از هزینه های کمبود و سفارش دهی مجدد نیز کاسته شود. برای مدل کردن این ویژگی، ابتدا یک طول عمر کامل برای هر محصول تازه تامین شده و سپس یک مجموعه دوره تعریف می شود. به ازای هر دوره برنامه ریزی، درصورتی که محصول به مشتری نهایی تحویل داده نشود (موجودی انبار باشد)، عمر باقی مانده آن یک دوره/ روز از عمر اولیه تعریف شده کسر می شود و به مرور از حالت تازه خارج و در دسته محصولات کهنه قرار می گیرد که مشمول کاهش قیمت می شود؛ همچنین درنتیجه مقایسه مدل پیشنهادی با لحاظ کردن قابلیت جایگزینی، نسبت به حالتی که کمبود در نظر گرفته نمی شود، ملاحظه می شود که بهبود 5/10 درصدی در سود ایجاد می شود.
نتیجه گیریدر مدیریت سیستم های VMI مدرن، در نظر گرفتن پویایی در رفتار تقاضا و عدم قطعیت مرتبط با آن بسیار حائز اهمیت است و می تواند بر سود بنگاه ها بسیار تاثیرگذار باشد. رویکرد SDP با در نظر گرفتن سناریوهای محتمل عدم قطعیت تقاضا، امکان ایجاد جایگزینی و نهایتا توجه به طول عمر محصول، تصمیمات بهینه در وضعیت های مختلف را فراهم می آورد و نه تنها ریسک تصمیم گیری را کاهش می دهد که موجب می شود سود نهایی نسبت به مدل های مقدار اسمی و مدل های کلاسیک در مبانی نظری بهبود قابل ملاحظه ای داشته باشد.
کلید واژگان: مدیریت موجودی با فروشنده (VMI)، عدم قطعیت تقاضا، محصولات فسادپذیر، زنجیره تامین دوسطحی، قابلیت جایگزینی، برنامه ریزی پویا تصادفیIntroductionConsidering the perishability and substitutability of products are among the most significant challenges in the design and optimization of decision-making in Vendor Managed Inventory (VMI) systems. This challenge becomes more pronounced when there is uncertainty in product demand. Therefore, the primary objective of this research is to present a stochastic dynamic programming approach for optimal control of decisions in VMI systems with dynamic demand uncertainty, optimizing the ordering levels and inventory of perishable products in a two-tier network including vendors and buyers.
MethodsAfter defining the problem of interest in developing VMI systems, considering demand uncertainty and product perishability, the problem is formulated in a multi-period modeling framework, and a stochastic dynamic programming (SDP) approach is used for its formulation. In the proposed SDP model, the objective function is to maximize expected profit by taking into account various costs such as ordering and holding, where the holding cost is dependent on the remaining product life; meaning that as the product approaches its expiration date, the holding cost increases. The proposed SDP model is executed in a recursive manner, and MATLAB software is used for its implementation. Each step of the SDP model is a simpler linear optimization model that is efficiently solved using the CPLEX solver.Results and discussion (Findings): Numerical results demonstrate the computational effectiveness of the SDP method in solving this problem. Using this approach, it is possible to control different costs in a VMI system and make optimal decisions at different stages under any state, thereby improving profit at the end of the time periods.Product substitution in the event of a shortage ensures that, firstly, in the case of a shortage at one center and the supplier's inability to replenish, the center offers its excess inventory to prevent the shortage. Secondly, if the inventory in a distribution center approaches its expiration date, spoilage is prevented. Therefore, the substitution capability generally leads to a reduction in shortage costs and spoilage costs.
Resultsrelated to product shelf life indicate that by considering the remaining shelf life of products in a VMI-based inventory control system, information between the distribution and supply layers can be used to reduce prices, transfer inventory to another center, and even change inventory control policies to not only prevent product spoilage but also reduce shortage and reordering costs. To model this feature, a full shelf life is initially defined for each newly supplied product, and then a set of periods is defined. For each planning period, if the product is not delivered to the end customer (remains in inventory), one period/day is deducted from the initially defined shelf life, and over time, it moves from a fresh state to the category of older products, which are subject to price reductions. Furthermore, comparing the proposed model with substitution capability in the case of a shortage to the case where a shortage is not considered, it is observed that there is a 10.5% improvement in profit.
ConclusionIn the management of modern VMI systems, considering the dynamism in demand behavior and the associated uncertainty is very important and can significantly affect the profitability of enterprises. This importance is doubled when the system in question is managed for the inventory control of perishable products. The SDP approach, by considering potential scenarios of demand uncertainty, enabling substitution, and ultimately paying attention to product shelf life, provides optimal decisions in different situations and not only reduces the risk of decision-making but also leads to a noticeable improvement in final profit compared to nominal quantity models and classical optimization models in the literature.
Keywords: Vendor-Managed Inventory, Uncertain Demand, Perishable Products, Two-Stage Supply Chain, Replacing Ability, Stochastic Dynamic Programming -
در این پژوهش با استفاده از رویکرد برنامه ریزی پویای تصادفی، مولفه های قراردادی برای دو قراردادIPC وPSC [1]معرفی و در ساختار مدل برای یک دوره بیست ساله با قیمت نفت تصادفی منظور گردید. همچنین مدل سازی بر اساس پارامترهای میدان نفتی فروزان دیگر نوآوری این کار است. نتایج در خصوص قرارداد IPC نشان می دهد که از بین مولفه های اقتصادی قرارداد شامل تغییر در نرخ دستمزد، دوره تقسیط و سقف بازپرداخت هزینه های پیمانکار؛ کاهش سقف بازپرداخت هزینه ها از 50 به30 درصد، منجر به افزایش در تولید انباشتی می شود. این موضوع به مفهوم تولید تا سرحد نزدیک شدن به پوشش هزینه ها در رژیم داشتن سقف بازپرداخت هزینه های پایین می باشد. به بیانی تغییر در سقف بازپرداخت هزینه را می توان مهم ترین عامل موثر در تولید انباشتی میدان دانست اما این عامل سود انباشتی را تا حدی می کاهد که می توان آن را به دلیل افزایش هزینه های تولید انباشتی دانست که منجر به سود انباشتی کم تر و به مفهوم ناهم سویی سود انباشتی و تولید انباشتی در این قرارداد است. با توجه به نتایج حاصله در مقاله، کاهش سقف بازپرداخت در قرارداد IPC موجب افزایش تولید انباشتی نشده است و بهترین حالت تقسیط به 5 قسط برای تولید انباشتی می باشد. در خصوص تاثیر مولفه های اقتصادی قرارداد PSC که شامل تغییر در نرخ بهره مالکانه، سهم دولت در نفت فایده و سقف بازپرداخت هزینه های پیمانکار می باشد، طبق نتایج اجرای مدل، کاهش سهم دولت در نفت فایده از 50 به 30 درصد منجر به افزایش تولید انباشتی گردید. با این حال بالا بردن سقف بازپرداخت هزینه برای این مدل قرارداد به 80 درصد باعث شد که تولید انباشتی به کمینه میزان در بین سناریوهای دیگر و در نتیجه آن کاهش سود انباشتی طی دوره منجر شود. یعنی افزایش سقف بازپرداخت هزینه به 80 درصد توجیه اقتصادی ندارد. همچنین افزایش نرخ بهره مالکانه به 20 درصد گرچه منجر به کاهش تولید نسبت به سناریوی مرجع می شود اما بیشینه سود انباشتی را نسبت به سایر سناریوها نصیب دولت خواهد کرد. همچنین افزایش سهم دولت در نفت فایده به 80 درصد و نیز کاهش سقف بازپرداخت هزینه از 50 به 30 درصد، کمینه اثر کاهشی را بر تولید انباشتی در قرارداد داشته است. در قرارداد PSA نیز نتایج نشان می دهد افزایش سهم دولت در نفت فایده و افزایش سقف بازپرداخت هزینه بیشترین اثر کاهشی در تولید انباشتی را دارد. ضمنا نکته مهم آن است که الزاما سودانباشتی و تولیدانباشتی در قراردادهای مختلف هم سو نیستند و به نوعی یک ناسازگاری بین منافع دولت و پیمانکاران ایجاد می شود. [1] از آن جا که قرارداد نفتی ایران (IPC) نسلی جدید از قراردادهای ارایه خدمات نفتی است و قرارداد مشارکت در تولید (PSC) نیز مدل قراردادی متداول و رایجی در جهان برای سرمایه گذاری، توسعه، تولید و بهره برداری میادین نفتی می باشد؛ لذا تمرکز این مقاله بر این دو مدل قراردادی می باشد.
کلید واژگان: IPC، PSC برنامه ریزی پویای تصادفی، نفت فایده(Profit Oil)، نفت هزینه(Cost Oil)Iran's new petroleum contract, dubbed as IPC, is a new generation of oil service contracts.The most significant flaw observed in various contracts is that cumulative profits and cumulative production do not necessarily follow the same direction, a kind of incompatibility arises between the interests of governments and contractors. In this research, using stochastic dynamic programming approach, the researcher introduces contractual components for IPC and PSC contracts and includes them in the model structure.The results of this study indicate that reducing the cost recovery ceiling in the IPC contract leads to the maximum reduction in cumulative production. In addition, increasing the government's share of profit oil as well as reducing the cost recovery ceiling, has had the greatest impact on cumulative production in the PSC contract. Innovation of this research is in the randomization of oil prices. Also modeling based on the parameters of Foroozan field is another innovation of this article.
Keywords: IPC (Iranian Petroleum Contract), PSC (Production Sharing Contract), stochastic dynamic programming, profit oil, cost oil -
تعیین حق بیمه منصفانه یکی از مسایل اساسی شرکت های بیمه است. اکثر مدل های تعیین حق بیمه، مبتنی بر تحلیل ریسک یا مبتنی بر رفتار بازار هستند. مدل های مبتنی بر تحلیل ریسک به مدل های قیمت گذاری پیشین و قیمت گذاری پسین تقسیم بندی می شوند که از اطلاعات فراوانی و شدت خسارت برای تحلیل ریسک استفاده می کنند. مدل های مبتنی بر رفتار بازار موجود نیز تنها برخی از متغیرهای موثر بر تابع تقاضا را برای تعیین حق بیمه در مدل خود گنجانده اند، حال آن که شرکت های بیمه با ریسک غیربیمه پذیر مثل ریسک های اقتصادی در بیمه بدنه اتومبیل مواجه هستند و حق بیمه یک شرکت بیمه به علت رقابتی بودن بازار بیمه به قیمت رقبا نیز وابسته است. بنابراین در تعیین حق بیمه بهینه لازم است متغیرهای کلان اقتصادی در تابع تقاضا لحاظ گردد. این پژوهش برای اولین بار حق بیمه بهینه را با گنجاندن ضریب نفوذ بیمه در تابع تقاضا محاسبه کرد. به منظور تحقق هدف، محقق یک شرکت خصوصی فعال در صنعت بیمه را به عنوان بستر تحقیق انتخاب نموده است. روش مورد استفاده مبتنی بر برنامه ریزی پویای تصادفی بوده است. معادله سرمایه شرکت بیمه براساس فرآیند مارکوف مشخص شد و تابع هدف مدل به شکل درجه دوم تعریف گردید. تابع تقاضا تابعی از پارامترهای کلان اقتصادی مانند کشش درآمدی تقاضا، نرخ تورم، ضریب نفوذ بیمه تعریف شد. سپس برای سطوح مختلف حق بیمه بازار حق بیمه بهینه محاسبه شد. نتایج حاصله حاکی از آن است که هر چه متوسط حق بیمه بازار بیشتر می شود، حق بیمه بهینه کمتر می شود.
کلید واژگان: اختلال تصادفی، برنامه ریزی پویای تصادفی، حق بیمه بهینه، متغیرهای کلان اقتصادی، متوسط حق بیمه بازارDetermining a fair premium is an essential issue for insurance companies. Many premium models are based on risk analysis and market behavior. Risk analysis is divided into Priori pricing and Posteriori pricing. These models use claim frequency and claim severity. Market behavior models include some variables affecting the demand function to determine premium. In contrast, insurance companies involve with uninsurable risks such as economic risks in collision insurance, and the insurance premium depends on the price of competitors, because there are competitive insurance environments. Therefore, it is essential to consider macroeconomic variables in the demand function. This study, for the first time, includes the insurance penetration in the demand function. To achieve the goal, the researcher has selected a private company active in the insurance industry for sampling. The method used was based on stochastic dynamic programming. The wealth equation of the insurance company is determined based on the Markov process, and the objective function of the model is a quadratic form. The Demand function is described as a function of macroeconomic parameters such as elasticity of demand, inflation rate, and insurance penetration. The optimal premium is calculated for different levels of market premium. The results show the average premium of the market becomes bigger, the optimal premium becomes lower.
Keywords: Stochastic disturbance, Stochastic dynamic programming, Optimal Premium, Macroeconomic variables, Average premium of the market -
هدف
انتخاب یک سبد سرمایه گذاری بهینه در طولانی مدت منطقی نیست و با گذشت زمان کارایی خود را از دست می دهد. هدف این مقاله ارائه روشی برای به روز کردن چندمرحله ای سبد سهام است. همچنین از آنجا که بعد این مسئله با گذشت دوره های زمانی، به صورت چشمگیری افزایش می یابد، حل مسئله به روش قطعی ممکن نیست، از این رو هدف دیگر، استفاده از روش تقریبی برای مقابله با این دغدغه است.
روشاز برنامه ریزی پویای تصادفی تقریبی چندمرحله ای برای تعیین سبد بهینه سهام و رفع مشکل ناکارایی آن با گذشت زمان استفاده شده است. از نرخ های بازده به عنوان متغیر تصادفی طی دوره ها، از روش مونت کارلو برای سناریوسازی و از معیار ریسک GlueVaR به عنوان معیار اندازه گیری ریسک استفاده شده است. با استفاده از روش تقریبی، امکان حذف برخی از جواب های بهینه افزایش می یابد، از این رو، از الگوریتم ژنتیک برای جست وجو در اطراف پاسخ بهینه بهره برده شد تا در صورت امکان، جواب بهتری به دست آید. مدل سازی این پژوهش توسط نرم افزار متلب و آزمون های آن به کمک نرم افزار SPSS صورت پذیرفته است.
یافته هادر این مقاله از اطلاعات 100 شرکت برتر موجود در بورس اوراق بهادار تهران، در سال های 1390 تا 1396 استفاده شد و بر اساس روش برنامه ریزی پویای تقریبی پیشنهادی، الگوریتم ژنتیک و روش سبد سهام با وزن های برابر، به مقایسه بازدهی و ریسک سرمایه گذاری در سبدهای مختلف پرداخته شده است.
نتیجه گیریآزمون های آماری مربوطه نشان دهنده عملکرد بهتر روش پیشنهادی در مقایسه با دو روش دیگر است.
کلید واژگان: بهینه سازی سبد سهام، برنامه ریزی پویای تصادفی، معیار ریسک GlueVaR، الگوریتم ژنتیک، سناریوسازیObjectiveThe selection of an optimal investment portfolio for a long-term period does not seem logical. So the investors should update their investment portfolios over specific time periods if needed. Since the problem dimensions significantly increase after the periods, a definitive solution to the problem is not achievable.
MethodsIn this regard, the Multistage Approximate Stochastic Dynamic Programming has been used to make the best portfolio over each period by using a stochastic return rate. The Monte Carlo was used for scenario development, and GlueVar was selected as a risk measurement criterion. The approximation technique was used to resolve for large dimensions; however, some optimized solutions may be eliminated so we used the Genetic Algorithm for the rapid search around the optimal solution to obtain a better one, if possible.
ResultsTop 100 companies listed in the Tehran Stock Exchange between 2011 and 2017 were investigated. This study investigated and compared the return and risk of investment portfolios based on the proposed method, Genetic Algorithm, and stock portfolio with equal weights. The modeling was done with MATLAB and tests were carried out with SPSS.
ConclusionThe results indicated a higher performance of the proposed method in comparison with the other mentioned methods.
Keywords: Portfolio optimization, Stochastic dynamic programming, GlueVaR risk measurement, Genetic Algorithm, Scenario constructiom
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.