یادگیری تقویتی چندعاملی مشارکتی در محیط های پویا بر اساس انتقال دانش برای مساله گله داری

نویسنده:

امین نیک انجام* ، منیره عبدوس ، ماهنوش مهدوی مقدم

پیام:

نوع مقاله:

مقاله پژوهشی/اصیل (دارای رتبه معتبر)

چکیده:

امروزه، برای حل بسیاری از مسایل، از سیستم های چندعاملی مشارکتی استفاده می شود که در آن گروهی از عامل ها برای رسیدن به یک هدف مشترک همکاری می کنند. همکاری میان عامل ها، فوایدی همچون کاهش هزینه های عملیاتی، مقیاس پذیری بالا و سازگاری قابل توجه را به ارمغان خواهد آورد. برای آموزش این عامل ها در رسیدن به یک سیاست بهینه، از یادگیری تقویتی بهره می جویند. یادگیری در محیط های چندعاملی مشارکتی پویا، غیرقطعی و با اندازه فضای حالت بزرگ به یک چالش بسیار مهم در برنامه های کاربردی تبدیل شده است. ازجمله این چالش ها می توان به تاثیر اندازه فضای حالت بر مدت زمان یادگیری و همچنین همکاری ناکارآمد میان عامل ها و عدم وجود هماهنگی مناسب در تصمیم گیری عامل ها اشاره کرد. همچنین هنگام استفاده از الگوریتم های یادگیری تقویتی نیز با چالش هایی نظیر دشواری تعیین هدف یادگیری مناسب و زمان طولانی همگرایی ناشی از یادگیری مبتنی بر آزمایش و خطا مواجه خواهیم بود. در این مقاله، با معرفی یک چارچوب ارتباطی برای سیستم های چندعاملی مشارکتی، تلاش شده چالش های فوق تا حدی برطرف شود. در راستای حل مشکلات مربوط به همگرایی، انتقال دانش به کار برده شده است که می تواند به شکل قابل توجهی در افزایش کارایی الگوریتم های یادگیری تقویتی موثر واقع شود. همکاری میان عامل ها با استفاده از عامل سرگروه و هماهنگی میان آنان توسط یک عامل هماهنگ کننده صورت می پذیرد. چارچوب پیشنهادی برای حل مساله گله داری به کار رفته است و نتایج تجربی افزایش کارایی عامل ها را نشان می دهند.

کلیدواژگان:

سیستم های چندعامله مشارکتی ، یادگیری تقویتی ، انتقال دانش ، مساله گله داری

زبان:

فارسی

انتشار در:

مجله کنترل، سال چهاردهم شماره 4 (زمستان 1399)

صفحات:

55 تا 66

لینک کوتاه:

magiran.com/p2269591

دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:

اشتراک شخصی

با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!

اشتراک سازمانی

به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!

اطلاعات بیشتر

توجه!

حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.

In order to view content subscription is required

Personal subscription

Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.

Organization subscription

Please contact us to subscribe your university or library for unlimited access!

More information

علمی مصوب

مجله کنترل

Journal of Control

فصلنامه فنی مهندسی

آخرین شماره | آرشیو

ISSN: 2008-8345 eISSN: 2538-3752

صاحب امتیاز:

انجمن مهندسان کنترل و ابزار دقیق ایران

مدیر مسئول:

دکتر ایرج گودرزنیا

سردبیر:

دکتر علی خاکی صدیق

تلفن نشریه: ۰۲۱-۸۱۰۳۲۲۲۳

اطلاعات بیشتر نشریه

درباره نشریه پیام به نشریه سایت اختصاصی نشریه پذیرش الکترونیکی مقاله

به جمع مشترکان مگیران بپیوندید!

یادگیری تقویتی چندعاملی مشارکتی در محیط های پویا بر اساس انتقال دانش برای مساله گله داری

امین نیک انجام* ، منیره عبدوس ، ماهنوش مهدوی مقدم

سیستم های چندعامله مشارکتی ، یادگیری تقویتی ، انتقال دانش ، مساله گله داری

مجله کنترل

Journal of Control