بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی

پیام:
چکیده:

این مقاله به موضوع انتقال یادگیری در محیط هایی که بعضی از ویژگی های آن مشترک است می پردازد. چالش اصلی در این مبحث، نحوه انتقال دانش به دست آمده از محیط مبدا به محیط مقصد است. در ایده ارائه شده با در نظر گرفتن ویژگی های مشترک در فضای عامل بین دو محیط، ابتدا مقدار ارزش - عمل در محیط مبدا به دست می آید، سپس از یک شبکه عصبی- فازی برای تقریب مقدار تابع ارزش - عمل بهره برده می‏شود. در محیط مقصد، مقدار ارزش - عمل از ترکیب مقدار پیش بینی شبکه عصبی - فازی و مقدار به دست آمده در خود آن محیط استفاده می شود. به‌عبارت دیگر با توجه به آموزش انجام‌شده در محیط مبدا، مقادیر ارزش - عمل در محیط مقصد از ترکیب مقادیر ارزش - عمل تقریب زده شده توسط شبکه عصبی - فازی و مقدار به دست آمده از الگوریتم یادگیری در آن محیط به دست می آید. شایان ذکر است که از الگوریتم یادگیری Q در محیط استفاده‌شده است. نتایج حاصل از ایده ارائه‌شده، حاکی از افزایش چشمگیر سرعت یادگیری می باشد.

نوع مقاله:
مقاله پژوهشی/اصیل
زبان:
فارسی
صفحات:
1119 -1129
لینک کوتاه:
magiran.com/p2071573 
روش‌های دسترسی به متن این مطلب
اشتراک شخصی
در سایت عضو شوید و هزینه اشتراک یک‌ساله سایت به مبلغ 300,000ريال را پرداخت کنید. همزمان با برقراری دوره اشتراک بسته دانلود 100 مطلب نیز برای شما فعال خواهد شد!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی همه کاربران به متن مطالب خریداری نمایند!