ارائه روشی جدید برای کسب مهارت در یادگیری تقویتی با کمک خوشه بندی گراف

پیام:
چکیده:
یادگیری تقویتی، یکی از انواع یادگیری ماشین است که در آن عامل با استفاده از تراکنش با محیط، به شناخت محیط و بهبود رفتار خود می‎پردازد. یکی از مشکلات اصلی الگوریتم‎های استاندارد یادگیری تقویتی مانند یادگیری Q این است که نمی‎توانند مسایل بزرگ را در زمان قابل قبولی حل کنند. کسب خودکار مهارت ها می تواند به شکستن مساله به زیرمساله‎های کوچک تر و حل سلسله مراتبی آن کمک کند. با وجود نتایج امیدوارکننده استفاده از مهارت ها در یادگیری تقویتی سلسله مراتبی، در برخی تحقیقات دیگر نشان داده شد که بر اساس وظیفه مورد نظر، اثر مهارت ها بر کارایی یادگیری می تواند کاملا مثبت یا منفی باشد و اگر به درستی انتخاب نشوند می توانند پیچیدگی حل مساله را افزایش دهند. از این رو یکی از نقاط ضعف روش های قبلی کسب خودکار مهارت ها، عدم ارزیابی هر یک از مهارت های کسب شده می باشد. در این مقاله روش های جدیدی مبتنی بر خوشه بندی گراف برای استخراج زیرهدف ها و کسب مهارت ها ارائه می گردد. همچنین معیارهای جدید برای ارزیابی مهارت ها مطرح می شود که با کمک آنها، مهارتهای نامناسب برای حل مساله حذف می گردند. استفاده از این روش ها در چندین محیط آزمایشگاهی افزایش سرعت یادگیری را به شکل قابل ملاحظه ای نشان می دهد.
نوع مقاله:
مقاله پژوهشی/اصیل
زبان:
فارسی
صفحه:
131
لینک کوتاه:
magiran.com/p1892491 
برخی از خدمات از جمله دانلود متن مقالات تنها به مشترکان مگیران ارایه می‌گردد. شما می‌توانید به یکی از روش‌های زیر مشترک شوید:
اشتراک شخصی
در سایت عضو شوید و هزینه اشتراک یک‌ساله سایت به مبلغ 300,000ريال را پرداخت کنید. همزمان با برقراری دوره اشتراک بسته دانلود 100 مطلب نیز برای شما فعال خواهد شد!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی همه کاربران به متن مطالب خریداری نمایند!
توجه!
  • دسترسی به متن مقالات این پایگاه در قالب ارایه خدمات کتابخانه دیجیتال و با دریافت حق عضویت صورت می‌گیرد و مگیران بهایی برای هر مقاله تعیین نکرده و وجهی بابت آن دریافت نمی‌کند.
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.