یادگیری تقویتی عمیق

Deep Reinforcement Learning

مقطع: تحصیلات تکمیلی	گرایش: هوش مصنوعی
نوع درس: نظری	تعداد واحد: ۳
پیش‌نیاز: –	هم‌نیاز: –

هدف کلی

هدف این درس آشنایی با یادگیری تقویتی عمیق است. در این درس ابتدا مدل‌های مارکوف معرفی میشوند و سپس روش‌های مبتنی بر سیاست، توابع ارزش و عامل و نقاد مورد بررسی قرار میگیرند.

سرفصل‌ها

تئوری مارکوف
یادگیری تقلیدی
چارچوب یادگیری تقویتی عمیق
یادگیری تقویتی عمیق مبتنی بر سیاست
یادگیری تقویتی عمیق مبتنی بر عامل و نقاد
یادگیری تقویتی عمیق مبتنی بر توابع ارزش
یادگیری تقویتی عمیق مبتنی بر مدل
روش‌های اکتشاف در یادگیری تقویتی عمیق
یادگیری تقویتی عمیق معکوس
یادگیری تقویتی عمیق غیر برخط

ارزیابی پیشنهادی

تمرین‌ها و پروژه: ۳۰ درصد نمره
آزمون‌های میان‌ترم و پایانی: ۵۰ درصد نمره
پروژه پژوهشی: ۲۰ درصد نمره

منابع پیشنهادی

R. S. Sutton and A. G. Barto. Reinforcement Learning: An Introduction. 2nd ed., The MIT Press 2018.
S. Ravichandiran. Deep Reinforcement Learning with Python. 2nd ed., Packt Publishing 2020.