Deep Reinforcement Learning
| مقطع: تحصیلات تکمیلی | گرایش: هوش مصنوعی |
| نوع درس: نظری | تعداد واحد: ۳ |
| پیشنیاز: – | همنیاز: – |
هدف این درس آشنایی با یادگیری تقویتی عمیق است. در این درس ابتدا مدلهای مارکوف معرفی میشوند و سپس روشهای مبتنی بر سیاست، توابع ارزش و عامل و نقاد مورد بررسی قرار میگیرند.