بینایی کامپیوتر با یادگیری عمیق

Computer Vision Using Deep Learning

مقطع: تحصیلات تکمیلی گرایش: هوش مصنوعی
نوع درس: نظری تعداد واحد: ۳
پیش‌نیاز: – هم‌نیاز: –

هدف کلی

هدف این درس استفاده از یادگیری عمیق در حل مسائل بینائی کامپیوتر است. شبکه‌های عصبی عمیق برای حل مسائل مختلف بینائی کامپیوتر با رویکرد انتها-به-انتها مورد بررسی قرار می‌گیرند و موفق‌ترین روش‌ها معرفی می‌شوند. این رویکرد با استفاده از یادگیری، قدم‌های سنتی مورد نیاز در حل مسائل بینائی را حذف می‌کند.

سرفصل‌ها

  1. مقدمه: رویکرد انتها-به-انتها، چالش‌های آموزش مدل‌ها، تعبیه تصاویر، مجموعه داده‌های مهم، پیش‌آموزش، یادگیری انتقالی
  2. دسته بندی تصاویر: مدلهای مبتنی بر وی-جی-جی، رزنت، موبایل نت، و مبدل بینائی
  3. تشخیص اشیاء: مدلهای مبتنی بر شبکه کانولوشنی ناحیه‌ای و بهبودهای آن، شبکه یولو و بهبودهای آن، رتنانت، آشکارساز چندقابی تک مرحله‌ای
  4. ناحیه‌بندی تصاویر: ناحیه‌بندی معنایی با یونت و ساختارکدگذار-کدگشای کانولوشنی، ناحیه‌بندی نمونه‌ای با شبکه کانولوشنی ناحیه‌ای پوشانده
  5. استخراج ویژگی: ویژگی‌های وی-جی-جی، ویژگی‌های برت، ویژگی سوپر پوینت
  6. شناسائی چهره: مدل دیپ فیس، مدل فیس نت
  7. تولید تصویر: تولید تصویر با شبکه مولد تقابلی پایه (گن) و رشد یابنده تدریجی و مدلهای پخشی
  8. ویرایش تصویر: ساختارهای مبتنی بر استایل گن، سایکلیک گن، مدلهای پخشی
  9. وضوح فوق العاده: ایجاد تصاویر با وضوح عالی با اس-آر گن
  10. ترمیم تصویر: استفاده از ساختار کدگذار-کدگشا برای رفع نقائص محلی تصویر، معماری دومسیره
  11. تشخیص حالات غیرعادی: استفاده از مدل گن تغییر یافته برای آشکارسازی داده‌های دارای شرایط غیرمتعارف
  12. دسته‌بندی و درک ویدیو: شبکه‌های کانولوشنی سه بعدی و دو بعدی دو شاخه‌ای، شبکه‌های فلونت، و دیپ سورت

ارزیابی پیشنهادی

منابع پیشنهادی

  1. V. Lakshmanan, M. Gorner and R. Gillard. Practical Machine Learning for Computer Vision. O’Reilly, 2021.
  2. M. Elgendy. Deep Learning for Vision Systems. Manning Publications Co., 2020.
  3. R. Shanmugamani. Deep Learning for Computer Vision. Packt Publishing Ltd., 2018.
  4. V. Verdhan. Computer Vision Using Deep Learning. Apress, 2021.
  5. A. Rosebrock. Deep Learning for Computer Vision, Volumes 1, 2, and 3. PyImageSearch, 2017.