Speech and Speaker Recognition
مقطع: تحصیلات تکمیلی | گرایش: هوش مصنوعی |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف از این درس، آشنا نمودن دانشجویان با اصول بازشناسی گفتار و گوینده است. درس بعد از معرفی مقدمات، با روشهای مبتنی بر مدل مخفی مارکوف شروع میشود. سپس مدلهای ترکیبی HMM-DNN به همراه توضیح مسائل مختلف آن آورده میشود. در ادامه بعد از معرفی روش CTC، مدلهای انتها به انتها برای بازشناسی گفتار شرح داده میشوند. سپس روشهای مرسوم و جدید بازشناسی گوینده و نکات مهم این موضوع توضیح داده خواهند شد و در انتها نیز روشهای پیش آموزش شبکههای عصبی و چندین مدل از آنها برای بازشناسی گفتار و گوینده آموزش داده میشوند.