بهسازی گفتار دو مرحلهای توسط خودرمزگذار عمیق کاهنده نویز
برای حذف نویز از سیگنال گفتار، هم اطلاعات زمانکوتاه و هم اطلاعات زمانبلند سیگنال میتوانند مفید باشند. خصوصا اگر نویز دارای ویژگیهای غیرایستان باشد. لذا در این مقاله سعی شده است تا با استفاده از کاهش تعداد زیرباندهای فرکانسی در فواصل زمانی بلند امکان اعمال ورودیهای زمانبلند را برای شبکه عصبی خودرمزگذار عمیق کاهنده نویز فراهم سازد. همچنین یک روش دو مرحلهای بهسازی گفتار ارایه میشود که در مرحله نخست بهسازی زمانکوتاه و در مرحله دوم بهسازی زمانبلند را انجام دهد. آزمایشهای این مقاله بر روی مجموعه دادگان Aurora-2 انجام شده است. نتایج نشان داده است که روش پیشنهادی می تواند از نظر بهسازی گفتار و معیار PESQ نسبت به فیلتر وینر در شرایط آغشتگی به نویز بالا به میزان 0.3 بهبود ایجاد کند. همچنین روش پیشنهادی می تواند از نظر دقت بازشناسی خودکار گفتار نسبت به ویژگیهای مبنا یعنی MFCC حدود 4% بهبود ایجاد کند
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.