Robust sub-band speech feature extraction using multiresolution convolutional neural networks

Author(s):

Navid Naderi , Babak Nasersharif*

Message:

Article Type:

Research/Original Article (دارای رتبه معتبر)

Abstract:

Convolutional neural networks (CNNs), as a kind of deep neural networks, have been recently used for acoustic modeling and feature extraction along with acoustic modeling in speech recognition systems. In this paper, we propose to use CNN for robust feature extraction from the noisy speech spectrum. In the proposed manner, CNN inputs are noisy speech spectrum and its targets are denoised logarithm of Mel filter bank energies (LMFBs). Consequently, CNN extracts robust features from speech spectrum. The drawback of CNN in the proposed method is its fixed frequency resolution. Thus, we propose to use multiple CNNs with different convolution filter sizes to provide different frequency resolutions for feature extraction from the speech spectrum. We named this method as Multiresolution CNN (MRCNN). Recognition accuracy on Aurora 2 database, shows that CNNs outperform deep belief networks such that, CNN recognition accuracy has 20% relative improvement on average over DBN. However, results show that MRCNN recognition accuracy has 1% relative improvement on average over CNN.

Keywords:

Convolutional neural network , Robust speech recognition , Single resolution , Multi-resolution , Mel filter bank

Language:

Persian

Published:

Journal of Electrical Engineering, Volume:49 Issue: 3, 2020

Pages:

1393 to 1404

https://www.magiran.com/p2071723

دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:

اشتراک شخصی

با ثبت ایمیلتان و پرداخت حق اشتراک سالانه به مبلغ 1,950,000 ريال، بلافاصله متن این مقاله را دریافت کنید.اعتبار دانلود 70 مقاله نیز در حساب کاربری شما لحاظ خواهد شد.

پرداخت حق اشتراک به معنای پذیرش "شرایط خدمات" پایگاه مگیران از سوی شماست.

پست الکترونیکی

اگر مقاله ای از شما در مگیران نمایه شده، برای استفاده از اعتبار اهدایی سامانه نویسندگان با ایمیل منتشرشده ثبت نام کنید. ثبت نام

اشتراک سازمانی

به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!

اطلاعات بیشتر ثبت نام با ایمیل دانشگاهی/سازمانی

توجه!

حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.

In order to view content subscription is required

Personal subscription

Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.

Organization subscription

Please contact us to subscribe your university or library for unlimited access!

More information

علمی مصوب

نشریه مهندسی برق

Journal of Electrical Engineering

فصلنامه فنی مهندسی به زبان فارسی، انگلیسی

آخرین شماره | آرشیو

ISSN: 2008-7799 eISSN: 2538-3051

برای مشاهد آرشیو به نشریه «دانشکده فنی تبریز» مراجعه نمایید.

صاحب امتیاز:

رئیس دانشکده مهندسی برق و کامپیوتر

مدیر مسئول:

دکتر میرهادی سیدعربی

سردبیر:

دکتر ابراهیم بابایی

تلفن نشریه: ۰۴۱-۳۳۳۰۰۸۳۲

اطلاعات بیشتر نشریه

درباره نشریه پیام به نشریه سایت اختصاصی نشریه پذیرش الکترونیکی مقاله

به جمع مشترکان مگیران بپیوندید!

Robust sub-band speech feature extraction using multiresolution convolutional neural networks

Navid Naderi , Babak Nasersharif*

Convolutional neural network , Robust speech recognition , Single resolution , Multi-resolution , Mel filter bank

نشریه مهندسی برق

Journal of Electrical Engineering