NMF-based Improvement of DNN and LSTM Pre-Training for Speech Enhancemet

Author(s):

Razieh Safari Dehnavi , Sanaz Seyedin*

Message:

Article Type:

Research/Original Article (دارای رتبه معتبر)

Abstract:

A novel pre-training method is proposed to improve deep-neural-networks (DNN) and long-short-term-memory (LSTM) performance, and reduce the local minimum problem for speech enhancement. We propose initializing the last layer weights of DNN and LSTM by Non-Negative-Matrix-Factorization (NMF) basis transposed values instead of random weights. Due to its ability to extract speech features even in presence of non-stationary noises, NMF is faster and more successful than previous pre-training methods for network convergence. Using NMF basis matrix in the first layer along with another pre-training method is also proposed. To achieve better results, we further propose training individual models for each noise type based on a noise classification strategy. The evaluation of the proposed method on TIMIT data shows that it outperforms the baselines significantly in terms of perceptual-evaluation-of-speech-quality (PESQ) and other objective measures. Our method outperforms the baselines in terms of PESQ up to 0.17, with an improvement percentage of 3.4%.

Keywords:

pre-training , deep neural networks (DNN) , long short-term memory (LSTM) , non-negative matrix factorization (NMF) , speech enhancement , basis matrix , noise classification

Language:

English

Published:

International Journal Information and Communication Technology Research, Volume:15 Issue: 3, Summer 2023

Pages:

53 to 65

magiran.com/p2644385

دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:

اشتراک شخصی

با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!

اشتراک سازمانی

به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!

اطلاعات بیشتر

توجه!

حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.

In order to view content subscription is required

Personal subscription

Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.

Organization subscription

Please contact us to subscribe your university or library for unlimited access!

More information

علمی مصوب

International Journal Information and Communication Technology Research

مجله بین المللی فناوری اطلاعات و ارتباطات

فصلنامه فنی مهندسی به زبان انگلیسی

Information and Communication Technology Research

آخرین شماره | آرشیو

ISSN: 2251-6107

صاحب امتیاز:

پژوهشگاه ارتباطات و فناوری اطلاعات

مدیر مسئول:

دکتر سید محمد رضوی زاده

سردبیر:

دکتر احمد خادم زاده

تلفن نشریه: ۰۲۱-۸۸۶۳۰۰۵۹

اطلاعات بیشتر نشریه

درباره نشریه پیام به نشریه سایت اختصاصی نشریه پذیرش الکترونیکی مقاله

به جمع مشترکان مگیران بپیوندید!

NMF-based Improvement of DNN and LSTM Pre-Training for Speech Enhancemet

Razieh Safari Dehnavi , Sanaz Seyedin*

pre-training , deep neural networks (DNN) , long short-term memory (LSTM) , non-negative matrix factorization (NMF) , speech enhancement , basis matrix , noise classification

International Journal Information and Communication Technology Research

مجله بین المللی فناوری اطلاعات و ارتباطات