تایید هویت گوینده مقاوم به شرایط تلفنی با استفاده از شبکه عصبی تاخیر زمانی
در این تحقیق الگوی شبکه عصبی تاخیر زمانی و بردار- x به منظور مقاوم سازی در برابر نوفه و صافی کردن (فیلترینگ) بسامدی ناشی از ارتباط تلفنی ارایه گردیده است. از ضرایب کپسترال بسامد مل به عنوان ویژگی صوتی مرتبط با گوینده به عنوان ورودی این الگو استفاده شده است. خروجی شبکه عصبی این الگو به صورت یک بردار- xدر نظر گرفته شده است تا بتواند در مرحله تصمیم گیری از آن استفاده شود. در مرحله تصمیم گیری از تحلیل تفکیک خطی احتمالاتی به منظور امتیازدهی و مقایسه استفاده شده است. به منظور افزایش دقت و کاهش نرخ خطای برابر، داده های آموزشی ترکیبی از دادگان نسبتا تمیز وکس سلب 1، 2 و دادگان تلفنی کال هوم و هم چنین دادگان نوفه ای و تلفنی به دست آمده از روش داده افزایی هستند. نتایج حاصل از به کارگیری این شیوه برای نرخ خطای برابر در حالت تمیز 3/09 درصد است که نسبت به الگو های پایه در بدترین حالت در حدود 0/15 درصد (3/24 درصد در کارهای پیشین به دست آمده است) و در بهترین حالت 6/93 درصد (10/2 درصد در کارهای پیشین به دست آمده است) بهبود یافته است. در زمانی که آموزش با دادگان وکس سلب 1، 2 و دادگان کال هوم به عنوان تطبیق استفاده شده است، نرخ خطای برابر معادل 4/95 درصد به دست آمده است. در بدترین حالت زمانی که فقط دادگان وکس سلب1 به تلفنی تبدیل شده، نرخ خطای برابر معادل با 14/34 درصد شده است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.