طراحی یک ماشین هوشمند مبتنی بر مدل سازی شناختی با استفاده از تکلیف شبکه توجه
گفتار موثرترین ابزاری است که انسان ها برای انتقال اطلاعات از آن استفاده می کنند. گوینده در خلال گفتار خویش علاوه بر واژگان و دستور زبان اطلاعاتی همچون سن، جنسیت و حالت هیجانی خود را منتقل می کند. پژوهش های فراوانی با رویکردهای گوناگون پیرامون هیجان در گفتار هیجانی انجام شده است. این پژوهش ها نشان می دهند که هیجان ضمن پیام در گفتار هیجانی از طبیعتی پویا برخودار می باشد. این پویایی، مطالعه ی کمی هیجان در گفتار هیجانی را با دشواری همراه می سازد. این پژوهش به ارزیابی هیجان ضمن پیام از طریق پردازش گفتار هیجانی با استفاده از ویژگی های MFCC و STFT می پردازد.
داده های ورودی، پایگاه داده ی استاندارد گفتار هیجانی برلین شامل هفت حالت هیجانی خشم، کسلی، انزجار، ترس، شادی، غم و حالت خنثی می باشد. با استفاده از نرم افزار MATLAB ابتدا فایل های صوتی خوانده می شوند. در مرحله ی بعد نخست ویژگی های MFCC و در سپس ویژگی های STFT استخراج می شوند. بردار های ویژگی برای هر کدام از ویژگی ها بر اساس هفت مقدار آماری کمینه، بیشینه، میانگین، انحراف معیار، میانه، چولگی و کشیدگی محاسبه می شوند. سپس به عنوان ورودی شبکه ی عصبی مصنوعی مورد استفاده قرار گرفتند. در انتها، بازشناسی حالت های هیجانی با استفاده از توابع آموزشی مبتنی بر الگوریتم های مختلف انجام شد.
نتایج بدست آمده نشان می دهد میانگین و صحت بازشناسی حالت های هیجانی با استفاده از ویژگی های STFT نسبت به ویژگی های MFCC بهتر است. همچنین، حالت های هیجانی خشم و غم از نرخ بازشناسی بهتری برخوردار هستند.
ویژگی های STFT نسبت به ویژگی های MFCC هیجان ضمن پیام در گفتار هیجانی را بهتر بازنمایی می کنند.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.