استخراج ویژگی و بررسی کارآیی روش های کاهش بعد در زمینه تحلیل احساس
امروزه با فراگیر شدن دسترسی به اینترنت و به خصوص شبکه های اجتماعی، امکان به اشتراکگذاری عقاید و نظرات کاربران فراهم شده است. از سوی دیگر تحلیل احساس و عقاید افراد می تواند نقش به سزایی در تصمیم گیری سازمان ها و تولیدکنندگان داشته باشد. از این رو وظیفه تحلیل احساس و یا عقیدهکاوی به زمینه پژوهشی مهمی در حوزه پردازش زبان طبیعی تبدیل شده است. یکی از چالش های استفاده از شیوههای یادگیری ماشینی در حوزه پردازش زبان طبیعی، انتخاب و استخراج ویژگی های مناسب از میان تعداد زیاد ویژگی های اولیه برای دست یابی به مدلی با صحت مطلوب است. در این پژوهش دو روش فشرده سازی براساس تجزیه های ماتریسی SVD و NMF و یک روش بر اساس شبکه های عصبی برای استخراج ویژگی های موثرتر و با تعداد کمتر در زمینه تحلیل احساس در مجموعه داده نظرات به زبان فارسی مورد استفاده و تاثیر سطح فشرده سازی و اندازه مجموعه داده در صحت مدلهای ایجاد شده مورد ارزیابی قرارگرفته شده است. بررسی ها نشان می دهد که فشرده سازی نه تنها از بار محاسباتی و زمانی ایجاد مدل کم می کند، بلکه می تواند صحت مدل را نیز افزایش دهد. بر طبق نتایج پیاده سازی، فشرده سازی ویژگی ها از 7700 ویژگی اولیه به دوهزار ویژگی با استفاده از شبکه عصبی، نه تنها باعث کاهش هزینه محاسسباتی و فضای ذخیره سازی میشود، بلکه می تواند صحت مدل را از % 05/77 به % 85/77 افزایش دهد. از سوی دیگر در مجموعه داده کوچک با استفاده از روش SVD نتایج بهتری به دست می آید و با تعداد ویژگی دوهزار می توان به صحت % 92/63 در مقابل % 57/63 دست پیدا کرد؛ هم چنین آزمایش ها حاکی از آن است که فشرده سازی با استفاده از شبکه عصبی در صورت بزرگی مجموعه داده برای ابعاد پایین مجموعه ویژگی، بسیار بهتر از سایر روش ها عمل می کند. به طوری که تنها با یکصد ویژگی استخراج شده با استفاده از فشرده ساز شبکه عصبی از 7700 ویژگی اولیه می توان به صحت قابل قبول % 46/74 در مقابل صحت اولیه % 05/77 با 7700 ویژگی دست یافت.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.