استخراج ویژگی و بررسی کارآیی روش های کاهش بعد در زمینه تحلیل احساس

نویسنده:

راضیه برادران* ، عفت گلپر رابوکی

پیام:

نوع مقاله:

مقاله پژوهشی/اصیل (دارای رتبه معتبر)

چکیده:

امروزه با فراگیر شدن دسترسی به اینترنت و به خصوص شبکه های اجتماعی، امکان به اشتراک‎گذاری عقاید و نظرات کاربران فراهم شده است. از سوی دیگر تحلیل احساس و عقاید افراد می تواند نقش به سزایی در تصمیم گیری سازمان ها و تولیدکنندگان داشته باشد. از این رو وظیفه تحلیل احساس و یا عقیده‎کاوی به زمینه پژوهشی مهمی در حوزه پردازش زبان طبیعی تبدیل شده است. یکی از چالش های استفاده از شیوه‎های یادگیری ماشینی در حوزه پردازش زبان طبیعی، انتخاب و استخراج ویژگی های مناسب از میان تعداد زیاد ویژگی های اولیه برای دست یابی به مدلی با صحت مطلوب است. در این پژوهش دو روش فشرده سازی براساس تجزیه های ماتریسی SVD و NMF و یک روش بر اساس شبکه های عصبی برای استخراج ویژگی های موثرتر و با تعداد کمتر در زمینه تحلیل احساس در مجموعه داده نظرات به زبان فارسی مورد استفاده و تاثیر سطح فشرده سازی و اندازه مجموعه داده در صحت مدل‎های ایجاد شده مورد ارزیابی قرارگرفته شده است. بررسی ها نشان می دهد که فشرده سازی نه تنها از بار محاسباتی و زمانی ایجاد مدل کم می کند، بلکه می تواند صحت مدل را نیز افزایش دهد. بر طبق نتایج پیاده سازی، فشرده سازی ویژگی ها از 7700 ویژگی اولیه به دوهزار ویژگی با استفاده از شبکه عصبی، نه تنها باعث کاهش هزینه محاسسباتی و فضای ذخیره سازی می‎شود، بلکه می تواند صحت مدل را از % 05/77 به % 85/77 افزایش دهد. از سوی دیگر در مجموعه داده کوچک با استفاده از روش SVD نتایج بهتری به دست می‎ آید و با تعداد ویژگی دوهزار می توان به صحت % 92/63 در مقابل % 57/63 دست پیدا کرد؛ هم چنین آزمایش ها حاکی از آن است که فشرده سازی با استفاده از شبکه عصبی در صورت بزرگی مجموعه داده برای ابعاد پایین مجموعه ویژگی، بسیار بهتر از سایر روش ها عمل می کند. به طوری که تنها با یکصد ویژگی استخراج شده با استفاده از فشرده ساز شبکه عصبی از 7700 ویژگی اولیه می توان به صحت قابل قبول % 46/74 در مقابل صحت اولیه % 05/77 با 7700 ویژگی دست یافت.

کلیدواژگان:

پردازش زبان طبیعی ، تحلیل احساس ، کدگذار خودکار ، تجزیه مقدار تکین ، تجزیه نامنفی ماتریس

زبان:

فارسی

انتشار در:

فصلنامه پردازش علائم و داده ها، سال شانزدهم شماره 3 (پیاپی 41، پاییز 1398)

صفحات:

79 تا 88

لینک کوتاه:

magiran.com/p2073952

دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:

اشتراک شخصی

با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!

اشتراک سازمانی

به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!

اطلاعات بیشتر

توجه!

حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.

In order to view content subscription is required

Personal subscription

Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.

Organization subscription

Please contact us to subscribe your university or library for unlimited access!

More information

علمی مصوب

فصلنامه پردازش علائم و داده ها

Signal and Data Processing

فصلنامه فنی مهندسی

آخرین شماره | آرشیو

ISSN: 2538-4201 eISSN: 2538-421X

صاحب امتیاز:

پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی

مدیر مسئول:

دکتر جواد شیخ زادگان

سردبیر:

دکتر محمدحسن قاسمیان

تلفن نشریه: ۰۲۱-۸۳۸۵۷۶۰۵

اطلاعات بیشتر نشریه

درباره نشریه پیام به نشریه سایت اختصاصی نشریه پذیرش الکترونیکی مقاله

سامانه نویسندگان

از نویسنده(گان) این مقاله دعوت می‌کنیم در سایت ثبت‌نام کرده و این مقاله را به فهرست مقالات رزومه خود پیوست کنند. راهنما

به جمع مشترکان مگیران بپیوندید!

استخراج ویژگی و بررسی کارآیی روش های کاهش بعد در زمینه تحلیل احساس

راضیه برادران* ، عفت گلپر رابوکی

پردازش زبان طبیعی ، تحلیل احساس ، کدگذار خودکار ، تجزیه مقدار تکین ، تجزیه نامنفی ماتریس

فصلنامه پردازش علائم و داده ها

Signal and Data Processing