ارائه رویکرد ترکیبی مبتنی بر یادگیری عمیق و یادگیری ماشین جهت تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس

پیام:
نوع مقاله:
مطالعه موردی (دارای رتبه معتبر)
چکیده:

هدف :

اطلاعات غلط یا تایید نشده، دقیقا مانند اطلاعات دقیق در وب منتشر می شوند. بنابراین، ممکن است ویروسی شوند و بر افکار عمومی و تصمیمات آن تاثیر بگذارند. اخبار جعلی و شایعات به ترتیب محبوب ترین اشکال اطلاعات دروغ و تایید نشده را نشان می دهند و برای جلوگیری از تاثیرات چشمگیر آنها باید در اسرع وقت کشف شوند. علاقه به تکنیک های موثر در شناسایی، در سال های اخیر بسیار سریع در حال افزایش است. مسیله تشخیص اخبار جعلی به عنوان یک مسیله طبقه بندی در پردازش زبان طبیعی و متن کاوی شناخته می شود و هدف آن تفکیک و تشخیص اخبار جعل از واقعی، در متن های استخراج شده و بهبود در دقت تشخیص اخبار جعلی است. شبکه های عصبی کانولوشن به عنوان یکی از مهم ترین مدل های یادگیری عمیق دقت بالایی را بر روی این مسایل بدست آورده اند.این شبکه ها شامل مشکلاتی مثل عدم در نظر گرفتن موقعیت کلمات می باشند که مساله مذکور با استفاده از شبکه کپسول برطرف گردیده و جهت حل مشکل پردازش سنگین لایه های تمام متصل و فضای پارامتریک الگوریتم های XGBOOST و بهینه سازی ازدحام انبوه ذرات (PSO) برای دستیابی به دقت و صحت بهینه پیشنهاد شده است.

روش

مطالعه حاضر پژوهشی کاربردی بوده که در آن حدود 42000 اخبار فارسی از شهرهای مختلف ایران از توییتر جمع آوری شده و با استفاده از روش های پاک سازی و پیش پردازش، اطلاعات اضافی حذف و پس از برچسب زدن، اخبار آماده به کارگیری جهت رویکرد پیشنهادی با استفاده از نرم افزار پایتون و کتابخانه های مربوطه با الگوریتم های یادگیری ماشین و یادگیری عمیق شد.

یافته ها

طی بررسی، آزمایش و تست، برخی از الگوریتم های یادگیری ماشین دارای قدرت بیشتری در مسایل طبقه بندی بودند، ولی با تغییرات و اعمال روش های پیشنهادی که در ساختار الگوریتم شبکه کانولوشن و شبکه کپسول صورت گرفت، نتایج بهینه نسبت به الگوریتم های یادگیری ماشین و سایر الگوریتم های پایه و الگوریتم های مورد ارزیابی بدست آمد.

نتیجه گیری

راهکارهای پیشنهادی در این تحقیق در مقایسه با رویکردهای الگوریتم های پایه و یا راهکارهای صورت گرفته جهت حل مشکلات مذکور بدون اضافه کردن سربار اضافی از لحاظ تعداد ویژگی ها و عمق شبکه، با تغییر در ورودی توانسته است به نتایج بهتر و قابل قبول از سایر رویکردهای موجود در ادبیات دست یافته و به دقت و صحت حدود 96 درصد دست یابد.

زبان:
فارسی
صفحات:
283 تا 316
لینک کوتاه:
magiran.com/p2530836 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!