تشخیص اسپم در شبکه اجتماعی توییتر با استفاده از رویکرد یادگیری ترکیبی
امروزه شبکه های اجتماعی، نقش مهمی در گسترش اطلاعات در سراسر جهان دارند. توییتر یکی از محبوب ترین شبکه های اجتماعی است که در هر روز 500 میلیون توییت در این شبکه ارسال می شود. محبوبیت این شبکه در میان کاربران منجر شده تا اسپمرها از این شبکه برای انتشار پست های هرزنامه استفاده کنند. در این مقاله برای شناسایی اسپم در سطح توییت از ترکیبی از روش های یادگیری ماشین استفاده شده است. روش پیشنهادی، چارچوبی مبتنی بر استخراج ویژگی است که در دو مرحله انجام می شود. در مرحله اول از Stacked Autoencoder برای استخراج ویژگی ها استفاده شده و در مرحله دوم، ویژگی های مستخرج از آخرین لایه Stacked Autoencoder به عنوان ورودی به لایه softmax داده می شوند تا این لایه پیش بینی را انجام دهد. روش پیشنهادی با برخی روش های مشهور روی پیکره متنی Twitter Spam Detection با معیارهای Accuracy، -Score1F، Precision و Recall مورد مقایسه و ارزیابی قرار گرفته است. نتایج تحقیق نشان می دهند که دقت کشف روش پیشنهادی به 1/78% می رسد. در مجموع، این روش با استفاده از رویکرد اکثریت آرا با انتخاب سخت در یادگیری ترکیبی، توییت های اسپم را با دقت بالاتری نسبت به روش های CNN، LSTM و SCCL تشخیص می دهد.
توییتر ، شناسایی اسپم ، شبکه عصبی ، Autoencoder ، Softmax
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.