rumor detection
در نشریات گروه برق-
During the last few years, rumor and its rapid diffusion via social media have affected public opinions, even in some important such as presidential elections. One of the main approaches for rumor detection methods is based on content and natural language processing. Despite considerable improvement made in this regard in the English language, unfortunately, we have not witnessed enough progress in the Persian language, mainly due to a lack of datasets in this area. The main novelty of this paper is combining different learning methods to consider the classification problem from different aspects and combine the classifiers’ results to achieve a reasonable final result. In the proposed method, each classifier is assigned a weight depending on its f-measure value; thus, the final fused result is closer to the performance of the best classifier. When news samples have various characteristics, and the best classifier is not predetermined, this fusion method is more beneficial. Therefore, as the conclusion of this research, compared to a single rumor detection method, the fusion of classifiers could be used to achieve better results when the news samples have various characteristics.
Keywords: Rumor Detection, Machine Learning, Content-Based Text Classification, Deep Learning, Multi-Classification -
با شنیدن هر خبر در شبکه های اجتماعی، واکنش ها به آن متفاوت است و از زوایای مختلف موجب برانگیخته شدن حس کنجکاوی می شود. مهم ترین بخش آن فهمیدن صحت وسقم خبر است. شایعه، خبری نامعتبر است؛ یعنی هنوز تایید نشده و ممکن است در صورت نداشتن اعتبار موجب خسارات جبران ناپذیری شود؛ ازاین رو، تشخیص آن بسیار مهم است. تشخیص شایعه و یا به عبارتی مشخص کردن اعتبار آن نقش اساسی در جلوگیری از خبر نادرست دارد. در این مقاله، با استفاده از ویژگی های جدید دستی مبتنی بر توییت، کاربر و ترکیبی از این دو و با استفاده از چهار دسته بند یادگیری ماشین، شایعه موجود در شبکه های اجتماعی تشخیص داده شد؛ همچنین با توجه به نامتعادل بودن مجموعه داده از روش بیش نمونه برداری استفاده و با توجه به تفاوت ویژگی ها از نرمال سازی استفاده شده است. نتایج نشان داد این روش با وجود سادگی نسبت به روش های یادگیری ماشین و عمیق بهبود قابل توجهی داشته است و مقدار صحت به 99/0 رسید.
کلید واژگان: تشخیص شایعه، یادگیری ماشین، ویژگی کاربر، ویژگی توییت، ویژگی دستیWhen every news item is posted on social media, reactions to it are different and arouse curiosity from different viewpoints. The most important part is to understand the accuracy of the news. A rumor is invalid news, meaning it has not yet been confirmed and it may cause irreparable damage if it is not valid. Therefore, it is very important to detect it. Rumor detection, or in other words, determining its validity, plays an essential role in preventing fake news. Naturally, every phenomenon of normal and anomaly is transmitted to people through social networks. Every News Reactions to that news are different. Depending on the importance of the news, it may be widely covered or it may not have a specific reaction. But if the news spreads widely, it arouses curiosity from different angles. The news is false or true, or the news is valid or invalid. In this work, an attempt was made to identify rumors on social networks by using Hand-Crafted features based on tweets, users and a combination of the two, oversampling and normalization, and by using machine learning classification. Using 4 machine learning classifiers, including Support vector machine, Logistic regression, K-nearest neighbors and Random forest, the two rumors on social networks were detected. Two data sets, PHEME 2017 and PHEME 2018, have been used. The results on these two datasets show that in PHEME 2017, the random forest classifier shows an accuracy of 0.988 using tweet and combination features. Also, these features show a precision of 0.987, which is better than other classifiers used in this work. This classifier has a better recall than other classifiers along with logistic regression with a value of 0.986. Also, this classifier obtained better results with the two mentioned features, with 0.987. In the PHEME 2018 dataset, it obtained the RF classifier with an accuracy of 0.969 using tweet and combination features, and it has better performance in precision, recall and F1. In addition, the user feature in the classifier of k nearest neighbors brings better results than the other two features.
Keywords: Rumor Detection, Machine Learning, User Feature, Tweet Feature, Hand-Crafted Feature -
Social media is an inseparable part of human life, although published information through social media is not always true. Rumors may spread easily and quickly in the social media, hence, it is vital to have a tool for rumor veracity detection. Papers already proved that users’ stance is an important tool for this goal. To the best knowledge of authors, so far, no work has been proposed to study the ordering of users’ stances to achieve the best possible accuracy. In this work, we have investigated the importance of the stances ordering in the efficiency of rumor veracity detection. This paper introduces a concept called trust for stance sequence ordering and shows that proper definition of this function can significantly help improve to improve veracity detection. The paper examines and compares different modes of definition of trust. Then, by choosing the best possible definition, it was able to outperform state-of-the-art results on a well-known dataset in this field, namely SemEval 2019.
Keywords: Stance, rumor detection, rumor veracity, ordering, deep learning -
توییتر یکی از محبوب ترین و مشهورترین شبکه های اجتماعی برخط برای گسترش اطلاعات است که در عین قابل اعتماد بودن، می تواند به عنوان منبعی برای گسترش شایعات باشد. شایعاتی غیرواقعی و فریبنده که می تواند تاثیرات جبران ناپذیری برروی افراد و جامعه به وجود بیاورد. در این پژوهش مجموعه کاملی از ویژگی های جدید ساختاری مربوط به درخت پاسخ و گراف کاربران در تشخیص مکالمه های شایعه توییتر استخراج شدند. این ویژگی ها با توجه به معیارهای سنتی گراف ها و معیارهای مخصوص انتشار شایعه، در بازه های زمانی مختلف به مدت 24 ساعت از زمان شروع مکالمه ها در خصوص رویدادهای بحرانی در توییتر استخراج شده اند. نتایج حاصل از بررسی ویژگی های جدید، دیدگاه عمیقی از ساختار انتشار اطلاعات در مکالمه ها را فراهم می کند. بر اساس نتایج به دست آمده، ویژگی های جدید ساختاری در تشخیص مکالمه های شایعه در رویدادهای توییتر موثر هستند؛ ازاین رو، الگوریتم دسته بند شایعه مبتنی بر ویژگی های جدید ساختاری، زبانی و کاربران در تشخیص مکالمه های شایعه زبان انگلیسی توییتر ، پیشنهاد داده شد. روش پیشنهادی در مقایسه با روش های پایه، عملکرد بهتری دارد. همچنین، با توجه به اهمیت کاربر توییت منبع در مکالمه ها، این کاربر از جنبه های مختلفی موردبررسی و آنالیز قرار گرفت.
کلید واژگان: مکالمه، تشخیص شایعه، توییتر، درخت پاسخ، گراف کاربرانToday, online social media with numerous users from ordinary citizens to top government officials, organizations, artists and celebrities, etc. is one of the most important platforms for sharing information and communication. These media provide users with quick and easy access to information so that the content of shared posts has the potential to reach millions of users in a matter of seconds. Twitter is one of the most popular and practical/used online social networks for spreading information, which, while being reliable, can also, be a source for spreading unrealistic and deceptive rumors as a result can have irreversible effects on individuals and society. Recently, several studies have been conducted in the field of rumor detection and verify using models based on deep learning and machine learning methods. Previous research into rumor detection has focused more on linguistic, user, and structural features. Concerning structural features, they examined the retweet propagation graph. However, in this study, unlike the previous studies, new structural features of the reply tree and user graph in extracting rumored conversations were extracted and analyzed from different aspects. In this study, the effectiveness of new structural features related to reply tree and user graph in detecting rumored conversations in Twitter events were evaluated from different aspects. First, the structural features of the reply tree and user graph were extracted at different time intervals, and important features in these intervals were identified using the Sequential Forward Selection approach. To evaluate the usefulness of valuable new structural features, these features have been compared with consideration of linguistic and user-specific features. Experiments have shown that combining new structural features with linguistic and user-specific features increases the accuracy of the rumor detection classification. Therefore, a rumor classification algorithm based on new structural, linguistic, and user-specific features in rumor conversation detection was proposed. This algorithm performs better than the basic methods and detects rumored conversations with greater accuracy. In addition, due to the importance of the source tweet user in conversations, this user was examined and analyzed from different aspects. The results showed that most rumored conversations were started by a small number of users. Rumors can be prevented by early identification of these users on Twitter events.
Keywords: Conversion, Rumor detection, Twitter, Reply tree, User graph -
با توجه به جایگاهی که امروزه شبکه های اجتماعی در جوامع پیدا کرده اند، افراد بسیاری از این شبکه ها به منظور منتشر کردن عقاید و اطلاعات خود استفاده می کنند. یکی از چالش های امنیتی موجود در این شبکه ها، جلوگیری از حملات معنایی است. در حملات معنایی فرد مخرب قصد دارد تا با انتشار اطلاعات و شایعات نادرست در شبکه های اجتماعی، بر روی کاربران دیگر تاثیر بگذارد. بنابراین ایمنی افراد در این گونه شبکه ها به خطر می افتد. انتشار اطلاعات نادرست در مواقع بحرانی مانند جنگ یا انتخابات ممکن است، عواقب جبران ناپذیری برای یک اجتماع داشته باشد. از این رو در این پژوهش هدف اینست که بتوان شایعات از جمله شایعات فارسی را در شبکه های اجتماعی تشخیص داد. بدین منظور از یک معماری ترکیبی LSTM-CNN استفاده و برخلاف پژوهش های پیشین از نرخ یادگیری چرخشی بهره گرفته و روش جدیدی به منظورپردازش کردن داده ها قبل از ورود به شبکه برای بهبود نتایج ارایه شده است. علاوه بر آن نیز برای رفع مشکلات مربوط به کمبود داده مدل BERT برای تشخیص شایعات فارسی هم مورد بررسی قرار گرفت. در نهایت با ارزیابی روش پیشنهادی مشخص شد که این روش به دقت مناسبی برای تشخیص شایعات و همین طور شایعات فارسی تنها با بررسی محتوا، دست یافته است.
کلید واژگان: شبکه های اجتماعی، شایعه، یادگیری عمیقJournal of Command and Control Communications Computer Intelligence, Volume:4 Issue: 1, 2021, PP 38 -51Recently, using social networks increases and people propagate their information through this networks. One of the most important challenges in these networks is sentiment attack, in which the attacker spreads rumors to influence users. Therefor rumor detection become important and attracts expanding research attention. Most of the previous works using deep neural networks for rumor detection without special preprocessing but we propose a new method for preprocessing data before learning which improve results. we use LSTM-CNN architecture with cyclical learning rate to detect Persian rumors. Beside that we investigate BERT model for Persian tweets. Our results demonstrate the effectiveness of this approach for English and Persian rumor detection.
Keywords: Deep learning, Preprocessing, Rumor detection, Social network
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.