به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

data mining

در نشریات گروه مدیریت
تکرار جستجوی کلیدواژه data mining در نشریات گروه علوم انسانی
  • رئوف امامی رازلیقی، احمدعلی اوموئی میلان*، صادق عابدی

    شناسایی دقیق عوامل موثر بر کیفیت محصولات می تواند به بهبود فرآیندهای تولید، کاهش ضایعات، افزایش بهره وری و در نهایت ارتقاء رضایت مشتریان منجر شود . این پژوهش با هدف شناسایی عوامل موثر بر کیفیت محصولات صنعتی و تحلیل روابط میان این عوامل با استفاده از تکنیک های داده کاوی و خوشه بندی انجام شد. داده های مرتبط با فرآیند تولید صنعتی شامل متغیرهایی نظیر خلوص مواد اولیه، نرخ خطای دستگاه، دما، فشار، سرعت تولید و تجربه نیروی انسانی شبیه سازی و پیش پردازش شدند. برای تحلیل داده ها، الگوریتم های K-Means، خوشه بندی سلسله مراتبی و DBSCAN به کار گرفته شدند . نتایج نشان داد که خلوص مواد اولیه، نرخ خطای دستگاه، و دما از جمله مهم ترین عوامل تاثیرگذار بر کیفیت محصولات هستند. همچنین، خوشه هایی با خلوص مواد اولیه بالا (>95%) و نرخ خطای دستگاه کمتر از 2% بهترین کیفیت را نشان دادند، در حالی که خوشه هایی با خلوص پایین و سرعت تولید بالا کیفیت ضعیفی داشتند. این پژوهش الگویی جامع برای تحلیل و بهینه سازی کیفیت محصولات صنعتی ارائه می دهد که می تواند در صنایع مختلف نظیر خودروسازی، داروسازی، و صنایع غذایی مورد استفاده قرار گیرد.

    کلید واژگان: کیفیت محصولات صنعتی، داده کاوی، تحلیل خوشه بندی، بهینه سازی تولید
    Raoof Emami Razliqi, Ahmadali Oumouei Milan*, Sadegh Abedi

    Accurate identification of factors affecting product quality can lead to improved production processes, reduced waste, increased productivity, and ultimately improved customer satisfaction. This study aimed to identify factors affecting the quality of industrial products and analyze the relationships between these factors using data mining and clustering techniques. Data related to the industrial production process, including variables such as raw material purity, machine error rate, temperature, pressure, production speed, and human experience, were simulated and preprocessed. K-Means, hierarchical clustering, and DBSCAN algorithms were used to analyze the data. The results showed that raw material purity, machine error rate, and temperature are among the most important factors affecting product quality. Also, clusters with high raw material purity (>95%) and machine error rate less than 2% showed the best quality, while clusters with low purity and high production speed had poor quality. This research provides a comprehensive model for analyzing and optimizing the quality of industrial products that can be used in various industries such as automotive, pharmaceutical, and food industries

    Keywords: Industrial Product Quality, Data Mining, Clustering Analysis, Production Optimization
  • لیلا حیدری، نجف آقایی*، حسین اکبری یزدی
    مقدمه

    پردازش زبان طبیعی یکی از زیر شاخه های مهم هوش مصنوعی است که به رایانه کمک می کند تا زبان انسان را درک و تفسیر کند. هدف این پژوهش شناسایی و درک احساسات ابراز شده توسط هواداران فوتبال در توییتر، به ویژه پس از رویدادهای خاص مانند لیگ برتر و ارائه مدل بر اساس سطح هویت تیمی آنان بود.

    روش پژوهش: 

    پژوهش حاضر به لحاظ هدف از نوع پژوهش های کاربردی و از نظر ماهیت از نوع پژوهش های توصیفی تحلیلی است. جامعه آماری شامل کلیه توییت های منتشر شده در توییتر توسط هواداران باشگاه های حاضر در لیگ برتر فوتبال 1401-1400 ایران بود. از اینرو 5560 توییت بعد از 120 بازی نیم فصل دوم لیگ برتر فوتبال جمع آوری شد. واژگان خاص و طبقه بندی کننده احساسات بر پایه هوش مصنوعی (فرهنگ لغت وادر) در محیط پایتون به عنوان ابزار تحلیل احساس استفاده شد. مدل رگرسیونی جهت پیش بینی احساسات هواداران بکار گرفته شد.

    یافته ها

    نتایج پردازش زبان طبیعی نشان داد احساسات مثبت بیشترین احساس بیان شده توسط هواداران بود. مدل رگرسیونی احساسات هواداران را بر اساس عواملی مانند سطح هویت تیمی و نتیجه برد و باخت بازی پیش بینی کرد و مدل مفهومی پژوهش تایید شد.

    نتیجه گیری

    این مطالعه می تواند مورد استفاده مدیران رسانه ای و بازاریابی تیم هایی که به دنبال درک عمیق تری از پویایی های عاطفی هواداران فوتبال هستند؛ قرار گیرد.

    کلید واژگان: داده کاوی، لیگ برتر، محتوای تولید شده توسط کاربر، هوش مصنوعی
    Leila Heidari, Najaf Aghaei *, Hossein Akbari Yazdi
    Introduction

    Natural Language Processing (NLP) is a vital subfield of artificial intelligence that helps computers understand and interpret human language. The purpose of this research was to identify and understand the sentiments expressed by football fans on Twitter, especially after special events such as the Premier League, and to present a model based on their team identification level.

    Methods

    The current research is applied research in terms of its purpose and descriptive-analytical research in terms of its nature. The statistical population included all the tweets generated on Twitter by the fans of the clubs present in the 2021/22 Iranian Premier Football League. Therefore, 5560 tweets were collected after 120 games of the second-half season of the Premier Football League. Special Lexicon and sentiment classifiers based on artificial intelligence (VADER dictionary) were used in a Python environment as a sentiment analysis tool. A Regression model was used to predict fans'' sentiments.

    Results

    The results of natural language processing showed that positive sentiments were the most expressed emotions by fans. The regression model predicted fans'' sentiments based on factors such as the level of team identification and the result of winning and losing the game, and the conceptual model of the research was confirmed.

    Conclusion

    This study can be used by media and marketing managers of teams who seek a deeper understanding of the emotional dynamics of football fans.

    Keywords: Artificial Intelligence, Data Mining, Premier League, User-Generated Content
  • Mojtaba Maleki Chubari, Zahra Rajabi Mohaddam

    The purpose of this research is to investigate the effect of androgenic characteristics of managers on the way companies fulfill their social responsibilities. To achieve this research goal, we reviewed the data of 143 companies admitted to the Tehran Stock Exchange between 2012 and 2021, which spans nine consecutive years. Then, to examine and analyze the data, we used statistical methods such as regression analysis of combined (panel) data and data mining methods like neural networks and decision trees. We applied Charnes and Cooper's function (1962) to ascertain corporate social responsibility (CSR). Results suggested that the androgenic characteristics of managers had significant positive effects on fulfilling companies' social responsibilities. This research was the first to study the androgenic feature as an independent variable associated with managers' appearance. In other words, in this research, for the first time, a non-financial variable that is related to a person's appearance has been investigated in relation to the way companies fulfill their CSR.

    Keywords: Androgenic Characteristics, Behavioral Finance, Corporate Social Responsibility (CSR), Data Envelopment Analysis (DEA), Data Mining
  • احسان الله خوشخوی نیلاش، منصور اسماعیل پور*، بهروز بیات، علیرضا اسفندیاری مقدم، عرفان حسن نایبی

    بانک ها برای تسهیلات سرمایه ثابت از فرایند های پیچیده و طولانی مدت شامل مراحل، نقاط کنترل و تایید زیاد برخوردارند. اینگونه فرایندها در ایجاد و توسعه واحدهای صنعتی، معدنی و گردشگری از اهمیت فزاینده ای برخوردارند. تجزیه و تحلیل مداوم اینگونه فرایندها برای ارتقاء، بهبود مستمر و کسب دانش از انها اهمیت فزاینده ای دارد. هدف اصلی تحقیق حاضر ارائه چارجوب روش شناختی جامع بر پایه فرایندکاوی با ترکیب با داده کاوی در خصوص تجزیه و تحلیل فرایندهای تسهیلات سرمایه ثابت است. روش شناسی بکاررفته در پژوهش حاضر برگرفته از تکنیک ها و مفاهیم فرایندکاوی و داده کاوی بر پایه داده های رخداد سیستم تسهیلات، بانکی فعال در ایران است. این روش شامل نه فاز شروع، آماده سازی، بازرسی، کاوش و تحلیل، ارزیابی، تحلیل چند بعدی فرایندی، پیش بینی، بررسی نتایج و بهبود است. هر کدام از فازها شامل چندین مولفه و به صورت تکرارشونده است. از جمله نتایج پژوهش حاضر استخراج فرایند واقعی، شناسایی گلوگاه ها، مراحل پرتکرار در نمونه و دارای فراوانی و گونه های فرایند است. افزون بر این شناسایی شعب و افراد دارای بیشترین نقش و ویژگی های داده ای موثر بر کاهش زمان پرداخت تسهیلات، تحلیل فرایند از ابعادی ماننداستان از دیگر یافته ها بود و نشان داد تجزیه و تحلیل استانی دانش خوبی در اختیار می گذارد. یکی از ابتکارات تحقیق حاضر استفاده از داده کاوی برای پیش بینی زمان پرداخت تسهیلات بود. در مقایسه روش های متنوع، الگوریتم درخت تصمیم گیری با دقت 72 درصد بهترین عملکرد را داشت.در نهایت علاوه بر کشف انحرافات، بر مبنای ایجاد داده های رخداد و تحلیل آن، فرایند بهبود یافته استخراج شد،که نشان از بهبود 67 درصدی بود.

    کلید واژگان: فرایندهای سرمایه ثابت، چارچوب روش شناختی، داده های رخداد، فرایندکاوی، داده کاوی
    Ehsan Allah Khoshkhoy Nilash, Mansour Esmaeilpour *, Behrooz Bayat, Alireza Isfandyari Moghaddam, Erfan Hassannayebi

    Banks have complex and long-term processes for facilities, including many stages, control points and approvals. Continuous analysis of such processes is increasingly important for continuous improvement and gaining knowledge from them. The main goal of the present research is to provide a comprehensive methodological framework based on process mining and data mining regarding the analysis of fixed capital facility processes. The method used in the present research is derived from the techniques of process mining and data mining based on the event log of the facility system, an active bank in Iran. This method includes nine phases of initiation, preparation, inspection, exploration and analysis, evaluation, multi-dimensional analysis, prediction, review of results and improvement. Among the results of the present research is the extraction of the real process model, identification of bottlenecks, frequent activities in a case and all cases and process variant. In addition to this identification of branches and people with the most important roles and based on data features in reducing the time of payment of facilities, the analysis of the process from dimensions such as the province was one of the other findings. One of the initiatives of the present research was the use of data mining to predict the payment time of facilities. In the comparison of various methods, the decision tree algorithm had the best performance with 72% accuracy. In addition to identifying deviations, based on the creation of event log and its analysis, the improved process of extracting which showed a 67% improvement.

    Keywords: Fixed Capital Processes, Methodological Framework, Event Log, Process Mining, Data Mining
  • Farnoosh Bagheri, Reza Kamran Rad *, Morteza Darvishi

    The adoption of unhealthy lifestyles by individuals can lead to the development of various health conditions, including hypertension, high blood fat levels, and diabetes, posing significant risks to their well-being. This study focuses on examining the lifestyle of patients with diabetes and high blood fat levels in the city of "bordekhoon," conducted at Health Care Centers. Diabetes is a global health concern that is rapidly increasing and is associated with substantial costs. By applying data mining techniques, early detection of diabetes can be achieved, which can help prevent the progression of the disease and mitigate complications such as cardiovascular issues, vision problems, and kidney diseases. Nowadays, data mining-based approaches are employed to predict diabetes and hypertension, aiming to enhance early diagnosis accuracy and obtain valuable insights. In this paper, a combination of classification techniques (Ensemble Method) is used to predict and identify two types of diabetes. Factors such as gender, diet, fasting plasma glucose (FPG), physical activity, cigarette consumption, age, genetic predisposition, and body mass index (BMI) are modeled and analyzed using IBM SPSS Modeler 18 software. The accuracy of the employed techniques is ultimately presented.

    Keywords: Data Mining, Mixed Classification Techniques, Healthcare System, Diabetes
  • رویا آباده، علیرضا حسن زاده*، شعبان الهی

    مهمترین اهداف این تحقیق عبارت از ارزیابی و مصورسازی نقشه دانش داده کاوی در تحقیقات کووید-19، شناسایی اجزا و روابط مختلف میان مفاهیم داده کاوی در حوزه های مختلف مطالعات کووید-19 می باشد. این تحقیق از نظر هدف کاربردی و از نوع توصیفی، تحلیلی با بهره مندی از روش تحلیل محتوا و فنون متن کاوی انجام خواهد شد. یکی از یافته های تحقیق حاضر این است که دسته ای از تحقیقات به «ساختار و ماهیت انسانی بیماری» مرتبط بود. دسته ای دیگر از تحقیقات به مجموعه عوامل مربوط به بزرگسالی می پرداخت که می توانست زمینه ساز جذب ویروس کووید-19باشد. در بخش هم نویسندگی بیشترین میزان همکاری میان امریکا و هند بوده است. نقشه داده کاوی کووید-19 بر اساس مدلسازی موضوعی مشتمل بر ساختار و ماهیت انسانی بیماری، زمینه و ساختار ویروس، پیشگیری پاندمیک، و علوم کامپیوتری و هوش مصنوعی است. در این تحقیق با توجه به استفاده از ابزارهای فن آوری اطلاعات و تکنیک متن کاوی حجم وسیعی از تحقیقات مورد مطالعه قرار گرفته است. نقشه دانش ارائه شده به تفکیک موضوعی تحقیقات و کشف اطلاعات در هر مجموعه می پردازد لذا امکان مقایسه بین گروهای موضوعی خاص را امکانپذیر می کند. در این تحقیق، اجزای مفاهیم داده کاوی در حوزه های مختلف مطالعات کووید-19 در شش بعد مورد بررسی قرار گرفت. در بعد ششم نقشه داده کاوی کووید-19 بر اساس مدلسازی موضوعی ارایه گردید.

    کلید واژگان: نقشه دانش، داده کاوی، کووید19، متن کاوی، مصورسازی
    Roya Abadeh, Alireza Hassanzadeh *, Shaban Elahi

    The most important objectives of this research are to evaluate and illustrate the knowledge map of data mining in covid-19 research, to identify the various components and relationships between data mining concepts in different fields of covid-19 studies. The research method is applied and descriptive. In this research, we utilize the content analysis and text mining techniques. One of the findings of the current research is that a group of researches was related to the "structure and human nature of the disease". Another group of research looked at the set of factors related to adulthood that could be the basis for the absorption of the Covid-19 virus. In the co-authoring section, the highest amount of cooperation was between America and India. The data mining map of Covid-19 is based on thematic modeling including the structure and human nature of the disease, the background and structure of the virus, pandemic prevention, and computer science and artificial intelligence. In this research, according to the use of information technology tools and text mining techniques, a large amount of research has been studied. The presented knowledge map deals with the thematic separation of the researches and information discovery in each collection, so it enables the possibility of comparison between specific thematic groups. In this research, the components of data mining concepts in different fields of Covid-19 studies were examined in six dimensions. In the sixth dimension, the data mining map of Covid-19 was presented based on thematic modeling.

    Keywords: Knowledge Map, Data Mining, COVID-19, Text Mining, Visualization
  • رویا چشمی خانی، محمدعلی افشار کاظمی *، عباس طلوعی اشلقی، عزت الله اصغرزاده

    اعطای تسهیلات، بخش مهمی از عملیات هر بانک را تشکیل می دهد و این قسمت از فعالیتهای بانکی از لحاظ اقتصادی حائز اهمیت است. بانک ها با عملیات اعتباری خود موجبات انتقال منابع را از اشخاصی که مستقیما در بانک سرمایه گذاری کرده اند به کسانی که به پول نیاز دارند فراهم می کنند و این اشخاص با بازپرداخت اقساط خود باعث می شوند گروهی دیگر از مردم بتوانند از این منابع استفاده کنند. عدم بازپرداخت به موقع تسهیلات باعث راکد شدن منابع بانک و در بلندمدت باعث رکود اقتصادی کشور می شود. نظارت بر نحوه ی صحیح تخصیص منابع و بهداشت اعتباری امری بسیار مهم می باشد زیرا در صورت تخصیص نامطلوب منابع بانک و پرداخت بی اصول تسهیلات، بانک ها توان بازپرداخت سپرده های سپرده گذاران را نداشته و با ورشکستگی مواجه خواهند گردید. با بررسی پژوهش های سالهای اخیر در زمینه بانکداری مشخص گردید اکثر پژوهش ها ترکیب بهینه ی سبد سرمایه گذاری بیشتر در بازار سرمایه پرداخته و کمتر پژوهشگری به بحث و بررسی ترکیب بهینه در بازار پولی توجه نموده است. بیشتر پژوهش هایی که از روش های تحقیق در عملیات و آماری استفاده گردیده در خصوص مسائل صنعتی بوده و کمتر در مسائل مالی از بحث های تحقیق در عملیات استفاده شده است. در پرتفوی بهینه ترکیب تسهیلات یا سرمایه گذاری ها اکثرا از الگوریتم ژنتیک بهره مند شده وکمتر از دیگر روش های فازی در شرایط عدم اطمینان استفاده شده است. بنابراین در این پژوهش به مدلسازی بهبود پرداخت تسهیلات با استفاده از مدلسازی شبکه های عصبی کانولوشنی و CNN-LSTM ، پرداخته شده است.

    کلید واژگان: تسهیلات، داده کاوی، خوشه بندی، یادگیری عمیق، شبکه عصبی CNN، شبکه عصبی CNN-LSTM
    Roya Cheshmikhani, Mohammad Ali Afshar Kazemi *, Abbas Toluie Ashlaghi, Ezatollah Asgharizadeh

    Granting facilities is an important part of every bank's operations. This part of banking activities is economically important. With its operations, banks can provide the transfer of resources from those that have directly invested to those who need money, this repayment makes another people use these resources. Failure to repay facilities on time will cause the bank's resources to stagnate and in the long will cause the country's economic recession. It is important to monitor the correct allocation of resources because if bank resources are used and unfounded payments are made, the banks will not be able to pay the depositors and will become bankrupt. By examining the researches in the field of banking, it was found that most of the researches have focused on the optimal combination of the investment portfolio in the capital market, and less researchers have paid attention to the discussion of the optimal combination in the money market. Most of the researches that used operational and statistical research methods were related to industrial issues, and less in financial issues and operational research discussions were used. In the optimal portfolio of the combination of facilities or investments, mostly the genetic algorithm has been used and less than other fuzzy methods have been used in the conditions of uncertainty. Therefore, in this research, the improvement of facility payment modeling has been addressed by using convolutional neural networks and CNN-LSTM modeling.

    Keywords: Facilities, Data Mining, Deep Learning, Clustering, CNN, CNN-LSTM
  • محمدمهدی پورسعید*، محمدعلی رحمانی کوهبنانی، سعید ده یادگاری
    هدف

    برندسازی شخصی یکی از موضوعات جدید در زمینه برندسازی است. افراد برای دستیابی به برند شخصی پایدار و قدرتمند در یک تخصص، به شناخت اهداف مشخص و راه کارهای مناسب نیاز دارند. به تازگی شبکه های اجتماعی، به خصوص اینستاگرام، در حوزه برندسازی رشد بسیار زیادی داشته اند. با توجه به ضرورت پژوهش در زمینه برندسازی شخصی و اهمیت شبکه اجتماعی اینستاگرام در برندسازی شخصی، پژوهش حاضر با هدف بررسی عوامل موثر بر برندسازی شخصی موزیسین های فعال با رویکرد داده کاوی در شبکه اجتماعی اینستاگرام انجام شده است.

    روش

    صفحات شخصی افراد صاحب برند شخصی، در شبکه اجتماعی اینستاگرام که در حوزه تخصصی نوازندگی فعال هستند، جست وجو و 1145 پست در بازه زمانی یک ساله (1 دسامبر 2019 تا 1 دسامبر 2020) بررسی شد. پس از جمع آوری داده ها، برای تجزیه وتحلیل آن ها و عملیات داده کاوی، از نرم افزار نایم استفاده شد و الگوی درخت تصمیم از آن به دست آمد.

    یافته ها

    این پژوهش تاثیر عوامل موثر بر برندسازی شخصی موزیسین ها با 11 ویژگی به عنوان ورودی (دنبال کنندگان، نوع پست، محتوای پست، زمینه یا تم پست، کپشن، تگ، هشتگ انگلیسی، هشتگ فارسی، مجموع هشتگ ها، روز پست، ماه پست) روی کامنت و لایک که از نوع ویژگی های خروجی تعریف شده اند، بررسی می شود. این الگو بیان می کند که عواملی از قبیل نوع پست، محتوای پست، زمینه آن، تگ، هشتگ های فارسی و انگلیسی و همچنین، ماه و روز انتشار پست بر مشارکت کاربران و آگاهی از برند شخصی تاثیر دارد.

    نتیجه گیری

    در پژوهش حاضر، میزان مشارکت در اینستاگرام با میزان لایک و کامنت سنجیده شده است و مقدار مشارکت، آگاهی از برند را نشان می دهد. در با توجه به نتایج این پژوهش، نوازندگان قادر خواهند بود که با شناسایی عوامل موثر بر برند شخصی خود در اینستاگرام، عملکرد بهتری به نمایش بگذارند و باعث رشد و توسعه آن شوند.

    کلید واژگان: اینستاگرام، برندسازی شخصی، برندسازی نوازندگان، داده کاوی، شبکه های اجتماعی
    Mohammadmehdi Poursaeed *, Mohammadali Rahmani Kouhbanani, Saeid Dehyadegari
    Objective

    Personal branding is an emerging area in the field of branding, where individuals can build a lasting personal brand by aligning their goals with effective strategies. Given the profound need for research in personal branding as well as the significant role of social networks in this process, this study aims to explore the factors influencing the personal branding of active musicians through a data mining approach on Instagram.

    Methodology

    The research targets individuals who have established themselves as brands in specialized and scientific fields on Instagram, including experts and musicians. For this study, 10 prominent musicians on Instagram were selected for analysis. In total, 10 personal Instagram pages of musicians were analyzed. The sampling method used was judgment sampling, and the database consisted of an Excel file containing 1,150 records. According to previous studies and expert opinions, data were examined from these personal pages over one year, from December 1, 2019, to December 1, 2020, during which 1,150 Instagram posts were analyzed. The number of comments and likes is identified as a key factor in the development of the personal brand of the studied individuals, reflecting the level of awareness and interaction with the personal brand. Consequently, the study examines the effect of 11 different features on the likes and comments of the posts. After data collection, Naim software was used for data analysis and data mining operations, and the decision tree model was extracted, accordingly.

    Findings

    The decision tree analysis reveals that factors such as post type, content, context, tags, and hashtags in Persian and English, as well as the month and day of publication, significantly impact user engagement and personal brand awareness. In this study, user engagement on Instagram is measured by likes and comments, which lead to brand awareness. The findings identified eleven input features—followers, post type, post content, context, caption, tags, English hashtags, Persian hashtags, total hashtags, day of post, and month of post—that influence comments and likes. These findings provide musicians with insights into the factors influencing their brand on Instagram, allowing them to effectively manage, develop, and enhance their personal brands. This, in turn, can lead to increased user engagement and greater audience awareness.

    Conclusion

    The results indicate that musicians can improve their performance on Instagram by focusing on specific factors that influence their personal brands. Image posts receive the most likes, while videos garner the most comments i.e. to increase audience engagement and brand awareness, musicians should prioritize posting images and videos. Posts featuring personal content, memories, entertainment, and non-concert performances attract the most likes. It is recommended that non-concert performance posts feature movie-style backgrounds to boost likes and comments.

    Keywords: Data Mining, Instagram, Personal Branding, Musician Branding, Social Networks
  • عباس ملکی، صادق عابدی *، علیرضا ایرج پور

    در پاسخ به همه گیری کووید-19، دولت ها در سراسر دنیا محدودیت های شدید تردد را اعمال نموده و سناریوهای متفاوتی از کاهش انتشار آلاینده های ناشی از منابع ترافیکی را ارائه کردند. با اعمال محدودیت های تردد ناشی از همه گیری کووید-19، انتظار می رفت تغییراتی در غلظت آلاینده های هوا مشاهده شود. از این رو، تصمیم بر آن شد که تغییرات آلاینده های هوا به عنوان یکی از زیرمجموعه های شاخص زیست محیطی توسعه پایدار شهری در زمان همه گیری کووید-19 مورد بررسی قرار گیرد. به این منظور، ابتدا داده های مذکور در چهارکلان شهر مشهد، اصفهان، شیراز و اراک جمع آوری و سپس پردازش و پاکسازی می شوند. پس از آن یک الگوریتم پیشنهادی مبتنی بر روش های یادگیری ماشین ارائه می گردد. بر روی ویژگی های انتخاب شده، روش های یادگیری ماشین: درخت تصمیم، جنگل تصادفی، ماشین بردار پشتیبان، شبکه بیزین و شبکه عصبی پرسپترون اعمال می شود. بررسی ها نشان داد که مدل پیش بینی با استفاده از درخت تصمیم و جنگل تصادفی بهترین عملکرد را برای هر دو معیار فراخوانی و صحت داشت. نتایج تحقیق نشان داد که تاثیر محدودیت ها بر روی غلظت آلاینده ها در شهرهای مختلف، متفاوت می باشد. همچنین نتایج بیانگر این است که به طور کلی اعمال محدودیت های ترافیکی در دوره همه گیری، تاثیر قابل توجه و محسوسی در کاهش غلظت آلاینده های هوا نداشته است. همچنین بررسی ها نشان داد که اعمال محدودیت های ترافیکی و به تبع آن کاهش احتمالی برخی از آلاینده های هوا ارتباطی با مرگ و میر ناشی از کووید-19 ندارد.

    کلید واژگان: آلودگی هوا، توسعه پایدار، داده کاوی، کووید-19، محدودیت های تردد
    Abbas Maleki, Sadegh Abedi *, Alireza Irajpour

    In response to the Covid-19 pandemic, governments around the world have imposed severe traffic restrictions and presented different scenarios to reduce emissions from traffic sources. By applying the traffic restrictions caused by the Covid-19 epidemic, it was expected to see changes in the concentrations of air pollutants. Therefore, it was decided that the changes of air pollutants as one of the subsets of the environmental index of sustainable urban development during the covid-19 epidemic will be investigated. For this purpose, the aforementioned data are first collected in the four metropolitan cities: Tehran, Karaj, Ahvaz and Tabriz, and then processed and cleaned. After that, a proposed algorithm based on machine learning methods is presented. Machine learning methods decision tree, random forest, support vector machine, Bayesian network and perceptron neural network are applied to the selected features. Investigations showed that the prediction model using decision tree and random forest had the best performance for both recall and accuracy criteria. The research results showed that the effect of restrictions on the concentration of pollutants in different cities is different. Also, the results show that, in general, the application of traffic restrictions during the epidemic period did not have a significant and noticeable effect in reducing the concentration of air pollutants. Also, the studies showed that the application of traffic restrictions and consequently the possible reduction of some air pollutants are not related to the deaths caused by Covid-19.

    Keywords: Air Pollution, Covid-19, Data Mining, Sustainable Development, Traffic Restriction
  • محمدصادق بهروز، محمدعلی افشارکاظمی*، عادل آذر، عزت الله اصغری زاده

    هدف پژوهش، ارائه مدل پیش بینی ریسک های بحرانی و اولویت دار شبکه انتقال گاز و انتخاب اقدام کنترلی بهینه از نظر زمان و هزینه است. در این پژوهش، پیش بینی ریسک ها با الگوریتم های داده کاوی بر اساس متدلوژی CRISP انجام شده و برای خوشه بندی از الگوریتم K-Means, Kohnen, Two Step و در ادامه ، از الگوریتم های شبکه عصبی، درخت C.5، نزدیک‏ترین همسایگی و بردار پشتیبان برای طبقه بندی بهره گیری شده است. اقدام کنترلی بهینه با فرایند تصمیم مارکوف انتخاب و مسئله تصمیم گیری بر اساس استقرای بازگشتی برنامه ریزی پویای احتمالی زمان محدود مدل‏سازی و شبیه سازی شده و تحلیل حساسیت و اعتبارسنجی مدل صورت پذیرفته است. بر اساس نتایج، در 56/97 درصد  از داده های موردتوافق، یادگیری ایجاد شده و صحت و اعتبار مدل داده کاوی، 92/86 درصد برآورد شده است. همچنین 13 ریسک، بحرانی تشخیص داده شده اند و نتایج شبیه سازی مدل ریاضی نیز، نرخ بهبود را 92 درصد در هزینه و 77 درصد در زمان اجرای اقدام کنترلی نشان می دهد.

    کلید واژگان: ارزیابی ریسک، مدلسازی ریاضی، داده کاوی، فرایند تصمیم مارکوف، شبکه انتقال گاز
    Mohammad Sadegh Behrouz, Mohammad Ali Afsharkazemi*, Adel Azar, Ezzatollah Asgharizadeh

    The aim of the research is predicting critical risks of the gas transmision network and choosing optimal corrective action in optimal time and cost. Risks were predicted with data-mining algorithms based on the CRISP methodology. K-Means, Kohnen, Two Step algorithm and Neural Network Algorithms, C.5 Tree, Nearest Neighbor and Support Vector have been used for clsutering and classification. Markov decision process is also used to select the optimal control action.Decision making problem is based on back down induction in stochastic dynamic programming in the limited time of modeling and simulation and sensitivity analysis and model validation. Based on results, in 97.56% of the agreed data, learning was created and the accuracy and validity of the data mining model was estimated at 86.92%. Also, 13 risks have been identified as critical, and the simulation results show a 92% improvement rate in the cost and 77% in the control action implementation time.

    Keywords: Risk Assessment, Mathematical Modeling, Data Mining, Markov Decision Process, Gas Transmission Network
  • سجاد خانی پردنجانی*، نوید محمدی
    توسعه فناوری هایی همچون اینترنت اشیاء، موجب شده تا به صورت گسترده ای، حجم عظیمی از داده توسط انسان ها و ماشین ها تولید شود. علاوه بر این، توسعه کاربران فضای مجازی و اینترنت نیز، بستری فراهم نموده تا نیازها و نظرات مشتریان و کاربران محصولات و خدمات، به سادگی ثبت و قابل بهره برداری شوند. این داده ها فرصتی است برای طراحی محصول، خدمت و سیستم به صورت داده محور می باشد. فرآیند طراحی محصولات و خدمات به صورت سنتی، نیازمند گردآوری داده ها به صورت پیمایش است که امری زمان بر و پرهزینه استدوره طراحی و توسعه محصول پشت درب های بسته واحد تحقیق و توسعه شرکت ها به پایان رسیده است. لازمه باقی ماندن شرکت ها در عصر پرتلاطم حاضر، بهره گیری از دانش موجود در دینای اطراف و حرکت به سمت نوآوری باز و خلق ارزش مشترک است. مشتری و مصرف کننده نهایی، مهمترین بخش زنجیره ارزش هر کسب و کاری است و یکی از مهمترین منابع اطلاعاتی در این میان، ترجیحات و نظرات مشتریان است. این منابع عموما در بستر اینترنت، سایت های خرید و فروش آنلاین، شبکه های مجازی و پایگاه های مشابه دیگری بارگذاری و ذخیره می شوند. با توجه به اینکه محتوای این نظرات عموما به صورت متن هستند، نیاز به ابزارهای متن کاوی برای استخراج اطلاعات از آن ها، احساس می شود. بر این اساس، این پژوهش با هدف بررسی و مرور سیستماتیک ادبیات حوزه توسعه و طراحی و محصولات مشترک بر مبنای داده های متنی انجام شده است. بدین منظور از دو رویکرد مرور سیستماتیک، Bibliometric Analysis و Systematic mapping review استفاده شده است.
    کلید واژگان: توسعه محصول جدید، تجربه مشتری، نظرات مشتری، داده کاوی، تحلیل محتوا
    Sajad Khani Pordanjani *, Navid Mohammadi
    The scope of technologies such as the Internet of Things has caused a large amount of data to be produced by humans and machines. In addition, the development of virtual space and Internet users also provides a platform so that the needs and opinions of customers and users of products and services can be easily recorded and exploited. This data is an opportunity to design products, services and systems in a data-oriented manner. The product design and development period behind the closed doors of the companies' research and development unit has ended. Companies must survive in the current turbulent era, take advantage of the knowledge available in the surrounding world, move towards open innovation, and create shared value. The customers and final consumers are the most important part of the value chain of any business, and one of the most important sources of information among them is their preferences and reviews. These resources are generally uploaded and stored on the Internet, online shopping and selling sites, social media, and other similar databases. Accordingly, it will be vital to use the reviews and experiences of customers in the process of developing new products. Considering the importance of this issue, this research has used bibliometric and systematic literature review.
    Keywords: New Product Development, Customer Experience, Customer Review, Data Mining, Content Analysis
  • مریم فرهمند*، سجاد شکوهیار، ندا فرحبخش
    پایداری به طور گسترده یکی از چالش های بزرگی است که امروزه چالش برانگیز است. انسان ها برای ایجاد تعامل اجتماعی، اقتصادی و زیست محیطی به حمل و نقل پایدار اهمیت می دهند. لذا راه حل های پایدار در صنعت حمل و نقل شهری فرصت آفرینی کرده و در پی آن بحث هایی در مورد وسائط حمل و نقل عمومی، تاکسی های تلفنی، اینترنتی و خودروی اشتراکی صورت می گیرد. از طرفی از آنجا که شهروندان با پیدایش و توسعه شبکه های اجتماعی، می توانند آزادانه و بدون اینکه به پرسش های از پیش تعریف شده مقید باشند، نظرات خود را بیان کنند، تجزیه وتحلیل شبکه اجتماعی، فرصتی برای سازمان ها شده تا بتوانند با صرف هزینه و زمان کمتری نسبت به نظرسنجی، اولویت های بخش عظیمی از مشتریانشان را درک کنند. شبکه های ملی منبعی ارزان و با ارزش برای دسترسی به نظریات مشتریان و آنچه در ذهن آنها وجود دارد می باشد. تحقیق حاضر تلاش کرده است با استفاده از داده کاوی و متن کاوی در شبکه اجتماعی به ترسیم ذهنیت مشتریان و استفاده کنندگان از سیستم حمل و نقل بپردازد به گونه ای که عوامل اثر گذار بر گرایش افراد در استفاده از هرگونه حمل و نقل شهری بررسی و اولویت بندی نموده و راهبردی برای بهبود پایداری سیستم حمل و نقل شهری ارائه نماید.
    کلید واژگان: حمل و نقل پایدار، حمل و نقل شهری، شبکه اجتماعی، داده کاوی، تحلیل احساسات
    Maryam Farahmand *, Sajjad Shokouhyar, Neda Farahbakhsh
    IntroductionSustainability is one of the considerable challenges we widely face these days. Transformation into a more vibrant life provides a city for social, economic, and environmental interaction in which people can prosper, and hence sustainable transportation comes into play. Accordingly, public concerns about sustainable solutions in the urban transportation industry have increased, followed by discussions on public transportation, taxi apps, and ride-sharing. On the other hand, with the increasing emergence and development of social networks, customers can freely express their opinions without being bound by predefined issues. Moreover, social network analytics is an opportunity for organizations to understand the priorities of a large portion of their customers while spending less time and money compared to traditional research methods such as surveys. Twitter is now an accessible and valuable resource to access customers' feedback and what is on their minds. The present study has tried to identify the mentality of users of a transportation system by using data mining and text mining on Twitter so that the factors affecting the tendency of people to use any urban transportation mode have been investigated and prioritized. This article provides a model for improving the sustainability of urban transportation systems.MethodologyGiven that conducting field research or quantitative studies is very expensive, and the information obtained in this way is limited to certain customers, analyzing the contents produced by users on social media is a necessity for any organization. Compared to conventional methods of communication, social media have unique features. This study used Twitter since it has the highest growth rate among all social media platforms. Using the sentiment analysis, we determine what aspects of the organizations' management should improve to ensure their sustainable performance. Twitter sentiment analysis provides an easy and reliable way for businesses to monitor people's feelings towards their brands, businesses, and stake holders.This research is of a based type and tries to design and develop a model for the purpose of evaluating sustainable transportation. used as data related to transportation and collected all the required information sources using hashtags and with the help of text mining technique which is also known as text analysis and sought to extract high-quality and desired information in the form of Structured use and then with the help of sentiment analysis, we explored the recognition of positive, negative and neutral emotions about transportation issues in the texts. In fact, by analyzing emotions, opinions, feelings, behaviors, tendencies and emotions written with a written language, we analyze them and proceed to the final analysis. The result of the analysis provides sustainable transportation tools for use by policy makers and transportation network investors.Results and DiscussionThe results of this analysis show that the price factor, according to Twitter users' feedback, has the greatest impact on choosing the type of transportation while maintaining stability. Other main and important factors besides "price", according to the statistics published in the analysis, are "air pollution", "traffic", "vehicle fuel", "vehicle model", "driver age", "salary" and passenger age, employment and usage, routing, parking and driver gender, and vehicle monitoring are ranked next in terms of the number of Twitter users, respectively.ConclusionContrary to the idea, in addition to important issues such as price, pollution, traffic and parking, car model, driver's age and even driver's gender and car cleanliness are also important for passengers. On the other hand, the salary and age of the passenger are also important for drivers. The placement of these indicators together leads to the belief that in today's society, as the society grows older, the complexity and tastes also increase, but on the other hand, the exchange of information becomes easier with the advancement of technology. The results of this study can be provided to investors, policy makers and customers of taxi applications to improve the sustainable transportation system. With the help of these results, investors design and invest in sustainable transportation systems and marketing programs according to the characteristics expected by customers and advance their advertising. Customers' willingness to use such a sustainable system will guide policy makers to develop sound policies regarding investors, customers, and citizens, and identify the needs of transportation customers to increase their satisfaction. Knowing the indicators, tastes and priorities of people in using means of transportation can be an opportunity for entrepreneurs and investors for entrepreneurship and investment in the field of urban transportation.
    Keywords: Sustainable Transportation, Urban Transportation, social network, Data mining, Sensetive analysis
  • Mohammad Hossein Rahmati, Farshid Namamian *, Seyed Reza Hasani, Afshin Baghfalaki
    Brand resilience knowledge helps companies maintain customer trust and strengthen relationships through proper planning and strategies. This research was conducted to model brand resilience in Iran's handwoven carpet industry using background knowledge and data mining in critical conditions. In brand resilience, knowledge analysis is considered highly significant for identifying key factors and effective patterns. This mixed research has been done based on qualitative data techniques in NVIVO software and quantitative data mining method in MATLAB software. 12 people were selected purposefully from carpet industry experts. Interviews were analyzed, coded, according to Strauss and Corbin method, and compared with the data mining method of the trained model and the MLP method. Based on the proposed model, 6 categories, 15 core codes, and 41 primary codes were identified. The proposed model could predict 98% brand resilience in crisis conditions. This model can help brands to maintain their business interests and implement appropriate strategies for active development, internal resistance, creative support, and production under sanctions. Furthermore, this model can help brands strengthen their capabilities and brand value, and identity in critical situations.
    Keywords: brand resilience, Brand Knowledge, Crisis Conditions, Background knowledge, Data mining
  • عباس ملکی، صادق عابدی *، علیرضا ایرج پور

    با اعمال محدودیت های ناشی از همه گیری کووید-19، به نظر می رسد تغییراتی در غلظت آلاینده های CO، O3،NO ، NO2، SO2، PM2.5، PM10 و AQI در دوره های قبل و بعد از همه گیری دیده شود. از این رو، تغییرات آلاینده های هوا و محدودیت های ترافیکی به عنوان یکی از زیرمجموعه-های شاخص زیست محیطی توسعه پایدار شهری در بازه زمانی 01/11/1396 تا 29/12/1400 در ایستگاه های تحت نظارت شهر تهران مورد بررسی قرار می گیرد. ابتدا داده ها جمع آوری، پردازش و پاکسازی می شوند. بر روی ویژگی های موثر انتخاب شده با استفاده از روش بهینه سازی ازدحام ذرات، روش های یادگیری ماشین شامل درخت تصمیم، جنگل تصادفی، ماشین بردار پشتیبان، شبکه بیزین و شبکه عصبی پرسپترون اعمال می شود. بررسی ها نشان داد که مدل پیش بینی با استفاده از درخت تصمیم و جنگل تصادفی بهترین عملکرد را برای هر دو معیار صحت و فراخوانی داشت. نتایج تحقیق نشان داد که غلظت آلاینده ها در دوران کووید-19 نسبت به قبل از آن، در بعضی از ایستگاه ها افزایشی و در برخی دیگر کاهشی می باشد و همچنین اعمال محدودیت های ترافیکی در دوره همه گیری، تاثیر قابل توجه و محسوسی در کاهش غلظت آلاینده های هوا نداشته است. همچنین با بررسی روند مرگ و میر در دوره همه گیری مشخص شد که کاهش و یا افزایش آلاینده ها ارتباط معناداری با روند مرگ و میر ناشی از کووید-19 ندارد.

    کلید واژگان: داده کاوی، درخت تصمیم، توسعه پایدار، محدودیت های ترافیکی، کووید-19
    Abbas Maleki, Sadegh Abedi *, Alireza Irajpoor

    By applying the restrictions caused by the Covid-19 pandemic, it seems that changes in the concentrations of pollutants CO, O3, NO, NO2, SO2, PM2.5, PM10 and AQI can be seen in the periods before and after the epidemic. Therefore, the changes of air pollutants and traffic restrictions are investigated as one of the sub-categories of environmental indicators of sustainable urban development in the period of 2018/01/21 to 2022/03/20 in the stations under the supervision of Tehran city. First, the data is collected, processed and cleaned. Machine learning methods including decision tree, random forest, support vector machine, Bayesian network and perceptron neural network are applied to select the effective features using the particle swarm optimization method. Investigations showed that the prediction model using decision tree and random forest had the best performance for both precision and recall criteria. The results of the research showed that the concentration of pollutants in the period of Covid-19 compared to before, is increased in some stations and decreased in others, and also the application of traffic restrictions during the epidemic did not have a significant and noticeable effect in reducing the concentration of air pollutants. Also, by examining the trend of deaths during the epidemic period, it was found that the decrease or increase of pollutants has no significant relationship with the trend of deaths caused by Covid-19.

    Keywords: Data Mining, Decision Tree, Sustainable Development, Traffic Restrictions, Covid-19
  • فریبا کریمی، آمنه خدیور*، فاطمه عباسی

    امروزه با رشد روز افزون اینترنت و گسترش سریع فضای مجازی و ویژگی های چشمگیر آن از جمله افزایش سرعت تبادل اطلاعات، ، دسترسی آسان و رایگان به اطلاعات ، متنوع بودن موضوعات و غیره، باعث شده افراد بیشتر زمان خود در فضای مجازی به ویژه فعالیت در شبکه های اجتماعی اختصاص دهند، در این راستا نظرات ثبت شده توسط کاربران در شبکه های مجازی رشد روزافزونی داشته و اهمیت بسیاری پیدا کرده؛ بر این اساس، هدف پژوهش حاضر تحلیل و بررسی نظرات کاربران توییتر درباره ی فناوری واقعیت مجازی با بهره گیری از روش های یادگیری ماشین و رویکرد مبتنی بر واژه نامه می باشد که با جمع آوری حدود 1 میلیون توییت در زمینه فناوری واقعیت مجازی توسط خزشگر وب به پیش پردازش داده ها شامل حذف ایست واژه ها و لینک ها، بن واژه سازی پرداخته شد، سپس مدل سازی موضوعی تخصیص پنهان دیریکله روی داده ها اجرا شد و توسط امتیاز انسجام درجه تشابه معنایی بین کلمات و تمایز بین موضوعات را به دست آمد و تعداد موضوعاتی که بیشترین امتیاز را داشت انتخاب شد و داده ها در 9 موضوع دسته بندی شدند، برای ارزیابی مدل نیز از معیار سرگشتگی استفاده شد که مقدار آن 44/9- به دست آمد که نشان از کارایی مدل دارد. سپس موضاعات مرتبط با فناوری واقعیت مجازی نام گذاری شد .

    کلید واژگان: داده کاوی، متن کاوی، فناوری واقعیت مجازی، مدل سازی موضوعی تخصیص پنهان دیریکله
    Fariba Karimi, Ameneh Khadivar *, Fatemeh Abbasi

    In recent years, the rapid growth of virtual space has made people devote more of their time in virtual space, especially to social networks, which can be attributed to the remarkable features of virtual space; including increasing the speed of information exchange, easy and free access to information and variety of knowledge topics. In this regard, the opinions recorded by users in virtual networks have grown day by day and have become very important, and extracting the opinions and feelings of users' opinions for more informed decision-making is of great help to businesses, on the other hand, virtual reality technology in the past few decades It has undergone technical changes and improved immersion and the feeling of remote presence; This technology is used in various fields such as education, tourism, health, sports, entertainment, architecture and construction, etc. The increasing progress of virtual reality technology has caused many businesses to operate in this field, but due to changes Continuous market and the need for timely information, companies should use differentiation and growth strategies, in this regard, they need to ask users' opinions and in line with that, try to grow and improve their business, considering that Users' comments are textual, and reading and summarizing them is time-consuming and difficult. Based on this, the aim of the current research was to categorize comments related to virtual reality technology using machine learning methods and a dictionary-based approach. Therefore, about one million tweets in the field of virtual reality technology were collected by the web crawler, and after data preprocessing, 480,432 samples remained in the data, then Dirichlet's hidden allocation topic modeling was implemented on the data. This modeling separated different topics by examining the distribution of words in tweets; The tweets whose distribution of words were similar were placed into a topic and the number of topics with the highest coherence score was selected, the number of topics 9 had higher coherence and the data were grouped into 9 topics, so once again the Dirichlet hidden allocation modeling was set to 9. The topic was done, with this the tweets were grouped into 9 different topics. To evaluate the model, considering that we had a probability distribution, the confusion criterion was used, the value of which was -9.44, and the coherence score was used for the degree of semantic similarity between words and the distinction between subjects, and the result was 0.47. The lower the confusion criterion and the higher the coherence score, the more efficient the model is. With the help of keyword weights obtained by Dirichlet hidden allocation modeling and examining at least 5 different tweets from each topic, 9 topics related to virtual reality technology were identified: "New Technology", "Creation and Make", "Technological Business", "Education", "Virtual Games", "Progress", "Gadget", "Metaverse", and "Indiegame", the topics were analyzed with the help of several graphs. We found that the number of neutral comments on topics such as "New Technology" and "Metaverse" is more than positive and negative comments, which indicates the lack of sufficient information or the lack of use of these technologies, and it is necessary for businesses in this field, to try more in this regard, in the same way, if we observe the graph of "Virtual Games" and "Technological Business", we can see that it changes almost with the same ratio in different years, in the sense that this The two graphs are related, in fact, businesses should keep in mind that the factors affecting these two issues are the same, but users pay more attention to the issue of "Virtual Games", as a result, if the creators of "Technological Business" Focus specifically on "Virtual Games", they will grow more due to the more attention of users, also the creators of games should consider that "Virtual Games" are a topic of more attention than "Indiegame". Is. In the subjects of "Education" and "Gadget", users lost their attention to these subjects in the field of virtual reality over time, in fact they showed their attention to other subjects, so it is better for businesses that operate in this field to take measures To advertise and attract users or change their user area if there is no growth.

    Introduction

    Constant changes in the market and the need for timely information force companies to use differentiation and growth strategies appropriate to the needs of customers. (Sánchez, Folgado-Fernández, & Sánchez, 2022). Companies can check and analyze their customers' opinions through microblogging sites (Facebook, Twitter, etc.) and finally improve the desired products or services (Ahmad, Aftab, Bashir, & Hameed, 2018). Today, users express their opinions and feelings and review products in online social networks. Therefore, user comments and the analysis of these comments have become a valuable resource for businesses (Kim et al., 2015; Loureiro et al., 2019).
    Virtual reality and augmented reality have undergone technical developments in the past few decades and have improved immersion and the feeling of remote presence. Several examples of applications of such techniques can be found in stores, the tourism industry, hotels, restaurants, etc. (Loureiro, Guerreiro, & Ali, 2020). Due to the constant changes in the market and the need for timely information, companies should use differentiation and growth strategies, nowadays, due to the rapid evolution of the Internet, instead of collecting their opinions through time-consuming and expensive methods such as questionnaires and interviews, etc., they express in the context of social networks, which is very useful for businesses in their development, and they can measure the feelings of customers towards products and services, and understand the needs of users, and finally make appropriate and appropriate decisions in the direction of adopt growth, but in order to use the produced content correctly, text mining and sentiment analysis techniques should be used, which has not been researched in Iran so far. Analysis of users' opinions and feelings about virtual reality technology can help businesses that operate in the field of metaverse, virtual game production, virtual education, virtual tourism, etc., to make better decisions and plans.

    Literature Review

    Social media generates a large amount of real-time social signals that can provide new insights into human behavior and emotions. People around the world are constantly engaged with social media. (Al-Samarraie, Sarsam, & Alzahrani, 2023).
    On the other hand, the amount of data is increasing day by day. Almost all institutions, organizations and business industries store their data electronically. A huge amount of text is circulating on the Internet in the form of digital libraries, repositories, and other textual information such as blogs, social media networks, and emails (Sagayam, Srinivasan, & Roshni, 2012).
    Topic modeling is one of the most powerful techniques in text mining for data mining, discovering hidden data and finding relationships between data and textual documents (Jelodar et al., 2017).
    The technological advances of the last century have confronted societies with new realities that have indisputably improved daily life, making it more convenient and interesting. In recent decades, technology using virtual reality and wearable devices have had a significant impact in the fields of education, tourism, health, sports, entertainment, architecture and construction, etc. (Kosti et al., 2023).
    Virtual reality is a technology that allows a user to interact with a computer-simulated environment, whether that environment is a simulation of the real world or an imaginary one. With virtual reality, we can experience the most frightening and overwhelming situations with safe play and a learning perspective (Mandal, 2013). Most people are curious about the possibilities and future of new technologies, considering the various applications it is supposed to offer such as virtual meetings, learning environments and many others, however, there are also concerns about potential negative effects. because real world signals can be transmitted in the virtual world. In this regard, people express their feelings in different social networks (Bhattacharyya et al., 2023).

    Methodology

    According to the main goal of the research, which is to classify comments related to virtual reality technology using machine learning methods and a dictionary-based approach, therefore, about one million tweets in the field of virtual reality technology were collected by the web crawler and After data preprocessing, 480,432 samples remained in the data, then Dirichlet hidden allocation thematic modeling was implemented on the data. By examining the distribution of words in tweets, this modeling tries to separate different topics by detecting the distribution of words; The tweets whose distribution of words are similar were put into a topic, and the number of topics with the highest score was selected, the number of topics 9 has higher coherence, and the data was grouped into 9 topics, so once again, Dirichlet hidden allocation modeling was applied 9 topics were done, whereby the tweets were grouped into 9 different topics. Considering that we have a probability distribution, the confusion criterion was used to evaluate the model. The lower the confusion criterion and the higher the coherence score, the more efficient the model is. With the help of keyword weights obtained by Dirichlet hidden allocation modeling and examining at least 5 different tweets from each topic, 9 topics related to virtual reality technology were identified: "New Technologies", "Creation and Make", "Technological Business", "Education", "Virtual Games", "Progress", "Gadget", "Metaverse" and "Indiegame" were named.

    Discussion and Conclusion

    In this research, by examining topics in different years, we observed that the topic of "Progress" was the most popular topic among users from 2017 to the end of 2021, in early 2022, this topic gave way to "Metaverse", currently "Metaverse" is one of the most popular topics being discussed by users. Businesses in the field of virtual reality should strive for the attractiveness of "Metaverse" and attract users. Likewise, if we observe the "Virtual Games" and "Technological Business" graphs, we can see that they change with almost the same ratio in different years, meaning that these graphs are related to each other, in fact, business and keep in mind that the factors affecting these two issues are the same, but in the case of "Virtual Games" it has more effects, and if "Technological Businesses" specifically focus on virtual games, they will grow more due to the greater attention of users. had Similarly, "Indiegame" which have had a series of changes but in recent years have had a declining trend and then no change, now the creators of these games should check, and in general "Virtual Games" are a more interesting topic than "Indiegame". In the subjects of "Education" and "Gadget" it has been decreasing since the beginning of 2017, which shows that users lost their attention to these subjects in the field of virtual reality over time, in fact to other topics showed their attention, so it is better for businesses that are active in this field to take measures to advertise and attract users, or change their user field if there is no growth.

    Keywords: Data mining, Text Mining, Virtual Reality Technology, Topic Modeling, Latent Dirichlet Allocation
  • مژده سالاری، رضا رادفر*، مهدی فقیهی

    هدف این تحقیق بررسی عوامل موثر در پیش بینی عملکرد تحصیلی دانشجویان مقطع کارشناسی در طبقه بندی چهار کلاسه می باشد. برای دستیابی به این هدف، مطالعه از روش داده کاوی کریسپ پیروی می کند. مجموعه داده ها از سیستم آموزشی ناد برای مقطع کارشناسی در دانشگاه شاهد برای ورودی سال های 1390 تا 1400 استخراج شده است. تعداد 1468 رکورد در داده کاوی استفاده شده است. ابتدا شاخص های موثر بر عملکرد تحصیلی دانشجویان استخراج شد. مدلسازی با استفاده از ابزار رپیدماینر9.9 انجام شد. برای بهبود عملکرد طبقه بندی و دقت پیش بینی رضایت بخش ، از ترکیبی از تجزیه و تحلیل مولفه اصلی همراه با الگوریتم های یادگیری ماشین و تکنیک های انتخاب ویژگی و الگوریتم های بهینه سازی استفاده می کنیم. عملکرد مدل های پیش بینی با استفاده از اعتبارسنجی متقاطع 10 برابری تایید شده است. نتایج نشان داد که الگوریتم درخت تصمیم بهترین الگوریتم در پیش بینی عملکرد دانشجویان با دقت 84.71 درصد است. این الگوریتم به درستی فارغ التحصیلی 77.88 درصد از دانشجویان عالی و 85.26 درصد از دانشجویان خوب و 84.69 درصد از دانشجویان متوسط و 85.96 درصد از دانشجویان ضعیف را بر اساس معدل نهایی پیش بینی کرد.متغیر معدل دیپلم بیشترین تاثیر را در پیش بینی عملکرد دانشجویان دارد.

    کلید واژگان: پیش بینی عملکرد دانشجویان، داده کاوی، یادگیری ماشینی، مدلسازی، بهبود کیفیت آموزش
    Mozhdeh Salari, Reza Radfar *, Mahdi Faghihi

    The purpose of this research is to investigate the effective factors in predicting the academic performance of undergraduate students in the classification of four classes. To achieve this goal, the study follows the CRISP data mining method. The data set was extracted from the NAD educational system for the bachelor's degree in Shahed University for the entry of the years 2011 to 2021. 1468 records were used in data mining. First, the effective features on students' academic performance were extracted. Modeling was done using Rapidminer9.9 tool. To improve classification performance and satisfactory prediction accuracy, we use a combination of principal component analysis combined with machine learning algorithms and feature selection techniques and optimization algorithms. The performance of the prediction models is verified using 10-fold cross-validation. The results showed that the decision tree algorithm is the best algorithm in predicting students' performance with an accuracy of 84.71%. This algorithm correctly predicted the graduation of 77.88% of excellent students, 85.26% of good students, 84.69% of medium students, and 85.96% of weak students based on the final GPA.

    Keywords: student performance prediction, Data mining, Machine Learning, Modeling, improving the quality of education
  • Aliakbar Vakili, Mahdi Bagheri *, Sirajuddin Mohebi, Kobra Haji Alizadeh
    This research aims to identify the knowledge management infrastructure due to reducing employee absenteeism based on data mining. Examining the status and reports of employees using data recording systems, creating information dashboards, and applying data mining techniques is important for the transparency of the mental state of employees. The mixed research method (qualitative-quantitative) has been done in two phases. The first phase was conducted with a qualitative-inductive approach using the Delphi method and a semi-structured interview tool. In the second step, codes were grouped in a common axis and 13 axis codes based on the similarity and distinction between the extracted codes. The interview sample was 10 people selected using the purposeful sampling method. In the second phase, the quantitative research method was data mining; Then, according to the research literature and experts' opinion, the researcher-made questionnaire was designed with a five-point Likert scale. The data mining technique is based on neural networks and decision trees in Rosseta and Weka software. The results showed that knowledge management can increase the quality of organizational processes based on data, increase the empowerment of employees, and reduce absenteeism. The knowledge obtained from the data mining of organizational information dashboards is important for strengthening the mental health systems of employees and increasing productivity.
    Keywords: knowledge management infrastructure, Absenteeism, employee, Data mining
  • رضا جهانبازی*، ارسلان ویسی سرچمی
    با ظهور فناوری های دیجیتال و ظهور خدمات رسانه های نمایشی VOD، چشم انداز صنایع فرهنگی و خلاق دستخوش دگرگونی چشم گیری شده است. به ویژه، بازار این رسانه ها در ایران شاهد رشد قابل توجهی بوده و طیف متنوعی از محتوا را ارائه می دهد تا مطابق با اولویت های مخاطبان فارسی زبان در سراسر جهان باشد. این پژوهش به سنجش اجتماعی رسانه های نمایشی VOD ایرانی و نظرکاوی آن ها در میان کاربران فارسی توییتر می پردازد. هدف این مطالعه با استفاده از روش های داده کاوی، علوم اجتماعی محاسباتی، تحلیل احساسات و تحلیل مضمون، سنجش تاثیر و پویایی VODهای ایرانی در چارچوب توییتر فارسی است. از طریق تحلیل مضمون، شش مضمون فراگیر استخراج شد: 1. سویه های تاریک رسانه های نمایشی VOD، 2. نظارت صداوسیما بر رسانه های نمایشی VOD، 3. فراگیری و محبوبیت رسانه های نمایشی VOD و عوامل موثر آن، 4. فیلتر و تعطیلی رسانه های نمایشی VOD، 5. حضور بازیگران در رسانه های نمایشی VOD پس از پاییز سال 1401، و 6. خرید اشتراک رسانه های نمایشی VOD. این مضامین منعکس کننده دیدگاه ها و گفتگوهای متنوع پیرامون VODهای ایرانی است.با استفاده از روش های محاسباتی علوم اجتماعی، تجزیه و تحلیل احساسات و نظرسنجی کاربران، بینش عمیق تری در مورد سنجش اجتماعی VODهای ایرانی به دست می آید. تحلیل احساسات توییت ها نشان داد که احساسات منفی نسبت به این رسانه ها در میان کاربران توییتر فارسی 59%، احساسات مثبت 39%، و احساسات خنثی 2% بودند. علاوه بر این، از تکنیک های داده کاوی برای بررسی درصد توجه نسبت به VODهای ایرانی و احساسات کاربران نسبت به هر یک از آنها استفاده شد که فیلیمو مورد توجه ترین VOD ایرانی بود و بیشترین توجه کاربران را به خود جلب کرده است.
    کلید واژگان: رسانه های نمایشی VOD، صنایع فرهنگی و خلاق، توییتر، علوم اجتماعی محاسباتی، داده کاوی
    Reza Jahanbazi *, Arsalan Veisi Sarchami
    With the advent of digital technologies and the emergence of VOD media services, the landscape of cultural and creative industries has undergone a dramatic transformation. In particular, the market of these media in Iran has witnessed significant growth and offers a diverse range of content to meet the preferences of Persian-speaking audiences around the world. This research deals with the social assessment of Iranian VOD media and their opinion analysis among Persian Twitter users. The purpose of this study is to measure the influence and dynamics of Iranian VODs in the framework of Persian Twitter using data mining methods, computational social sciences, sentiment analysis and theme analysis. Through thematic analysis, six overarching themes were extracted: 1. Dark strains of VOD, 2. Broadcasting monitoring of VOD, 3. Popularity of VOD and its effective factors, 4. Filter and closure of VOD, 5. Actors appearing on VOD after riots in 1401, and 6. Purchasing VOD subscriptions. These themes reflect diverse views and conversations about Iranian VODs.Using social science computational methods, sentiment analysis, and user surveys, a deeper insight into the social measurement of Iranian VODs is obtained. Sentiment analysis of tweets showed that negative sentiments towards these media among Persian Twitter users were 59%, positive sentiments 39%, and neutral sentiments 2%. In addition, data mining techniques were used to investigate the percentage of attention towards Iranian VODs and the feelings of users towards each of them.
    Keywords: VOD, Cultural, Creative Industries, Twitter, Computational Social Sciences, Data mining
  • Ali Zare Abarghouei, MohammadReza Dalvi *, Zahra Dashtlaali

    The current research was conducted to apply knowledge extraction in the classification of jobs to identify the key role players using a mixed method (qualitative and sufficient data). The application of expert systems or decision support systems based on organizational data is increasing in the selection and hiring of personnel. The data was derived from in-depth and semi-structured interviews with 17 subject experts in bank human resources, who were selected based on purposeful sampling.Data analysis was done based on the Strauss and Corbin model in the form of open, axial, and selective coding in the Atlas TI8 software. The results showed that the classification of jobs for the key role players in public and private banks includes causal conditions (requirement of talent substitution, human resource management developments, and organizational challenges), intervening conditions  (organizational limitations and fear and resistance), and contextual conditions (strengthens and drivers) strategies (developmental, supportive and creating) and short-term and long-term consequences are among the components of the job classification model for the key role players in public and private banks. Next, based on the database with the CART method, the data mining of job classification was done. Regarding the performance of the model, it showed variance values of 311.92 and a risk value of 288.19. The predictions in the model explained 28.9% of the differences observed in the variable "employment status of A employees' category".

    Keywords: Job classification, leading players, CART method, Knowledge extraction, Data mining
  • نادره سادات راست قلم، رویا محمدعلی پور اهری*، احمد رضا شکرچی زاده، عاطفه امین دوست

    امروز در اکثر صنایع کشور از ابزار کنترل کیفیت آماری جهت بهبود کیفیت محصولات استفاده می نمایند ولی با توجه به حجم بالای داده ها در حال حاضر نیاز به ابزاری قوی تر می باشد که بتواند فرایندهای کنترل کیفیت آماری را تحت کنترل قرار دهد با توجه به گستردگی الگوریتم های داده کاوی در این تحقیق از ابزار داده کاوی جهت بهبود فرایند استفاده شده است و همچنین هدف اصلی تحقیق ارایه روشی جهت کشف اقلام معیوب قبل از تولید کامل آنها و جلوگیری از تولید اقلام معیوب می باشد. روش کار بدین گونه است که در ابتدا پایگاه داده خرابی تشکیل می گردد و پس از جمع آوری داده های کنترل کیفیت، با استفاده از الگوریتم های مختلف درخت تصمیم دقت پیش بینی کیفیت قطعات تعیین می گردد و در مرحله بعد با استفاده از مدل-تحلیل پوششی داده ها هر یک از قوانین ارزیابی می گردد و در نهایت با استفاده از قوانینی که در هر ایستگاه کاری صدق می کنند ارزیابی ایستگاه های کاری انجام می گیرد. بر این اساس در این پژوهش جامعه آماری تمامی قطعات تولیدی موج گیر تیبا در سال 1398 می باشد. خصیصه ها شامل 9 ایستگاه کاری هستند، بر اساس نتایج بدست آمده بهترین الگوریتم در پیش بینی خرابی C5 می باشد و مهم ترین خصیصه های انتخابی توسط آن تعیین می گردند عبارت اند از: کیفیت خنک کاری، کیفیت سوراخ کاری و کیفیت برش. همچنین ارزیابی قوانین نیز با استفاده از مدل تحلیل پوششی داده ها انجام شده و مهم ترین قوانین استخراج شده اند و در نهایت بر اساس حل مدل دستگاه هایی که در اولویت اصلاحی برای سال جاری قرار گیرند عبارتند از: رولینگ، لحیم کاری و برش کاری می باشد.

    کلید واژگان: داده کاوی، کنترل کیفیت، کاهش ضایعات، مدل تحلیل پوششی داده ها، الگوهای درخت تصمیم
    Nadereh Sadat Rastghalam, Roya Roya M.ahari*, AhmadReza Shekarchizadeh, Atefeh Amindost

    Today, most industries and factories in the country use statistical quality control tools to improve product quality, but due to the high volume of data, now there is a need for a more powerful tool that can control statistical quality control processes, given the extent Data Mining Algorithms and Its Ability to Discover Rules In this research, data mining tools have been used to improve the quality control process and increase it. The method is that first the failure database is formed and after collecting quality control data, the accuracy of predicting the quality of parts is determined using different decision tree algorithms and in the next step using Modeling, Coverage Analysis, Data Each of the rules is evaluated, and finally the workstations are evaluated using the rules that apply to each workstation. Accordingly, in this study, the statistical population of all Tiba surge arresters in 1398. The attributes consist of 9 workstations. Based on the results, the best algorithm in predicting C5 failure is and the most important attributes selected by it are determined as the most important attributes, which are: Cooling quality, hole quality and cutting quality. Also, the evaluation of the rules has been done using the model of cover analysis, data and the most important rules have been extracted. Finally, based on solving the model, the devices that will be in the corrective priority for the current year are: Rowling , Solder and cutting

    Keywords: data mining, data envelopment analysis model, decision tree patterns, quality control, Waste Reduction
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال