apriori algorithm
در نشریات گروه علوم انسانی-
In the world of big data and social-media-headed governance and policymaking, data analysis is judged based on the speed and accuracy of execution. This study attempts to modify the existing Association Rule Mining (ARM) techniques by improving the space constraints. Although most of the ARM research is primarily focused on computational efficiency, it has not considered the identification of either the optimal support or the confidence value. Selection of ideal support, as well as confidence value, is vital for the ‘ARM’s quality. However, with the large dataset availability, the space vector poses the latest challenge in processing. Identification of the optimal parameters adapted to the space model is non-deterministic in nature. This research will focus on a Grammatical Evolution (GE) Association Rule Miner (GE-ARM) to identify the optimal threshold parameters for mining quality rules. Simulations are done using the FoodMart2000 dataset, and then, the proposed method is compared against the Apriori, the Frequent Pattern (FP) growth, and the Genetic Algorithms (GA). Simulation results exhibit substantial enhancements in space and rules generated together with time complexity. Compared to Apriori and FP-tree methods, the proposed GE-ARM achieves lesser runtime by around 20%. Such an improvisation would categorically change the dynamics of social media analytics by reducing the space constraints and can have more significant ramifications in policymaking. Therefore, such an improvement is undoubtedly an effective nudge in policymaking.
Keywords: Association Rule Mining (ARM), Social Media, Apriori Algorithm, Frequent Pattern (FP) Growth, Genetic Algorithms (GA), and Grammatical Evolution (GE) -
پژوهش حاضر با هدف ایجاد یک سیستم توصیه گر ارزیاب برای تعیین میزان رضایتمندی ورزشکاران از خدمات بیمه ای با استفاده از تکنیک داده کاوی انجام شد. روش پژوهش، توصیفی و از نوع پیمایشی بود که به لحاظ هدف، کاربردی و از حیث روش جمع آوری اطلاعات، میدانی بود. جامعه آماری پژوهش حاضر ورزشکارانی بودند که به صورت منظم در رشته های گوناگون ورزشی در سال 1397 به ورزش می پرداختند که با استفاده از جدول کرجسی و مورگان (1970) 384 نفر به عنوان نمونه انتخاب شدند. ابزار جمع آوری اطلاعات پرسش نامه پژوهشگرساخته بود که روایی آن به تایید 12 نفر از متخصصان مدیریت ورزشی و بیمه رسید و پایایی آن 86/0 = α به دست آمد. از آزمون کلموگروف-اسمیرنوف برای بررسی چگونگی توزیع داده ها و از قواعد انجمنی و الگوریتم اپریوری برای طبقه بندی و خوشه بندی الگوریتم استفاده شد. تجزیه وتحلیل داده های پژوهش با استفاده از نرم افزارهای اس.پی.اس.اس. نسخه 23 و وکا نسخه 2.9.3 انجام گرفت. یافته های پژوهش نشان داد که بیشترین آسیب دیدگی در بین ورزشکاران در اندام فوقانی و از نوع دررفتگی بود. همچنین، میزان آسیب دیدگی در رشته های تیمی بیشتر بود. نتایج مربوط به رضایتمندی و میزان سهولت از بازپرداخت خسارات به ورزشکاران بیمه شده نشان داد که ورزشکاران رضایت متوسط از خدمات بیمه ورزشی داشتند. همچنین، تضمین، مهم ترین مولفهو پاسخ گویی، کم اهمیت ترین مولفه در بهبود رضایتمندی ورزشکاران از خدمات بیمه بود. نتایج پژوهش بیانگر این است که تعداد مراجعه ورزشکاران برای استفاده از بیمه ورزشی نقش مهمی در رضایتمندی ورزشکاران از خدمات بیمه فدراسیون پزشکی ورزشی دارد.
کلید واژگان: خدمات بیمه ورزشی، تضمین، پاسخ گویی، الگوریتم اپریوریThe purpose of the present study was to Establishing an assessment recommender system to measure athletes' satisfaction with insurance services using Data Mining techniques. The method of this research is descriptive and is of survey type which is objective and applied in terms of collecting field information. The statistical population of the present study was athletes who regularly participated in sports in different sports in 2018, using Morgan and krejcie table 384 as a sample. The data collection tool was a researcher-made questionnaire whose validity was confirmed by 12 Sport management andinsurance specialists and its reliability was α = 0.86. The Kolmogorov-Smirnov test was used to normalize the data and Association Rules and apriori algorithm for classification and clustering of the algorithm. Data analysis was performed using SPSS version 23 and WEKA version 3.9.2. The findings showed that the most common injuries among athletes were upper limbs and dislocation. There is also a higher rate of injury in team disciplines. Results of satisfaction and ease of reimbursement of damages to insured athletes showed that athletes had moderate satisfaction with sports insurance services. as well as ensuring the most important component and accountability was the least important component in improving the satisfaction of athletes from insurance services. The results indicate that the number of athletes referring to the use of sports insurance plays an important role in the satisfaction of athletes with the services of the Sports Medical Federation.
Keywords: Sports insurance services, assurance, Accountability, apriori algorithm -
با توجه به وضعیت کنونی اقتصاد، کارشناسان معتقدند که راه اندازی شرکت های نوآفرین در بستر زیست بوم نوآفرینی می تواند رویکرد موثری برای کشورهای درحال توسعه باشد. با توجه به اینکه تعداد زیادی از شرکت ها شکست می خورند، اما عوامل کلیدی وجود دارد که می تواند شرکت های نوآفرین را در دستیابی به مسیر صحیح تا رسیدن به موفقیت کمک کند. پژوهش پیش رو باهدف شناسایی عوامل موفقیت شرکت های نوآفرین در ایران است که به پیش بینی موفقیت این شرکت ها کمک می کند. یکی از روش های توانمند داده کاوی کشف ارتباط در میان مجموعه ای از داده ها است که حاصل آن کشف یک سری قوانین انجمنی برای شناسایی روابط قوی میان فعالیت های کسب وکار به منظور شناسایی امکان موفقیت است. داده های جمع آوری شده در پژوهش پیش رو شامل 165 مورد شرکت نوآفرین ایرانی است که فعالیت خود را از شتاب دهنده ها آغاز کرده اند. استخراج متغیرهای مستقل پیش بینی کننده موفقیت ابتدا طبق روش تحقیق استخراج شده و سپس به دقت برای هر شرکت نوآفرین وضعیت متغیر مقدار شده است. متغیر وابسته از طریق بررسی وب سایت، نرم افزار کاربردی و... بر مبنای وضعیت فعالیت شرکت نوآفرین ارزیابی شده و در صورت تداوم فعالیت شرکت، شرکت نوآفرین موفق ارزیابی شده است. نهایتا در این پژوهش در فاز اول به کمک الگوریتم های ماشین بردار پشتیبان، درخت تصمیم گیری، k- نزدیک ترین همسایگی و جستجوی فاخته برای انتخاب موثرترین متغیرهای مستقل یا همان عوامل موفقیت شرکت های نوآفرین شده و در فاز دوم به واسطه این عوامل قواعد انجمنی با اپریوری استخراج شده است. نتایج قواعد انجمنی همچنین گویای این موضوع است که در شرکت های نوآفرین بررسی شده انعطاف پذیری و مقیاس پذیری هم زمان باهم دو عامل مهم جهت موفقیت شمرده می شود.
کلید واژگان: الگوریتم اپریوری، الگوریتم فاخته، انتخاب ویژگی، پیش بینی موفقیت، شرکت های نوآفرینInformation management, Volume:5 Issue: 2, 2020, PP 158 -174In the current economy and entrepreneurship situation in developing countries, experts maintain that establishing startup companies proves an efficient and promising approach. In spite of the fact, many startup companies are failed. However, there are key factors, which can help such companies follow the path to success. This research aims to identify the factors, which led to success of startup companies in Iran. Accordingly, one of the important roles of data mining is exploring the relationship between datasets, and getting the result of a series of association-based rules for identifying the strong relations between business activities. The data of this study is collected from a total of 165 Iranian startup companies. The feature's columns included 41 success factors of startup companies addressed in domestic and foreign studies. For the prediction phase, we use the help of support vector machine algorithm, decision tree and k-nearest neighboring to classification. The feature selection technique in order to come up with the most efficient success factor of startup companies is Cuckoo search. Finally, rules are extracted by means of Apriori Algorithms. The results indicate that factors such as, namely, entrepreneurship experience, working duration, skills, type of service or product, target market, Blue Ocean or Red Ocean strategy, flexibility, scalability, customer loyalty, presence or lack of presence in an accelerator, and first-stage of investor are the most important factors that have the greatest effects in a startup's success. Moreover, the extracted results reveal that flexibility, and scalability are considered as two key factors contributing to success of Iranian startup companies.
Keywords: Apriori Algorithm, Classification, Cuckoo Optimization Algorithm, Feature selection, Startup Companies -
هدف
عوامل جوی متعددی بر تعداد بیماران بیمارستان ها اثرگذار است که بدون در نظر گرفتن آنها از امکانات و نیروی انسانی بیمارستان ها، استفاده غیربهینه خواهد شد. هدف از اجرای این پژوهش، کشف دانش پنهان بین عوامل جوی با تعداد بیماران بیمارستان با استفاده از داده کاوی است.
روشدر این پژوهش، ارتباط بین عوامل جوی با تعداد بیماران بیمارستان تخصصی کودکان دکتر شیخ مشهد با استفاده از رده بندی مبتنی بر کاوش قواعد وابستگی چندبعدی بررسی می شود. بدین منظور، پس از آمارگیری جداگانه از تعداد بیماران بخش های نفرولوژی، هماتولوژی، اورژانس و پی آی سی یو این بیمارستان، ارتباط بین تعداد این بیماران با عوامل جوی شامل دمای هوا، رطوبت نسبی هوا، سرعت باد، فشار هوا و آلودگی هوا تحلیل شده است. داده های این پژوهش مربوط به 19 ماه است و با مراجعه به اسناد و مدارک به دست آمده است. برای انتخاب ویژگی، تمام زیرمجموعه های عوامل جوی، جست وجو شده و اثر تمام آنها بر تعداد بیماران با استفاده از رگرسیون خطی ارزیابی شده است. همچنین برای کاوش قواعد، از رده بندی مبتنی بر کاوش قواعد وابستگی چندبعدی که بر اساس الگوریتم شناخته شده آپریوری است، استفاده شده است.
یافته ها:
نتایج به دست آمده گویای قواعدی است که ارتباط بین تعداد متفاوت بیماران در بخش های مختلف بیمارستان را با تغییر عوامل جوی نشان می دهد.
نتیجه گیری:
با استفاده از روش های به کار برده شده در این پژوهش، می توان ارتباط بین عوامل جوی و تعداد بیماران بیمارستان را بررسی کرد. همچنین قواعد به دست آمده به مدیران کمک می کند که برای منابع بیمارستان با توجه به تعداد متفاوت بیماران برنامه ریزی بهینه ای انجام دهند.
کلید واژگان: رده بندی مبتنی بر کاوش قواعد وابستگی چندبعدی، الگوریتم آپریوری، رگرسیون خطی، عوامل جوی، تعداد بیماران بیمارستانObjectiveThere are many climatic factors affecting the number of patients in hospitals which generally tend to make a Non-optimal use of their facilities and human resources.This research is aimed at discovering hidden knowledge between climatic factors and the number of hospital patients using data mining techniques.
MethodsIn this study, the relationship between climatic factors and the number of patients in Dr. Sheikh specialized pediatric hospital of Mashhad is investigated by classification based on multidimensional association rule mining. The number of patients in the nephrology, hematology, emergency and PICU department of this hospital have been considered separately, and consequently the relationship between the number of patients and the climatic factors such as air temperature, relative humidity, wind speed, air pressure and air pollution have been analyzed. This research has analyzed data gathered through a 19 month period and has been obtained by referring to the documents. In this research for feature selection, all subsets of climatic factors are searched and the effect of all subsets on the number of patients are evaluated using linear regression. Also for rule mining is used classification based on multidimensional association rule mining which is based on known Apriori algorithm.
ResultsThe results show different patterns that indicate the relationship between the number of patients in the hospital departments with the climatic factors.
ConclusionThis study is able to help analyze the relationship between the climatic factors and the number of patients in the hospital. Also, the rules will help managers make optimal planning for hospital resources according to the different number of patients.
Keywords: Classification based on multidimensional association rule mining, Apriori algorithm, linear regression, climatic factors, The number of hospital patients -
افزایش حجم چشمگیر داده ها و استفاده از آن ها جهت بهبود کیفیت تصمیمات مدیریتی از معضلات کتابخانه ها و مراکز اطلاع رسانی هست. در این میان ابزار پرتوان داده کاوی می تواند با تحلیل داده ها به منظور پیش بینی و تحلیل تراکنش های کاربران و جلوگیری از اتلاف وقت آن ها در جهت استفاده از اطلاعات مفید از انبوه داده ها به تشخیص الگوهای معتبر و رابطه های نامعلوم بپردازد و کتابخانه ها را در تصمیم گیری های راهبردی و مدیریت اثربخش یاری رساند. این مطالعه با استفاده از رویکرد قوانین انجمنی که یکی از روش های داده کاوی است درصدد تحلیل تراکنش های امانت کاربران و کشف الگوی دسترسی آنان هست. در این مطالعه توصیفی که از نوع مقطعی است، داده های موردنیاز از تراکنش های کاربران کتابخانه ها و مراکز اطلاع رسانی دانشگاه علوم پزشکی همدان جمع آوری شد و پس از اعمال پیش پردازش بر روی این داده ها درنهایت تراکنش های6636 نفر از کاربرآن که به میزان 132833 تراکنش بود به روش سرشماری، طی بازه زمانی سه ساله موردبررسی قرار گرفت. نتایج پژوهش نشان داد که بیشترین تراکنش ها و مراجعات با نمره 4/24 ± 7/20، مربوط به دانشجویان و بیشترین دیرکرد و مدت زمان امانت به ترتیب با نمره 9/1396 ±3/884 و3/1765± 7/885 مربوط به اعضای هیئت علمی بوده است. همچنین قوانین حاصل از الگوریتم Apriori توانست الگوی دسترسی کاربران را بر اساس اطلاعات جمعیت شناختی و همچنین وابستگی موضوعی منابع اطلاعاتی ارائه دهد و به عنوان الگویی مناسب در تحلیل و پیش بینی تراکنش کاربران مورداستفاده قرار گیرد. لذا با بهره گیری از رویکرد قوانین انجمنی می توان اقدام به طراحی سیستم توصیه گر کتاب در کتابخانه ها و مراکز اطلاع رسانی نمود و نیز مدیران و سیاست گذاران می توانند با استفاده از این الگوها و قواعد، گام های تهیه و عرضه منابع اطلاعاتی خود را با نیازهای واقعی اعضاء همسو نمایند و به طور قابل توجهی در امور فراهم آوری، مجموعه سازی، مدیریت و خدمات کتابخانه از آن بهره جویند.کلید واژگان: داده کاوی، قوانین انجمنی، الگوریتم Apriori، کاربران کتابخانه، تراکنش های امانت، کتابخانه های دانشگاهی، دانشگاه علوم پزشکی همدانIncreasing massive amount of data and using them to improve the quality of management decisions are the problems of libraries and information centers. In the meantime, a powerful data mining tool can analyze data to predict and analyze user transactions and stop wasting time to use useful data from among massive data, identify valid patterns and unknown relationships, and help libraries in strategic decision-making and effective management assistance. This study using association rules technique, which is one of the data mining methods, seeks to analyze the transactions of user lending and discover their access pattern. In this cross-sectional descriptive study required data were collected from transactions of users of the libraries and information centers of Hamedan University of Medical Sciences and after preprocessing these data, the total number of 6636 user transactions was 132833 using a census method during a three-year period examined. The results of this study showed that most transactions and referrals with the score of 20.7±24.4 were related to the students and the highest delay and duration of loan respectively with the score of 884.3±1396.9 and 885.7±1765.3 related to the faculty members. Also, the rules derived from the Apriori algorithm showed by providing a users access pattern based on demographic information and determining subject dependence of information resources could be used as an appropriate pattern for analyzing and predicting user transactions. Using association rules technique and implementing the Apriori algorithm, the best rules governing the data set were extracted. Therefore, using association rules technique can be designed as a book advisory system in libraries and information centers. Managers and policy-makers can also use these patterns and rules to align their supply and information resources with the real needs of their members, and can benefit greatly from library procurement, collection, management and services.Keywords: Data mining, Association rules, Apriori algorithm, library users, Library Circulation Records, Academic Libraries, Hamedan University of Medical Sciences
-
در عصر کنونی بررسی ارتباطات میان بازار های مختلف و تاثیرگذاری آنان بر روی یکدیگر به یک امر ضروری برای سرمایه گذاران خرد و کلان تبدیل گشته است. با بررسی ارتباط بین بازارها علاوه بر آن که شخص سرمایه گذار می تواند در خصوص میزان تاثیرات بازارها، اطلاعات خود را بدست آورد، در زمینه شناسایی ریسک های مختلف نیز به او کمک شایانی می نماید. بر حسب اهمیت موضوع، در این مقاله سعی بر بررسی ارتباط میان بازار نفت با بازارهای طلا، دلار، شرکت ها و صندوق های فعال در حوزه انرژی با استفاده از رویکرد نوین قوائد انجمنی و الگوریتم آپریوری، شده است. استفاده از قوائد انجمنی سبب بررسی صریح ارتباطات بین فیلد های پایگاه های داده شده و روابط و وابستگی های متقابل بین مجموعه بزرگی از اقلام داده ای را مشخص می سازد. نتایج این تحقیق حاکی از رابطه مستقیم بازار نفت با شرکت ها و صندوق های فعال در حوزه انرژی و رابطه ای معکوس با شاخص دلار می باشد. همچنین رابطه محسوسی بین بازار نفت و طلا نیز یافت نشد.کلید واژگان: الگوریتم آپریوری، قوائد انجمنی، داده کاوی، بازار نفت، بازار طلاIn the current era, the study of the relationship between different markets and their impact on each other has become a necessity micro and macro investors. By investigating the relationship between markets, in addition to being able to obtain the required information about the impact of the markets, it can also help him in identifying various risks. According to the importance of the subject, in this paper, we have tried to investigate the relationship between the oil market and the gold, dollar markets, companies and energy funds in the field of energy, using the new associative rules approach and the Apriori algorithm. The use of associative rules explicitly explains the relationships between database fields and the relationships and interrelationships between a large set of data items. The results of this study indicate a direct relationship between the oil market and companies active in the energy sector, and the reverse relationship with the dollar index. There was also no significant relationship between the oil and gold market.Keywords: Apriori algorithm, Association rules, Data mining, Oil market, Gold market
-
قواعد همباش (انجمنی) یکی از محبوب ترین مدل های حوزه داده کاوی به شمار می رود. در الگوریتم های کلاسیک حوزه قواعد همباش کاوی، مانند اپریوری، از حداقل دامنه پشتیبانی قاعده واحد استفاده می شود؛ در حالی که در رویکردهای جدیدی که تلاش کرده اند الگوریتم های کلاسیک را بهبود بخشند، مانند ام. اس. اپریوری، از حداقل دامنه پشتیبانی قاعده چندگانه استفاده می شود که در هر دو حالت، کاربر موظف است حداقل دامنه پشتیبانی از قاعده را تعیین کند. در نظر بگیرید کاربر قصد اعمال الگوریتم اپریوری را بر پایگاه داده ای با میلیون ها تراکنش داشته باشد؛ به طور قطع کاربر نمی تواند دانش لازم را درباره تمام تراکنش های موجود در پایگاه داده داشته باشد، بنابراین نمی تواند حد آستانه مناسبی را تعیین کند. در این پژوهش، برای اولین بار با استفاده از داده های فازی سازی شده و تکنیک میانگین گیری، روشی ارائه شده است که در آن، الگوریتم اپریوری به صورت کاملا خودکار حداقل دامنه پشتیبانی از قاعده را تعیین می کند. نتایج شبیه سازی شده روی نمونه ای واقعی نشان داد این رویکرد عملکرد مطلوب تری نسبت به الگوریتم اپریوری کلاسیک دارد.
کلید واژگان: الگوریتم اپریوری، الگوهای پرتکرار، خوشه بندی فازی، دامنه پشتیبانی از قاعده، قواعد همباشApriori algorithm is the most popular algorithm in association rules mining. One of the problems the Apriori algorithm is that the user must specify a minimum support threshold. Consider that a user wants to implement the Apriori algorithm on a database with millions of transactions; Users will not have the necessary knowledge about all the transactions in the database and therefore cannot determine an appropriate threshold. The aim of this paper is improved the Apriori algorithm to automatically determine the minimum support. To achieve this, we will try to use fuzzy logic before of using the Apriori algorithm on data contained in the database, put the data in different clusters and try the offer to user the most appropriate threshold automatically. We hope this will be any rule that may be of interest not lost, because of inappropriate threshold specified by the user and also not extracted any rule useless.Keywords: Apriori Algorithm, Association Rules, Fuzzy Clustering, Support -
با روند خصوصی سازی در صنعت بانکداری کشور و رشد بی سابقه رقابت در تکنولوژی های بانکداری، هر روزه بر اهمیت نگهداری از مشتریان کنونی و جذب مشتریان جدید افزوده می شود. نگهداری مشتریان یک استراتژی ارزشمند است که سودآوری بلند مدت و موفقیت سازمان ها را تضمین می کند. در این مطالعه، با استفاده از تکنیک های داده کاوی مدلی دو مرحله ای برای شناسایی ویژگی های گروه های مختلف مشتریان سپرده کوتاه مدت بانک معرفی گردیده است. در مرحله نخست، از الگوریتم K-mean جهت شناسایی گروه های مشتریان بر مبنای میزان سودآوری آن ها بهره گرفته شده است. چون در K-mean تعداد بهینه خوشه ها بستگی به مسئله مورد نظر دارد، بنابراین از طریق الگوریتم خوشه بندی Twostep تعداد بهینه خوشه ها معین می گردد. پس از تعیین گروه های مختلف مشتریان از لحاظ میزان سودآوری آن ها برای بانک، در مرحله دوم، با استفاده از الگوریتم Apriori قواعد وابستگی هر خوشه استنتاج می گردد. نتایج حاصل از این کاوش، به بانک ها کمک خواهد کرد تا درک بهتری از انتظارات کنونی و آتی مشتریان داشته باشند. و از این طریق تدوین استراتژی های بازاریابی برای جذب و نگهداری از مشتریان بر مبنای سودآوری آن ها تسهیل می گردد.کلید واژگان: داده کاوی، مدیریت ارتباط با مشتری، تحلیل RFM، سودآوری مشتری، نگهداری از مشتریDeregulation within the banking industry's and unprecedented growth competition in newtechnologies, every day the importance of keeping current customers and attract new customers are added. This study presents a two-step model to identify characteristics of different groups of bank customers, based on their profitability. The new criteria introduced to analyze the profitability of each customer. And then, this criterion has been used for clustering customers based on their profitability.Because in k-mean algorithm there is not a general rule for the optimal number of clusters and the number of clusters depend on the problem, therefore firstly with applied by Two-step clustering algorithm determine the optimal number of clusters. In this study, Customers clustering to 3 groups as golden, silver, and bronze customers. Then, by using K-mean algorithm different groups of customers are identified. And with help of Apriori algorithm association rules of each cluster is inference. The result of this exploration, help to banks have better understanding of current and future customer expectations. And through this may be facilitated develop of marketing strategies to attract and retain profitable customers.Keywords: Clustering, Customer Profitability Analysis, Data Mining, Customer Relationship Management, RFM Analysis, K, mean Algorithm, Apriori Algorithm, Customer Retention, Customer Lifetime Value
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.