apriori algorithm
در نشریات گروه کتابداری و مدیریت اطلاعات-
In the world of big data and social-media-headed governance and policymaking, data analysis is judged based on the speed and accuracy of execution. This study attempts to modify the existing Association Rule Mining (ARM) techniques by improving the space constraints. Although most of the ARM research is primarily focused on computational efficiency, it has not considered the identification of either the optimal support or the confidence value. Selection of ideal support, as well as confidence value, is vital for the ‘ARM’s quality. However, with the large dataset availability, the space vector poses the latest challenge in processing. Identification of the optimal parameters adapted to the space model is non-deterministic in nature. This research will focus on a Grammatical Evolution (GE) Association Rule Miner (GE-ARM) to identify the optimal threshold parameters for mining quality rules. Simulations are done using the FoodMart2000 dataset, and then, the proposed method is compared against the Apriori, the Frequent Pattern (FP) growth, and the Genetic Algorithms (GA). Simulation results exhibit substantial enhancements in space and rules generated together with time complexity. Compared to Apriori and FP-tree methods, the proposed GE-ARM achieves lesser runtime by around 20%. Such an improvisation would categorically change the dynamics of social media analytics by reducing the space constraints and can have more significant ramifications in policymaking. Therefore, such an improvement is undoubtedly an effective nudge in policymaking.
Keywords: Association Rule Mining (ARM), Social Media, Apriori Algorithm, Frequent Pattern (FP) Growth, Genetic Algorithms (GA), and Grammatical Evolution (GE) -
با توجه به وضعیت کنونی اقتصاد، کارشناسان معتقدند که راه اندازی شرکت های نوآفرین در بستر زیست بوم نوآفرینی می تواند رویکرد موثری برای کشورهای درحال توسعه باشد. با توجه به اینکه تعداد زیادی از شرکت ها شکست می خورند، اما عوامل کلیدی وجود دارد که می تواند شرکت های نوآفرین را در دستیابی به مسیر صحیح تا رسیدن به موفقیت کمک کند. پژوهش پیش رو باهدف شناسایی عوامل موفقیت شرکت های نوآفرین در ایران است که به پیش بینی موفقیت این شرکت ها کمک می کند. یکی از روش های توانمند داده کاوی کشف ارتباط در میان مجموعه ای از داده ها است که حاصل آن کشف یک سری قوانین انجمنی برای شناسایی روابط قوی میان فعالیت های کسب وکار به منظور شناسایی امکان موفقیت است. داده های جمع آوری شده در پژوهش پیش رو شامل 165 مورد شرکت نوآفرین ایرانی است که فعالیت خود را از شتاب دهنده ها آغاز کرده اند. استخراج متغیرهای مستقل پیش بینی کننده موفقیت ابتدا طبق روش تحقیق استخراج شده و سپس به دقت برای هر شرکت نوآفرین وضعیت متغیر مقدار شده است. متغیر وابسته از طریق بررسی وب سایت، نرم افزار کاربردی و... بر مبنای وضعیت فعالیت شرکت نوآفرین ارزیابی شده و در صورت تداوم فعالیت شرکت، شرکت نوآفرین موفق ارزیابی شده است. نهایتا در این پژوهش در فاز اول به کمک الگوریتم های ماشین بردار پشتیبان، درخت تصمیم گیری، k- نزدیک ترین همسایگی و جستجوی فاخته برای انتخاب موثرترین متغیرهای مستقل یا همان عوامل موفقیت شرکت های نوآفرین شده و در فاز دوم به واسطه این عوامل قواعد انجمنی با اپریوری استخراج شده است. نتایج قواعد انجمنی همچنین گویای این موضوع است که در شرکت های نوآفرین بررسی شده انعطاف پذیری و مقیاس پذیری هم زمان باهم دو عامل مهم جهت موفقیت شمرده می شود.
کلید واژگان: الگوریتم اپریوری، الگوریتم فاخته، انتخاب ویژگی، پیش بینی موفقیت، شرکت های نوآفرینInformation management, Volume:5 Issue: 2, 2020, PP 158 -174In the current economy and entrepreneurship situation in developing countries, experts maintain that establishing startup companies proves an efficient and promising approach. In spite of the fact, many startup companies are failed. However, there are key factors, which can help such companies follow the path to success. This research aims to identify the factors, which led to success of startup companies in Iran. Accordingly, one of the important roles of data mining is exploring the relationship between datasets, and getting the result of a series of association-based rules for identifying the strong relations between business activities. The data of this study is collected from a total of 165 Iranian startup companies. The feature's columns included 41 success factors of startup companies addressed in domestic and foreign studies. For the prediction phase, we use the help of support vector machine algorithm, decision tree and k-nearest neighboring to classification. The feature selection technique in order to come up with the most efficient success factor of startup companies is Cuckoo search. Finally, rules are extracted by means of Apriori Algorithms. The results indicate that factors such as, namely, entrepreneurship experience, working duration, skills, type of service or product, target market, Blue Ocean or Red Ocean strategy, flexibility, scalability, customer loyalty, presence or lack of presence in an accelerator, and first-stage of investor are the most important factors that have the greatest effects in a startup's success. Moreover, the extracted results reveal that flexibility, and scalability are considered as two key factors contributing to success of Iranian startup companies.
Keywords: Apriori Algorithm, Classification, Cuckoo Optimization Algorithm, Feature selection, Startup Companies -
افزایش حجم چشمگیر داده ها و استفاده از آن ها جهت بهبود کیفیت تصمیمات مدیریتی از معضلات کتابخانه ها و مراکز اطلاع رسانی هست. در این میان ابزار پرتوان داده کاوی می تواند با تحلیل داده ها به منظور پیش بینی و تحلیل تراکنش های کاربران و جلوگیری از اتلاف وقت آن ها در جهت استفاده از اطلاعات مفید از انبوه داده ها به تشخیص الگوهای معتبر و رابطه های نامعلوم بپردازد و کتابخانه ها را در تصمیم گیری های راهبردی و مدیریت اثربخش یاری رساند. این مطالعه با استفاده از رویکرد قوانین انجمنی که یکی از روش های داده کاوی است درصدد تحلیل تراکنش های امانت کاربران و کشف الگوی دسترسی آنان هست. در این مطالعه توصیفی که از نوع مقطعی است، داده های موردنیاز از تراکنش های کاربران کتابخانه ها و مراکز اطلاع رسانی دانشگاه علوم پزشکی همدان جمع آوری شد و پس از اعمال پیش پردازش بر روی این داده ها درنهایت تراکنش های6636 نفر از کاربرآن که به میزان 132833 تراکنش بود به روش سرشماری، طی بازه زمانی سه ساله موردبررسی قرار گرفت. نتایج پژوهش نشان داد که بیشترین تراکنش ها و مراجعات با نمره 4/24 ± 7/20، مربوط به دانشجویان و بیشترین دیرکرد و مدت زمان امانت به ترتیب با نمره 9/1396 ±3/884 و3/1765± 7/885 مربوط به اعضای هیئت علمی بوده است. همچنین قوانین حاصل از الگوریتم Apriori توانست الگوی دسترسی کاربران را بر اساس اطلاعات جمعیت شناختی و همچنین وابستگی موضوعی منابع اطلاعاتی ارائه دهد و به عنوان الگویی مناسب در تحلیل و پیش بینی تراکنش کاربران مورداستفاده قرار گیرد. لذا با بهره گیری از رویکرد قوانین انجمنی می توان اقدام به طراحی سیستم توصیه گر کتاب در کتابخانه ها و مراکز اطلاع رسانی نمود و نیز مدیران و سیاست گذاران می توانند با استفاده از این الگوها و قواعد، گام های تهیه و عرضه منابع اطلاعاتی خود را با نیازهای واقعی اعضاء همسو نمایند و به طور قابل توجهی در امور فراهم آوری، مجموعه سازی، مدیریت و خدمات کتابخانه از آن بهره جویند.کلید واژگان: داده کاوی، قوانین انجمنی، الگوریتم Apriori، کاربران کتابخانه، تراکنش های امانت، کتابخانه های دانشگاهی، دانشگاه علوم پزشکی همدانIncreasing massive amount of data and using them to improve the quality of management decisions are the problems of libraries and information centers. In the meantime, a powerful data mining tool can analyze data to predict and analyze user transactions and stop wasting time to use useful data from among massive data, identify valid patterns and unknown relationships, and help libraries in strategic decision-making and effective management assistance. This study using association rules technique, which is one of the data mining methods, seeks to analyze the transactions of user lending and discover their access pattern. In this cross-sectional descriptive study required data were collected from transactions of users of the libraries and information centers of Hamedan University of Medical Sciences and after preprocessing these data, the total number of 6636 user transactions was 132833 using a census method during a three-year period examined. The results of this study showed that most transactions and referrals with the score of 20.7±24.4 were related to the students and the highest delay and duration of loan respectively with the score of 884.3±1396.9 and 885.7±1765.3 related to the faculty members. Also, the rules derived from the Apriori algorithm showed by providing a users access pattern based on demographic information and determining subject dependence of information resources could be used as an appropriate pattern for analyzing and predicting user transactions. Using association rules technique and implementing the Apriori algorithm, the best rules governing the data set were extracted. Therefore, using association rules technique can be designed as a book advisory system in libraries and information centers. Managers and policy-makers can also use these patterns and rules to align their supply and information resources with the real needs of their members, and can benefit greatly from library procurement, collection, management and services.Keywords: Data mining, Association rules, Apriori algorithm, library users, Library Circulation Records, Academic Libraries, Hamedan University of Medical Sciences
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.