clustering algorithm
در نشریات گروه علوم انسانی-
هدف این مقاله ارایه یک الگوی هدایت تحصیلی دانش آموزان مقطع متوسطه اول بر اساس الگوریتم های خوشه بندی سلسله مراتبی تجمعی است. هدف ما در این مقاله در نظر گرفتن همزمان دروس پایه هر رشته در کنار مهارت های مورد نیاز دانش آموزان برای موفقیت در تحصیل در رشته های مختلف بود. این پژوهش از نوع کاربردی می باشد. جامعه آماری پژوهش 30 نفر از دانش آموزان دبیرستان جانبازان شهرستان سیروان استان ایلام می باشد. جمع آوری داده ها از طریق نمرات کارنامه های دانش آموزان و نمرات اختصاص داده شده مشاور مدرسه در زمینه مهارت های مورد نیاز هر رشته تحصیلی است. الگوریتم اصلی پژوهش الگوریتم single link و مدلسازی، تجزیه و تحلیل داده ها با استفاده از نرم افزار spss انجام شده است.با خوشه بندی همه داده ها و متغیرهای پژوهش ابتدا 10 خوشه و در نهایت 3 خوشه اصلی شامل مشابه ترین نمونه های پژوهش شکل گرفت. بررسی و مقایسه خوشه های بدست آمده با نتایج واقعی هدایت تحصیلی دانش آموزان تقریب بالایی از مشابهت را نشان داد. مقایسه نتایج حاصل از خوشه بندی توسط الگوریتم و نتایج واقعی انتخاب رشته دانش آموزان در مورد رشته تحصیلی علوم تجربی 100 درصد، در مورد رشته علوم تجربی 77 درصد و در مورد رشته تحصیلی علوم انسانی 85 درصد مطابقت را نشان داد.
کلید واژگان: هدایت تحصیلی، الگوریتم خوشه بندی، خوشه بندی سلسله مراتبی تجمعیThe purpose of this article is to present a model of academic guidance for first secondary students based on cumulative hierarchical clustering algorithms. Our goal in this article was to simultaneously consider the basic courses of each field along with the skills needed by students to succeed in studying in different fields.This research is of applied type. The statistical population of the research is 30 students of Zhanbazan high school in Sirvan city of Ilam province. Data is collected through the scores of students' report cards and the scores assigned by the school counselor in the field of skills required for each field of study.The main algorithm of the research is the single link algorithm and modeling, data analysis has been done using spss software. By clustering all the data and research variables, first 10 clusters and finally 3 main clusters containing the most similar research samples were formed. . Examining and comparing the obtained clusters with the actual results of students' academic guidance showed a high degree of similarity. Comparing the results of clustering by the algorithm and the actual results of students' choice of fields showed 100% agreement in the field of experimental sciences, 77% in the field of experimental sciences, and 85% in the field of humanities.
Keywords: academic guidance, clustering algorithm, cumulative hierarchical clustering -
استفاده از ابزارها و روش های پیش بینی سنتی خطای بالایی داشته و در مقایسه با روش های جدیدتر و مدل های غیرخطی عملکرد ضعیف تری دارند. یکی از روش ها و الگوریتم های پرکاربرد در پیش بینی استفاده از یادگیری ماشین است. هدف اصلی این پژوهش بررسی کاربرد یادگیری ماشین در ارایه الگویی برای پیش بینی ورشکستگی 308 شرکت پذیرفته شده در بورس اوراق بهادار تهران در بازه زمانی 1389 تا 1398 (3080 سال - شرکت) می باشد که برای آزمون فرضیه ها از رگرسیون چند گانه داده های ترکیبی و به منظور پیاده سازی الگوریتم خوشه بندی Medians-K و محاسبات مربوطه از نرم افزار محاسبات اماری R استفاده گردید. نتایج حاصل از پژوهش نشان می دهد از میان نسبت های مالی مشخص شده در مدل اول فقط نسبت درآمد خالص به کل دارایی و نسبت ارزش بازار حقوق صاحبان سهام به کل ارزش بازار موجب می توانند توانایی مدل پیش بینی ورشکستگی را بهبود ببخشند. همچنین در مدل دوم نسبت های مالی مشخص شده توانایی بهبود مدل پیش بینی ورشکستگی را داشته و با اضافه کردن متغیر Devscore برای گروه هایی که بر اساس صنعت و اندازه ساخته شده اند، مدل اصلاح شده و پیش بینی ورشکستگی را بهبود می بخشد. نتایج حاکی از آن است که یک شرکت در صورت داشتن نسبت های مالی مرتبط با ورشکستگی که پایین تر از میانگین همسانان خوشه ای خود است، احتمالا ورشکسته می شود.
کلید واژگان: یادگیری ماشین، الگوریتم خوشه بندی، پیش بینی ورشکستگیThe use of traditional forecasting tools and methods has a high error and has a poorer performance compared to newer methods and nonlinear models. One of the most widely used methods and algorithms in predicting the use of machine learning. The main purpose of this study is to investigate the application of machine learning in providing a model for predicting the bankruptcy of 308 companies listed on the Tehran Stock Exchange in the period 1389 to 1398 (3080 years - company) to test the hypotheses of multiple regression of composite data. In order to implement the Medians-K clustering algorithm and related calculations, R statistical calculation software was used. The results show that among the financial ratios identified in the first model, only the ratio of net income to total assets and the ratio of market value of equity to total market value can improve the ability of the Altman bankruptcy prediction model. Also, in the second model, the specified financial ratios have the ability to improve the bankruptcy forecast model, and by adding the Devscore variable for groups based on industry and size, the modified model improves the bankruptcy forecast, The results shows that a company is more likely to go bankrupt if it has bankruptcy-related financial ratios that are lower than the average of its cluster peers..
Keywords: Machine Learning, clustering algorithm, Bankruptcy Prediction -
یادگیری ماشینی یک رشته وسیع است که الگوریتم های یادگیری را طراحی کرده که می تواند محرک ها را هدایت کند، زبان گفتاری را تشخیص دهد و تنظیمات پنهان در رشد حجم داده را کشف کند، که داده های مالی نیز از این قاعده مستثنی نیست. بنابراین هدف از تحقیق حاضر، بررسی کاربرد یادگیری ماشین در ارایه الگویی برای کشف تحریفات با اهمیت حسابداری در شرکت های پذیرفته شده در بورس اوراق بهادار تهران است. تحلیل های آماری پژوهش، براساس داده های استخراج شده 308 شرکت پذیرفته شده در بورس اوراق بهادار تهران در بازه زمانی 1389 تا 1398 (3080 سال - شرکت) انجام و به منظور نمونه گیری از روش غربالگری استفاده شد. تحریفات حسابداری متغیر وابسته که از طریق متغیر مجازی صفر و یک بدست آمده و متغیرهای اقلام تعهدی غیر اختیاری، تغییر در حسابهای دریافتنی، تغییر در موجودی کالا، دارایی های نرم، تغییر در فروش نقدی، تغییر در بازده داراییها و انتشار اوراق بهادار به عنوان متغیرهای مستقل در نظر گرفته شده و برای آزمون فرضیه ها از رگرسیون غیرخطی و به منظور پیاده سازی الگوریتم خوشه بندی Medians- K و محاسبات مربوطه از نرم افزار محاسبات اماری R استفاده شده است.
کلید واژگان: یادگیری ماشین، الگوریتم خوشه بندی، کشف تحریفات حسابداریAbstract Machine learning is a broad discipline that has designed learning algorithms that can guide stimuli, detect spoken language, and discover hidden adjustments in data volume growth, of which financial data is no exception. Therefore, the purpose of this study is to investigate the application of machine learning in providing a model for detecting accounting distortions in companies listed on the Tehran Stock Exchange. Statistical analysis of the research was performed based on the extracted data of 308 companies listed on the Tehran Stock Exchange in the period 1389 to 1398 (3080 years - company) and the screening method was used for sampling. Accounting distortions of the dependent variable obtained through the virtual variable zero and one and the variables of non-discretionary accruals, change in accounts receivable, change in inventory, soft assets, change in cash sales, change in return on assets and issuance of securities as Independent variables are considered and nonlinear regression is used to test the hypotheses and R statistical calculation software is used to implement the Medians-K clustering algorithm and related calculations.
Keywords: Machine learning, clustering algorithm, detection of accounting distortions -
سازمان همکاری اسلامی در سال 1971 تشکیل شده و شامل 57 کشور اسلامی می-باشد. از جمله مهمترین اهداف این سازمان تقویت و گسترش مناسبات سیاسی، اقتصادی، تجاری و ایجاد بازار مشترک بین کشورهای اسلامی می باشد. با توجه به این مورد شاید تشکیل منطقه پولی بین کشورهای اسلامی بتواند آن ها را در حصول به اهداف این سازمان یاری رساند. لذا هدف از این مطالعه بررسی امکان تشکیل منطقه بهینه پولی در بین کشورهای اسلامی می باشد. به عبارت دیگر این مطالعه با استفاده از تکنیک خوشه بندی فازی و خوشه بندی سنتی و بر اساس معیارهای منطقه بهینه پولی، درجه تشابه اقتصادی بین کشورهای اسلامی را بررسی کرده است. بر اساس نتایج حاصل، از بین کشورهای اسلامی کشورهای عضو اتحادیه اقتصادی عرب از درجه تشابه بالایی برخوردار می باشند. همچنین زیرگروهی از گروه کشورهای عضو اکو نیز از درجه تشابه بالایی برخوردار می باشند. به این ترتیب اگر کشورهای اسلامی به ضرورت و اهمیت همگرایی پولی بین خود پی برده و جدیت کافی در ایجاد این همگرایی را داشته باشند آنگاه می توانند اتحادیه پولی کشورهای اسلامی را با ورود کشورهای عضو اتحادیه اقتصادی عرب شروع کرده و سایر کشورهای اسلامی را تشویق به انجام اصلاحات اقتصادی لازم کرده و آن ها هم می توانند به ترتیب و در طی زمان وارد اتحادیه پولی شوند.کلید واژگان: منطقه بهینه پولی، کشورهای اسلامی، الگوریتم خوشه بندیAssessing the feasibility of optimum currency area in OIC countries: using fuzzy and hard clustering algorithmAbstractThe Organization of Islamic Cooperation (OIC) was established in 1971 and includes 57 Islamic countries. The most important goal of this organization is strengthening and expanding political, economic, and commercial ties and creating a common market among its member countries. Considering the successful experience of Euro area, it might be possible that a common currency area could help the OIC countries to achieve the integration. Therefore, the purpose of this study is to investigate the possibility of forming a common currency area among the OIC countries. Based on the convergence criteria presented in the optimum currency area literature, the study uses two different clustering algorithms, i.e. fuzzy and hard clustering methods to cluster the OIC countries. The results show that there are adequate similarities in the economic structures of the Arab Economic Union (AEU) countries. Therefore it seems plausible to create a common currency area among the AEU countries. In addition, a subgroup of the Economic Cooperation Organization (ECO) countries also can join this common monetary union.Keywords: Optimum Currency Area, clustering Algorithm, OIC Countries
-
رشد جمعیت شهرها و نیاز روز افزون به مسکن و خدمات در شهرهای کشور، نیاز به توسعه ی کالبدی شهرها را ناگزیر کرده است. این توسعه در دهه های اخیر بیشتر از نوع توسعه بیرونی بوده است و تامین خدمات و مسکن شهروندان از طریق افزودن به محدوده های شهری را دنبال می کرده است که به پراکنده رویی شهری و زوال محیط زیست پیرامونی و باغات و کشاورزی های همجوار منجر شده است. این در حالی است که توسعه میان افزا و به ویژه بازیافت زمین و توسعه مجدد به عنوان رویکردهایی کارا می تواند در جهت کاهش آسیب به محیط زیست و تحقق توسعه پایدار شهرها مورد نظر قرار گیرد. در این راستا هدف این تحقیق تدوین الگویی برای شناسایی اراضی با قابلیت توسعه مجدد و بکارگیری آن در شهر اراک به عنوان نمونه است. بنابراین این تحقیق سعی در پاسخگویی به این پرسش ها دارد که چگونه می توان اراضی با قابلیت توسعه مجدد را (در راستای تحقق توسعه پایدار شهری) شناسایی نمود؟ و این اراضی در شهر اراک کدامند؟ بدین منظور الگوریتمی ابداعی به منظور شناسایی اراضی با قابلیت تخریب و توسعه مجدد طراحی شده است که در آن قطعات شهری بر اساس 8 معیار کیفیت ابنیه، عمربنا، ریزدانگی نفوذپذیری، قیمت زمین، نرخ سرپرستی، نسبت مهاجرت و دسترسی به فضای سبز مورد ارزیابی قرار می گیرند. این الگوریتم ابداعی به صورت نمونه در شهر اراک پیاده سازی شده است. نتایج نشان می دهد الگوریتم ابداعی (خوشه بندی توانی بر مبنای ده) قابلیت خوبی در ترکیب با نرم افزارهای سیستم اطلاعات جغرافیایی دارد و در شناسایی اراضی با قابلیت تخریب و توسعه مجدد می تواند مورد استفاده قرار گیرد. همچنین استفاده از الگوریتم مذکور در شهر اراک منجر به شناسایی 4178 قطعه با قابلیت توسعه مجدد شد که مساحتی برابر با 85. 8 هکتار دارند و می تواند به منظور تحقق توسعه میان افزا در شهر اراک مورد استفاده قرار گیرد.کلید واژگان: توسعه پایدار، الگوریتم خوشه بندی، توسعه مجدد، توسعه میان افزا، شهر اراکUrban population growth and increasing demand for housing and services in the cities of the country has forced the need for physical development of cities this development in recent decades has been more of external development, and the provision of services and housing has been following by adding to the city's area, that has caused to urban sprawl and deterioration of surroundings and neighboring gardens and agricultures. While that infill development and particularly redevelopment and utilization of land as effective approaches can be considered in reducing damage to the environment and realization of sustainable development of cities. In this regard the aim of this research is to develop a model to identify lands with redevelopment capability and use it to the city of Arak as an example. Therefore, this research tries to answer these questions that how to identify the lands with redevelopment capability? And what are these areas in Arak? For this purpose, an innovative algorithm to identify lands with destruction and redevelopment capability is designed, that urban parts are evaluated on the basis of 8 criteria, construction quality, age of Construction, small lot, permeability, land's price, sponsorship rate, ratio of migration and access to green space. This innovative algorithm has been implemented for example in the city of Arak. The results show that innovative algorithm has nice capability in combination with GIS software and can be used to identify the lands with destruction and redevelopment capability. Also using this algorithm in Arak city lead to identify 4187 pieces with redevelopment capability which has an area of 85.8 hectares and can be used to realization of infill development in Arak city.Keywords: urban development, clustering Algorithm, Redevelopment, Infill Development, Arak City
-
دراثر برنامه ریزی های نامطلوب و متمرکز گذشته، کیفیت توسعه و زیرساخت های آن مسائل عمده ای را در روند توسعه روستاهای کشور ایجاد کرده است. ابعاد گوناگون و پیچیدگی ساختاری این موضوع، یکی از تنگناهای اساسی در ارائه مدل مناسب برای توزیع اعتبارات به شمار می آید. دراین راستا، در پژوهش حاضر به موضوع سطح بندی مناطق روستایی بخش مرکزی شهرستان بویراحمد می پردازیم. این تحقیق، به لحاظ هدف کاربردی است. جامعه آماری پژوهش، روستاهای بالای 20 خانوار و بخش مرکزی شهرستان بویراحمد (89 روستا) بودند که 566 روستایی مطالعه شدند. برای جمع آوری داده ها، علاوه بر اسناد، از پرسش نامه محقق ساخته نیز استفاده شد. ضریب آلفای کرونباخ (561/0- 955/0) به دست آمده، بیانگر بهینگی پرسش نامه بود. برای تعیین شاخص های به کاربرده شده، از رویکرد اندام وار استفاده شد. برای تعیین سطوح توسعه یافتگی، از روش تحلیل خوشه ایبه شیوه K-means و الگوریتم رقابت استعماری (ICA) استفاده شد. داده پردازی نیز با استفاده از نرم افزار MATLAB 7.10 انجام شد. یافته ها نشان داد که جواب بهینه الگوریتم ترکیبی K-means و ICAاز بهترین جواب الگوریتم K-means بهتر است؛ این موضوع اعتبار این الگوریتم را به وضوح نشان می دهد. نتایج پژوهش حاکی از آن است که پراکنش فضایی توسعه یافتگی در منطقه موردمطالعه در وضعیت متوازنی قرار ندارد؛ بهطوری که اغلب روستاها (43/49%) در سطح نسبتا محروم قرار می گیرند. همچنین، در سطوح در حال توسعه و توسعه یافته به ترتیب، 08/28% و 47/22% از روستاها قرار دارند. افزون براین، روستاهای دهستان سررود شمالی از وضعیت توسعه-یافتگی بهتری نسبت به سایر روستاهای بخش مورد مطالعه برخوردار هستند.
کلید واژگان: سطح بندی، توسعه روستایی، الگوریتم خوشه بندی، الگوریتم رقابت استعماریThe quality of development and its infrastructures have brought about major problems to the development process of the country’s villages due to unfavorable and concentrated planning. Its various dimensions and structural complexity forms a basic limitation to the presentation of an appropriate model for the distribution of budgets. Therefore، awareness of distribution of development in rural regions is essential for planning and presenting rural development programs. This research aims at determine levels of development in the Central district of Boyer-Ahmad county. The recent study is a functional one due to the aim، and it is a quantity study، due to data analysis. Statistical population of the study was the villages in the county with 20 or more households (89 villages). The sample size of the rural people was determined using the sampling size table given by Lin. The final sample included 566 rural households were randomly selected as a sample of the study from the population. To collect the data، a questionnaire was used. The Cronbach''s alpha coefficient (0. 561-0. 955) indicated the optimality of the questionnaire. In order to zoning development of rural areas، organism approach (structured) to select criteria was used. In order to determine the zoning rural development، descriptive analysis and K-means algorithm in combination with imperialist competitive algorithm (ICA) were used. Data processing was performed using MATLAB 7. 10 software. Findings of study indicate the answer of optimum of K-MICA algorithm is better than k-means algorithm. Also the worst answer of K-MICA algorithm is better than the best answer of k-means algorithm. The findings also indicated the undesirable rural development in the region. Also، approximately half of villages with 49. 43 percent of the rural region were undeveloped villages. In developed level، 28. 08 percent of villages and in developing level، 22. 47 percent of villages.Keywords: Zoning, Rural Development, Clustering Algorithm, Imperialist Competitive Algorithm (ICA)
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.