clustering
در نشریات گروه مالی-
برای سرمایه گذاری مناسب و شناسایی موقعیت های درست خرید و فروش، وجود یک سیستم و راهبرد مشخص و کارا لازم است. سیستم معامله ی زوج ها یکی از مشهورترین و قابل فهم ترین سیستم های معاملات الگوریتمی می باشد. در این سیستم، از یک زوج سهام که در بلندمدت روند قیمتی یکسان دارند (خاصیت بازگشت به میانگین) و در کوتاه مدت دارای نوسانات (اسپرد) است، بهره گرفته می شود. مهم ترین نکته در این سیستم، شناسایی و پیدا کردن چنین زوج سهم هایی است. در این پژوهش از یک رویکرد نوین و متفاوت برای شناسایی زوج سهم ها و همچنین یافتن موقعیت های درست خرید و فروش در معامله ی زوج ها استفاده می شود. در گام اول، ابتدا یک زوج سهام یا دارایی که یک رابطه آماری بلندمدت دارند انتخاب می شوند. برای محاسبه فاصله بین هر زوج سهام و شباهت حرکتی آن ها از روش انحراف زمان پویا استفاده می شود. سپس از روش خوشه بندی سلسله مراتبی برای خوشه بندی سهم ها بهره گرفته می شود و جفت سهمی که میزان شباهت بیشتری دارند انتخاب می شوند. در گام دوم از روش ماشین بردار پشتیبان برای شناسایی موقعیت های خرید و فروش استفاده می شود. به منظور بررسی عملکرد و کارایی روش از شاخص S&P که شامل 500 سهام برتر بازار بورس نیویورک می باشد، استفاده شده است.
کلید واژگان: معاملات الگوریتمی، معامله زوج ها، انحراف زمان پویا، خوشه بندی، سهامIn order to invest properly and identify the right short and long positions, the existence of an efficient strategy is necessary. Pairs trading system is one of the most famous algorithmic trading systems. In this system, a pair of stocks that have same trend in the long-time (reversion to the mean) and have fluctuations (spread) in the short-time is used. The most important point is to identify such a pair of stock. In this research, an approach is used to identify pairs of stocks and also to find the right short and long positions in trading pairs. In the first step, a stock pair that has a long-time statistical relationship is selected. The DTW method is used to calculate the distance between each stock pair and their movement similarity. Then, the hierarchical clustering method is used to cluster stocks, and then pairs of stocks that have a greater degree of similarity are selected. In the second step, the SVM method is used to identify buying and selling positions. In order to check the performance of the method, the S&P 500 index, which includes the top 500 stocks of the New York Stock Exchange, has been used.
Keywords: Algorithmic Trading, Pairs Trading, Dynamic Time Deviation, Clustering, Stocks -
In traditional Data Envelopment Analysis (DEA) techniques, in order to calculate the efficiency or performance score, for each decision-making unit (DMU), specific and individual DEA models are designed and resolved. When the number of DMUs are immense, due to an increase in complications, the skewed or outdated, calculating methods to compute efficiency, ranking and …. may not prove to be economical. The key objective of the proposed algorithm is to segregate the efficient units from that of the other units. In order to gain access to this objective, effectual indexes were created; and taken to assist, in regards the DEA concepts and the type of business (under study), to survey the indexes, which were relatively operative. Subsequently, with the help of one of the clustering techniques and the ‘concept of dominance’, the efficient units were absolved from the inefficient ones and a DEA model was developed from an aggregate of the efficient units. By eliminating the inefficient units, the number of units which played a role in the construction of a DEA model, diminished. As a result, the speed of the computational process of the scores related to the efficient units increased. The algorithm designed to measure the various branches of one of the mercantile banks of Iran with financial indexes was implemented; resulting in the fact that, the algorithm has the capacity of gaining expansion towards big data.
Keywords: Data Envelopment Analysis (DEA), Clustering, Data Mining, Big Data, Efficiency (Performance) -
نشریه تحقیقات مالی، پیاپی 64 (زمستان 1400)، صص 497 -522هدف
تشکیل پرتفوی شاخصی ارتقایافته، به عنوان یکی از استراتژی های مدیریت سرمایه گذاری، سعی در ترکیب مزایای دو رویکرد فعال و غیرفعال دارد. این پژوهش، به دنبال ارایه یک مدل دومرحله ای است که بتواند در مرحله نخست، عملکرد شاخص را با تعداد کمتری از سهام تشکیل دهنده شاخص بازسازی نماید و در مرحله دوم، اوزان پرتفوی شاخصی ارتقایافته را محاسبه کند.
روشدر مرحله نخست، با استفاده از یک مدل برنامه ریزی ریاضی صفر و یک به منظور خوشه بندی سری های زمانی، پرتفوی ردیاب شاخص شکل گرفت. معیارهای ضرایب هم بستگی مبتنی بر کاپولا و همچنین اطلاعات متقابل به عنوان شاخص های شباهت سری های زمانی در این مرحله استفاده شدند. در مرحله دوم، اوزان سرمایه گذاری در سهم های منتخب، به گونه ای مشخص شد که بازده مازاد پرتفوی نسبت به پرتفوی شاخصی ایجادشده در مرحله اول (نماینده شاخص)، بیشینه شود. عدم قطعیت ناشی از تخمین بازده مازاد سهم ها در مرحله دوم، با استفاده از رویکرد بهینه سازی استوار در نظر گرفته شده است.
یافته ها:
نتایج آزمون خارج از نمونه روی شاخص 50 شرکت فعال تر بورس اوراق بهادار تهران، در بازه زمانی بهار 1394 تا بهار 1397 با استفاده از خطای ردیابی و نسبت بازار، نشان از این موضوع دارد که علاوه بر موفقیت معیارهای شباهت ذکرشده در خوشه بندی سری های زمانی و تشکیل پرتفوی مبتنی بر شاخص، در سطح اطمینان 99 درصد، پرتفو های شاخصی ارتقایافته مبتنی بر ضرایب هم بستگی کاپولای نرمال، تی و کلایتون دارای اختلاف بازده مثبت معنادار با شاخص هستند.
نتیجه گیری:
استفاده از ضرایب هم بستگی مبتنی بر کاپولا و همچنین رویکرد بهینه سازی استوار به منظور درنظرگرفتن عدم قطعیت پارامترها، در تشکیل پرتفوی شاخصی ارتقایافته، موفق عمل می کند.
کلید واژگان: پرتفوی شاخصی ارتقایافته، خوشه بندی، کاپولا، اطلاعات متقابل، بهینه سازی استوارFinancial Research, Volume:23 Issue: 64, 2022, PP 497 -522ObjectiveEnhanced index Tracker portfolio, as one of the investment management strategies, is trying to combine the benefits of both active and passive approaches. This research is going to provide a two-stage model that can first reproduce the index performance with a smaller number of index-forming shares and, secondly, calculate the Enhanced index tracker portfolio weights.
MethodsIn the first step, using a binary mathematical programming model to create clustering of time series, an index tracker portfolio was created. Coppola-based correlation coefficients and mutual information were used as time series similarity measures at this stage. In the second stage, the weight of investment in the selected shares was determined in a way that the return on the portfolio surplus was maximized relative to the index created in the first stage. The uncertainty resulting from the estimation of the excess stock returns in the second phase was considered by using a robust optimization approach.
ResultsThe results obtained by applying the out of sample test on the 50 more active companies in the Tehran Stock Exchange from the spring of the Iranian calendar year of 1394 to spring of 139, using the tracking error and market ratio, indicate that in addition to the success of the similarity criteria in time series clustering and index tracking, at a confidence level of 99%; Enhanced index Tracker portfolios based on normal, T and Clayton Copula correlation coefficients have a positive significant difference with the index.
ConclusionAccording to this study, to develop an enhanced index tracker portfolio, it is practical to apply copula-based correlation coefficients and try a robust optimization approach to take into account the uncertainty of the parameters.
Keywords: Enhanced Index Tracker Portfolio, Clustering, Copula, Mutual information, Robust optimization -
هدف این پژوهش ایجاد یک شبکه مالی برای شناسایی رهبران بازار سهام با استفاده از معیارهای مرکزیت است.این پژوهش در نهایت یک خوشه بندی از سهام برتر ارایه میدهد که میتواند به عنوان یک سبد سهام بهینه مورد استفاده سرمایه گذاران قرار گیرد.جامعه آماری کلیه بورس اوراق بهادار است که تعداد 100 شرکت که بیشترین سرمایه را دارند،به عنوان نمونه آماری در محدوده زمانی 11 ساله انتخاب شدند.به علت ماهیت رتبه بندی پژوهش،از ضریب همبستگی کندال برای محاسبه همبستگی استفاده شد.از الگوریتم پرایم برای شناسایی روابط و ساخت حداقل درخت پویا و از الگوریتم سریع حریصانه برای خوشه بندی سهام استفاده شد. نتایج نشان میدهد از لحاظ معیار مرکزیت درجه، سهام شرکت های سیمان سپاهان، مدیریت سرمایه گذاری امید و سرمایه گذاری بانک ملی،از بعد معیار مرکزیت نزدیکی، سهام شرکت های سیمان سپاهان،بین المللی توسعه ساختمان و فولاد خوزستان،از منظر معیار مرکزیت بینابینی، سهام شرکت های سیمان سپاهان،سرمایه گذاری غدیر و سرمایه گذاری بانک ملی و در نهایت از جهت معیار مرکزیت تنگنا،سهام شرکت های سیمان سپاهان،فولاد خوزستان و بین المللی توسعه ساختمان بیشترین تاثیر را بر شبکه سهام دارند.همچنین سهام برتر در 11 خوشه دسته بندی شدند که هر خوشه نشان دهنده ارتباط قوی اجزای آن با یکدیگر است.کلید واژگان: شبکه مالی، معیارهای مرکزیت، درخت پویای حداقلی، خوشه بندیAnalysis of Financial networks in Tehran Stock Exchange using the application of centrality measuresThe purpose of this study is to create a Financial network to identify stock market leaders using centrality measures.This study finally provides a clustering of superior stocks that can be used as an optimal stock portfolio by investors.The statistical population of all stock exchanges is that the 100 companies with the most capital were selected as a statistical sample over a period of 11 years.Due to the nature of the research ranking, the Kendall correlation coefficient was used to calculate the correlation.The Prime algorithm was used to identify relationships and construct the minimum spanning tree, and the fast-greedy algorithm was used to cluster stocks.The results show that in terms of degree centrality measure, stocks of Sepahan Cement companies,Omid Investment Management and Bank Melli Investment, based on closeness centrality measure, stocks of Sepahan Cement companies,International Building Development, and Khuzestan Steel, based on Betweenness centrality measure, the stocks of Sepahan Cement, Ghadir Investment and Bank Melli Investments, and finally based on the bottleneck centrality measure,the shares of Sepahan Cement, Khuzestan Steel and International Building Development have the greatest impact on the stock exchange network. Also, the top stocks were classified into 11 clusters,each of which shows a strong relationship between its components.Keywords: Financial network, Centrality measures, Minimum Spanning Tree, Clustering
-
نیاز برای دست یابی به معیارهای درست بهینه سازی پرتفو که علاوه بر دقت به سرعت در تصمیم گیری های سرمایه گذاری بیانجامد، امری فراتر از نیازهای آکادمیک است چرا که نیاز سرمایه گذاران، شرکت های سرمایه گذاری و مدیران سرمایه گذاری، به کاهش زیان های ناشی از سرمایه گذاری، افزایش بازده متناسب با ریسک همواره مورد بحث بوده است. با این وجود دستیابی به روشی جهت بهینه سازی پرتفو به گونه ای که شکاف بین نیازهای کاربردی و مدل های تیوریک را پر کند کار بسیار دشواری است. با توجه به اینکه یکی از مهمترین عوامل موثر در کسب بازدهی مطلوب، متنوع سازی است. این تحقیق با موضوع «تشکیل سبد سرمایه گذاری بهینه در بورس اوراق بهادار تهران با استفاده از روش های خوشه بندی سلسله مراتبی و تفکیکی»، سعی دارد با استفاده از داده های بازار و خوشه بندی آن، روشی مناسب جهت بهینه سازی پرتفو ارایه کند. نتیجه این مقایسه میزان موفقیت بهینه سازی بر اساس خوشه بندی را نسبت به پرتفوی شاخصی روشن خواهد کرد.کلید واژگان: خوشه بندی، بهینه سازی، سلسله مراتبی، تفکیکی، ارزیابی پرتفوThe need to achieve optimal portfolio optimization criteria, which, in addition to the accuracy of investment decisions quickly, goes beyond academic needs, as investors, investment companies and investment managers need to reduce their investment losses, increase Risk-adjusted returns have always been discussed. However, it is very difficult to achieve a portfolio optimization method that fills the gap between applied requirements and theoretical models. Considering that one of the most important factors in achieving optimal returns is diversification. This research, with the theme of "Formation of optimal investment portfolio in Tehran Stock Exchange using hierarchical and K-means clustering methods", attempts to present a suitable method for portfolio optimization using market data and clustering. The result of this comparison will clarify the success rate of cluster optimization compared to the index portfolio.Keywords: portfolio, Optimization, Hierarchical, denotation, Clustering
-
هدف
هدف از اجرای پژوهش حاضر، ارائه یک رویکرد ترکیبی شامل روش های خوشه بندی و تجمیع مطلوبیت های تمایزگر (UTADIS) در تشکیل سبد سرمایه گذاری است.
روشدر این پژوهش، ابتدا با استفاده از روش K-means، خوشه بندی انجام گرفت و با توجه به معیارهای تفکیک، بهترین تعداد خوشه ها تعیین شد. نتایجی که از خوشه بندی به دست آمد، برای اطلاعات ورودی روش UTADIS استفاده شد و طبقه بندی شرکت ها شکل گرفت. پس از حل مدل اولیه، به منظور بهبود نتایج، تحلیل پس بهینگی انجام شد، سپس آزمون های صحت طبقه بندی و خطای طبقه بندی به اجرا درآمد.
یافته هادر این پژوهش با مرور پژوهش های پیشین و نظرسنجی از خبرگان، هشت شاخص بازده، بتا، حاشیه سود خالص، نسبت ارزش بازار به ارزش دفتری، ROA، ROE، P/E و EPS استفاده شد. سبد سرمایه گذاری، متشکل از شرکت های ارتباطات سیار، پتروشیمی خارک، پتروشیمی شازند، پتروشیمی فن آوران، خدمات انفورماتیک، فراورده های نسوز ایران، فولاد خوزستان و معادن روی ایران است.
نتیجه گیرینتایج نشان داد، چارچوب ترکیبی استفاده شده نتایج مناسبی ارائه می کند و شاخص بازده، نقش شایان توجهی در سبد سرمایه گذاری داشته است.
کلید واژگان: تصمیم گیری چند شاخصه، تجمیع مطلوبیت های تمایزگر، خوشه بندی، سبد سهام، سرمایه گذاریObjectiveThe aim of this study is to propose a synthetic approach including Clustering and UTADIS models to form a profitable investment portfolio.
MethodsIn this research, securities are clustered using K-means method and the ideal number of clusters is determined through certain validation indexes. The results obtained from the Clustering method were used as the input data for the UTADIS model and the securities were classified by UTADIS. After solving the primary model, in order to achieve better resulst, a post-optimality analysis was performed and the classification validity test and the classification error tests were carried out.
ResultsAfter reviewing previous studies in this field and carrying out a survey of professionals from the financial industry, eight key attributes including capital return, beta coefficient, net profit margin, BV/MV, ROA, ROE, P/E and EPS were identified. The investment portfolio consists of Iran tele companies, Khark Petrochemical, Shazand Petrochemical, Fanavaran Petrochemical, Information services, Iran refract, Khouzestan steel, and Iran zinc mines.
ConclusionThe results of study showed that the proposed framework has created a profitable portfolio and capital return is the most important attribute in stock portfolio selection.
Keywords: Multi-attribute decision-making, UTADIS, Clustering, Stock portfolio, Investment -
موضوع کفایت وجه نقد در بانک ها، یکی از مسائل مهم برای مدیران و به خصوص روسای هر شعبه به شمار می رود؛ چرا که کمبود وجه نقد روزانه در صندوق شعبه به عدم پاسخگویی به نیاز مشتری می انجامد و از سوی دیگر، مازاد وجه نقد در شعبه موجب افزایش هزینه بابت انتقال آن به خزانه بانک می شود. از این رو بانک ها همواره درصدد تعیین مقدار وجه نقد مورد نیاز خود با توجه به عملیات روزانه هستند. به همین منظور در این مقاله، شعب بانک تجارت ، با توجه به تنوع بین شعب، با دو روش خوشه بندی سلسله مراتبی و خوشه بندی برمبنای رویکرد بیزی در خوشه های متشابه دسته بندی شدند؛ سپس با در نظر گرفتن نتایج خوشه بندی، مقدار وجه نقد ورودی و نیز وجه نقد مصرفی از طریق شبکه های عصبی برآورد شد تا از این طریق امکان محاسبه وجه نقد لازم برای شعب فراهم شود. نتایج تحقیق نشان می دهد، برآورد وجه نقد مصرفی و ورودی شعب بانک با استفاده از شبکه عصبی و لحاظ کردن نتایج خوشه بندی شعب با رویکرد بیزی، دارای دقت بیشتری نسبت به نتایج خوشه بندی شعب با روش معمول است.کلید واژگان: بانکداری، برآورد، خوشه بندی، رویکرد بیزی، شبکه عصبیCash adequacy in banks branches is considered as the significant issues for branch managers; because the daily cash shortage in branches funds might lead to the lack of fulfilling customers needs. On the other hand, cash surplus in branches will increase the expenses which arise from its transfer to the banks treasuries. Therefore, banks have always been attempting to estimate their required cash according to their daily operations and. In this regard, iIn this article, branches of Tejarat Bank, with regard to their diversity, have been classified in similar clusters with the two methods of hierarchical clustering and clustering based on Bayesian approach .Then, based on the results obtained from the clustering, the input cash to the branches as well as the cash consumption in the branches were estimated through the neural networks, which made it possible to calculate the required cash in branches. The results show that the estimation of input and consumed cash of branches using neural network and regarding the results obtained from Bayesian approach for branches clustering enjoys higher precision in comparison to the results obtained from the classic methods of clustering.Keywords: Banking, bayesian approach, clustering, Estimate, neural network
-
به دلیل اهمیت بازار سرمایه، سنجش عملکرد شرکت های کارگزاری به عنوان واسط بین شرکت ها و سرمایه گذاران، جهت غنی سازی کیفیت خدمات ارائه شده از سوی آن ها امری ضروری است. در این تحقیق، ابتدا مشخصه های کیفیت خدمات برخط شرکت های کارگزاری از طریق مطالعه مبانی نظری پژوهش و نظر خبرگان شناسایی و گزینش شده و بر اساس آن پرسشنامه فازی کانو طراحی و به صورت تصادفی بین 384 کاربر برخط شرکت های کارگزاری توزیع شد. با استفاده از خوشه بندی K-Means سه دسته مشتری شناسایی و برای هر خوشه با روش کانوی فازی، نیازهای هر خوشه بررسی و طبقه بندی شد. این پژوهش طبقه هر ویژگی را بر اساس مدل کانو مشخص کرده و نشان می دهد، طبقه برخی از ویژگی ها بین خوشه های مختلف متفاوت و برای برخی دیگر، برای هر سه خوشه مشترک و از یک نوع است، همچنین برای هر ویژگی در هر خوشه، میزان رضایتمندی به صورت یک ضریب، رضایتمندی و عدم رضایت را در صورت وجود و یا عدم وجود آن ویژگی نشان داده است. نتایج این پژوهش می تواند یاری رسان شرکت های کارگزاری در جهت ارائه مناسب خدمات ارائه شده به مشتریان مختلف باشد.کلید واژگان: خوشه بندی، رضایت مشتری، کانوی فازی، کیفیت خدمات برخطDue to the importance of capital market, it is necessary to measure the performance of brokerage firms, as an interface among companies and investors, for enriching the quality of services.In this study, the quality of online service features through the survey literatures and the expert opinion were identified and selected. then Fuzzy Kano questionnaire design and randomly distributed between 384 online brokerage firms Users.by using the K-Means classifications, three categories of customer was identified and for each cluster, by using the fuzzy kano method, needs of each cluster were investigated and classified.The study, based on Kano model, shows classification of some features between clusters is different and for some other, for all clusters is same. In addition to, the rate of satisfaction for each feature in each cluster, as a factor, has shown the satisfaction or dissatisfaction in the presence or absence of features.The results of this study can help brokerage firms in order to provide convenient services to different customers.Keywords: Clustering, Customer Satisfaction, Fuzzy Kano, Quality of Online Services
-
ریسک اعتباری را می توان به عنوان ضرر محتمل که در اثر یک رخداد اعتباری اتفاق می افتد، بیان کرد. هنگامی که توانایی طرف قرارداد در تکمیل تعهداتش تغییر کند این رخداد اعتباری رخ می دهد. ریسک اعتباری یکی از مهم ترین عوامل تولید ریسک در بانک ها می باشد و این ریسک از این جهت ناشی می شود که دریافت کنندگان تسهیلات توانایی بازپرداخت اقساط بدهی خود را به بانک نداشته باشند. بررسی عوامل موثر و تاثیر گزار بر ریسک اعتباری از اهمیت بالایی برخوردار است،. بنا به آنچه اظهار شد، هدف از انجام پژوهش حاضر طراحی مدلی جهت رتبه بندی مشتریان در حوزه ریسک اعتباری با رویکرد تلفیقی MADM و SOM است. بدین منظور در نخستین مرحله با مرور ادبیات موضوع،29 شاخص موثر در ارزیابی ریسک اعتباری مشتریان شناسایی وبر مبنای مدل 6c طبقه بندی شد. در مرحله بعد با توجه به فراوانی شاخص ها و نظر خبرگان 12 شاخص به عنوان شاخص نهایی در نظر گرفته شد. سپس با روش الگوریتم تشخیص الگو شبکه عصبی به تعیین خوشه های بهینه اقدام گردید؛ و با استفاده از روش شبکه عصبی خود سامانده (SOM) و k-mean مشتریان حقوقی دریافت کننده تسهیلات طبقه بندی گردید. در خاتمه وزن نسبی هریک شاخص های دخیل را در ارزیابی ریسک اعتباری شد.کلید واژگان: ریسک اعتباری، خوشه بندی، شبکه عصبی، روش کای میانگین، صنعت بانک داریNowadays¡ Loans in the banking industry has a crucial role in productivity because a substantial portion of the assets of a bank formed though the individuals and companies. So todays credit risk has known as a biggest contributing factor of failure in the banks and financial institutions. Because of mentioned factors¡ control and management of these risks are necessary.As it mentioned before¡ the aim of this research is a model designed for customers in the areas of Assessing credit risk rating with a synthesized MADM and SOM method. For this purpose¡ the first step is identifying 29 indices that influence credit risk. After that¡ according to expert opinion and the past researches 12 indices was extracted. So the optimal clusters were determined by neural network pattern recognition algorithm. Then customers were categorizing with SOM and K-mean. Finally¡ the relative weight of each indicator of the credit risk assessment was determined.so research show that the customer experience in the economic sectors and account duration has high percentage. Finally¡ some recommendations are offered for future research and suggestions for researchers and practitioners in the field of banking are. At the end¡ some of the limitations mentioned in this research.Keywords: Credit Risk, Clustering, Artificial Neural Network, K, Man, Banking Industry
-
همواره فاصله قابل توجهی میان مالیات ابرازی شرکت ها و مالیات تشخیصی آن ها وجود دارد که منجر به عدم رعایت عدالت میان مودیان شده است. یکی از علت های دشواربودن رعایت عدالت، شناسایی مودیان بر مبنای رفتار مالیاتی و برخورد مناسب با آنهاست. هدف اصلی پژوهش حاضر طراحی سیستم پیش بینی و تحلیل رفتار مالیاتی شرکت هاست. این سیستم کمک می کند تا با بهره گیری از متغیرهای کلیدی ارزیابی عملکرد مالیاتی، رفتار مالیاتی شرکت ها شناسایی و تحلیل شود. این سیستم برای سازمان امور مالیاتی کشور به منظور ارزیابی ریسک مالیاتی شرکت ها طراحی شده است و بر مبنای آن، ریسک مالیاتی شرکت ها به سه گروه پرریسک، با ریسک مالیاتی متوسط و کم ریسک تقسیم بندی شده است. همچنین، به کمک الگوریتم های خوشه بندی و طبقه بندی، خوشه های مالیاتی مشتریان شناسایی و درخت تصمیمی با دقت 80% طراحی شد که رفتار مالیاتی هر یک از خوشه ها را بررسی و تحلیل می کند و با اضافه شدن شرکت های جدید به فهرست شرکت های مالیات دهنده، رفتار مالیاتی آن ها را نیز پیش بینی می نماید.کلید واژگان: ارزیابی مالیاتی، خوشه بندی، پیش بینی، تحلیل روند، داده کاویFinancial Research, Volume:17 Issue: 40, 2016, PP 219 -238There is always a considerable difference between the corporate performance and the tax levy that is identified by the taxation authorities which has become a common practice. This fact has led to no fairness among taxpayers, a fact that influences the horizontal and vertical sides of equity. Horizontal equity is created when people feel the benefits of the tax gain that is proportional to the loss of benefits. People with more financial means should also pay more taxes that is equivalent to vertical equity. One reason for the difficulty of attaining the horizontal and vertical equities is to identify the taxpayers based on their previous taxation behavior and to deal with them effectively. The aim of this study is the design of a predictive system that evaluates the corporates taxation behavior based on their previous payments. The predicting system uses key performance variables that are identified during research and it will also help in the classification of companies based on their taxation behavior into three groups of high risk, medium risk and low risk. The system is specifically designed for the taxation authorities who are attempting to effectively assessing the risk of corporate taxes gaining. In this study, the taxation clusters of customers are identified and a decision tree is designed with 80% of accuracy by the utilization of clustering and classification algorithms and effective validation methods. The resulting models of applied algorithms investigate the taxation behavior of each customer and are capable of predicting the tax payment risk of taxpayers in the future with the addition of new corporates to the list.Keywords: Taxation Assessment, Clustering, Prediction, Trend Analysis, Data Mining
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.