classifier combination
در نشریات گروه برق-
بیمه بیکاری یکی از مهم ترین و پرطرفدارترین انواع بیمه در دنیای امروزی محسوب می شود. سازمان تامین اجتماعی در مقابل ادعای بیکاری افراد تحت پوشش این سازمان، وظیفه بررسی صحت این موضوع را دارد. بررسی دستی ادعای افراد بیکار نیازمند صرف زمان و هزینه زیادی است. روش های داده کاوی و یادگیری ماشین به عنوان ابزارهای کارآمد تحلیل داده ها می تواند در خودکارسازی این فرآیند به سازمان تامین اجتماعی کمک کنند. در این پژوهش، روشی مبتنی بر یادگیری نظارتی برای بررسی صحت ادعای بیکاری افراد متقاضی ارایه شده است. روش پیشنهادی، اطلاعات بیمه شدگان را به عنوان ورودی دریافت کرده و پس از تحلیل داده ها به هر فرد متقاضی امتیازی تخصیص می دهد. سپس بر اساس مقدار این امتیاز، مدعیان بیمه بیکاری را به دو گروه "شایسته دریافت بیمه بیکاری" و "فاقد کفایت برای دریافت بیمه بیکاری" دسته بندی می کند. روش پیشنهادی از دو ترکیب مختلف برای دسته بندی ادعای متقاضیان استفاده می کند: روش BSA-SVM و روش ترکیب ضرایب اطمینان طبقه بندها. در روش BSA-SVM برای بهبود کارایی و تخمین پارامترهای کنترلی SVM، از الگوریتم بهینه سازی جستجوی عقبگرد (BSA) استفاده شده است. در روش ترکیب ضرایب اطمینان طبقه بندها، تعدادی طبقه بند، از جمله شبکه های عصبی مصنوعی، درخت تصمیم و رگرسیون لجستیک داده ها را طبقه بندی کرده و ضرایب اطمینان این طبقه بندها با دو روش مختلف با همدیگر ترکیب می شوند. نتایج آزمایش ها نشان می دهد که روش پیشنهادی BSA-SVM با کسب 87% و روش ترکیب طبقه بندها با ضرایب اطمینان با کسب دقت 86%، کارایی بهتری در قیاس با سایر روش های موجود کسب کرده اند.
کلید واژگان: بیمه بیکاری، داده کاوی، یادگیری ماشین، یادگیری نظارتی، BSA-SVM، ترکیب طبقه بندهاUnemployment insurance is one of the most popular insurance types in the modern world. The Social Security Organization is responsible for checking the unemployment benefits of individuals supported by unemployment insurance. Hand-crafted evaluation of unemployment claims requires a big deal of time and money. Data mining and machine learning as two efficient tools for data analysis can assist Social Security Organization in automating this process. In this research work, a hybrid supervised learning method is proposed to verify the eligibility of applicants for unemployment. The proposed method takes as input the information of insured individuals, and assigns a numeric score to each applicant through analyzing the input data. Then, claimants are classified into two groups according to those scores: "Qualified” and "Unqualified". The proposed method includes two hybrid strategies: BSA-SVM and combination of confidence values. In BSA-SVM method, backtracking search algorithm (BSA) is used to estimate the prameters of support vector machines (SVM) and improves the classification performance. In the second approach, confidence values extracted from individual classofiers are combined to better classify the input data. Empirical evaluation shows an accuracy of 87% for BSA-SVM and 86% for the second approach.
Keywords: Unemployment benefits, data mining, machine learning, supervised learning, BSA-SVM, classifier combination -
بازیابی تصویر مبتنی بر محتوا استفاده از روش های بینایی ماشین برای بازیابی تصاویری از یک مجموعه است که به تصویر پرس وجو شبیه باشند. چالش اصلی این سیستم ها کاهش شکاف معنایی بین ویژگی های سطح پایین مستخرج از پیکسل و قطعه تصویر و مفاهیم سطح بالای موجود در آن است. یکی از روش های کاهش این فاصله استفاده از ویژگی های سطح بالای مستخرج از نواحی و اشیا برای بازیابی است. از طرفی ویژگی های سطح پایین نیز تمایز خوبی بین خود تصاویر اعمال می کنند. بر این اساس انتظار می رود استفاده از هر دو دسته ویژگی به نتایج بهتری منجر شود. در این پژوهش بازیابی تصویر در چهار سطح پیکسل، ناحیه، شیء و مفهوم انجام شده است و از همجوشی نتایج این سطوح به منظور کاهش شکاف معنایی استفاده شده است. در سطح پیکسل، از ویژگی های SIFT و LBP استفاده شده است. در سطح ناحیه، ابتدا تصویر به چند ناحیه افراز و سپس ویژگی های رنگ و بافت با استفاده از توصیفگر Hue و فیلتر گابور از هر یک از نواحی تصویر استخراج شده است. در سطح شیء از شبکه عصبی کانولوشنی AlexNet برای بازشناسی اشیاء و صحنه های درون تصویر و در سطح مفهوم از شبکه عصبی Word2vec برای سنجش شباهت معنایی تصاویر استفاده شده است. نتایج بازیابی روی دو پایگاه داده Wang و GHIM نشان دهنده بهبود دقت و فراخوانی در بازیابی تصویر است.
کلید واژگان: بازیابی تصویر مبتنی بر محتوا، همجوشی اطلاعات، ترکیب طبقه بندها، AlexNet، Word2vecContent based image retrieval (CBIR) applies machine vision techniques to extract similar images for a given query image. The main challenge of CBIR is the semantic gap between low level pixel and segment based features and high-level concepts in the image. An approach towards reducing this gaps is to use high level region and object based features. However, the low-level features describe image details and enforce between image discriminations. Accordingly, it is expected that the use of both feature types will lead to better results. This paper tries to reduce the mentioned gap by combining decision results at four granularities, namely pixel, region, object, and concept levels. Pixel level retrieval adopts SIFT features and local binary patterns. Region level subsystem partitions the image into a set of segments and extracts their color and texture features using hue descriptor and Gabor filters for subsequent processing. AlexNet convolutional neural network is employed for object based retrieval. Word2vec embedding is used for concept level retrieval that exploits conceptual relations between objects to enhance the retrieval results. Experiments over Wang and GHIM datasets confirm the feasibility of the proposed combination and conclude that it improves overall performance of the retrieval system.
Keywords: Content based Image Retrieval, Information Fusion, Classifier Combination, AlexNet, Word2vec -
Chemical Named Entity Recognition (NER) is the basic step for consequent information extraction tasks such as named entity resolution, drug-drug interaction discovery, extraction of the names of the molecules and their properties. Improvement in the performance of such systems may affects the quality of the subsequent tasks. Chemical text from which data for named entity recognition is extracted is naturally imbalanced since chemical entities are fewer compared to other segments in text. In this paper, the class imbalance problem in the context of chemical named entity recognition has been studied and adopted version of random undersampling for NER data, has been leveraged to generate a pool of classifiers. In order to keep the classes’ distribution balanced within each sentence, the well-known random undersampling method is modified to a sentence based version where the random removal of samples takes place within each sentence instead of considering the dataset as a whole. Furthermore, to take the advantages of combination of a set of diverse predictors, an ensemble of classifiers trained with the set of different training data resulted by sentence-based undersampling, is created. The proposed approach is developed and tested using the ChemDNER corpus released by BioCreative IV. Results show that the proposed method improves the classification performance of the baseline classifiers mainly as a result of an increase in recall. Furthermore, the combination of high performing classifiers trained using undersampled train data surpasses the performance of all single best classifiers and the combination of classifiers using full data.Keywords: Chemical Named Entity recognition, Class Imbalance Problem, Random Undersampling, Classifier Combination
-
Journal of Electrical and Computer Engineering Innovations, Volume:1 Issue: 2, Summer - Autumn 2013, PP 99 -105Sleep stages classification is one of the most important methods for diagnosis in psychiatry and neurology. In this paper, a combination of three kinds of classifiers are proposed which classify the EEG signal into five sleep stages including Awake, N-REM (non-rapid eye movement) stage 1, N-REM stage 2, N-REM stage 3 and 4 (also called Slow Wave Sleep), and REM. Twenty-five all night recordings from Physionet database are used in this study. EEG signals were decomposed into the frequency sub-bands using wavelet packet tree (WPT) and a set of statistical features was extracted from the sub-bands to represent the distribution of wavelet coefficients. Then, these statistical features are used as the input to three different classifiers: (1) Logistic Linear classifier, (2) Gaussian classifier and (3) Radial Basis Function classifier. As the results show, each classifier has its own characteristics. It detects particular stages with high accuracy but, on the other hand, it has not enough success to detect the others. To overcome this problem, we tried the majority vote combination method to combine the outputs of these base classifiers to have a rather good success in detecting all sleep stages. The highest classification accuracy is obtained for Slow Wave Sleep as 81.68% in addition to the lowest classification accuracy of 43.68% for N-REM stage 1. The overall accuracy is 70%.Keywords: sleep stages classification, EEG signals, wavelet packets, classifier combination, majority voting
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.