feature extraction
در نشریات گروه پزشکی-
Background
Aging of societies in recent and upcoming years has made musculoskeletal disorders a significant challenge for healthcare system. Knee osteoarthritis (KOA) is a progressive musculoskeletal disorder that is typically diagnosed using radiographs. Considering the drawbacks of X‑ray imaging, such as exposure to ionizing radiation, the need for a noninvasive, low‑cost alternative method for diagnosing KOA is essential. The purpose of this study was to evaluate the ability of a wearable device to differentiate between healthy individuals and those with severe osteoarthritis (grade 4).
MethodsThe wearable device consisted of two inertial measurement unit (IMU) sensors, one on the lower leg and one on the thigh. One of the sensors is used as a dynamic coordinate system to improve the accuracy of the measurements. In this study, to discriminate between 1433 labeled IMU signals collected from 15 healthy individuals and 15 people with severe KOA aged over 45, new features were extracted and defined in dynamic coordinates. These features were employed in four different classifiers: (1) naive Bayes, (2) K‑nearest neighbors (KNNs), (3) support vector machine, and (4) random forest. Each classifier was evaluated using the 10‑fold cross‑validation method (K = 10). The data were applied to these models, and based on their outputs, four performance metrics – accuracy, precision, sensitivity, and specificity – were calculated to assess the classification of these two groups using the mentioned software.
ResultsThe evaluation of the selected classifiers involved calculating the four specified metrics and their average and variance values. The highest accuracy was achieved by KNN, with an accuracy of 93.71 ± 1.1 and a precision of 93 ± 1.31.
ConclusionThe novel features based on the dynamic coordinate system, along with the success of the proposed KNN model, demonstrate the effectiveness of the proposed algorithm in diagnosing between signals received from healthy individuals and patients. The proposed algorithm outperforms existing methods in similar articles in sensitivity showing an improvement of 4% and at least. The main objective of this study is to investigate the feasibility of using a wearable device as an auxiliary tool in the diagnosis of arthritis. The reported results in this study are related to two groups of individuals with severe arthritis (grade 4), and there is a possibility of weaker results with the current method.
Keywords: Classification, Dynamic Coordinates, Feature Extraction, Inertial Measurement Unit, Osteoarthritis -
زمینه و هدف
سرطان پستان یکی از شایع ترین سرطان ها در زنان و عامل اصلی مرگ و میر در بیماری های سرطانی است و ماموگرافی روش تصویربرداری اولیه برای تشخیص زودهنگام توده های پستان است. تشخیص سریع با دقت بالا یکی از دغدغه های جدی پزشکان و مراکز بهداشتی درمانی در مواجهه با بیماری های خاص است، لذا هدف از این مقاله تعیین و طبقه بندی خودکار BI-RADS در گزارش های ماموگرافی با استفاده از تلفیق داده بود.
روش بررسیاین یک مطالعه توصیفی تحلیلی و گذشته نگر می باشد که در سال 1402 انجام شد، گزارش ماموگرافی و پرونده الکترونیکی بیمار که به ترتیب از سیستم بایگانی و ارتباط تصویر و سوابق بیمار استخراج شدند، از اطلاعات موجود در مرکز آموزشی درمانی بیمارستان شهیدزاده شهرستان بهبهان به دست آمده است که شامل گزارش ماموگرافی و پرونده الکترونیکی 250 بیمار است که اطلاعات کامل داشتند. برای مدل سازی روش پیشنهادی با استفاده از داده های جمع آوری شده، از نرم افزار پایتون در محیط ویژوال استودیو کد استفاده شده است. در نهایت از صحت سنجی متقاطع برای ارزیابی کیفیت و اعتبار نتایج استفاده شد.
یافته هانتایج نشان داد رویکرد پیشنهادی یعنی استفاده از تکنیک تبدیل کلمه به بردار به همراه روش فراوانی وزنی کلمات کلیدی و تلفیق آن ها با HIS تاثیر قابل توجهی بر دقت طبقه بندی متون پزشکی دارد. برای طبقه بندی سطح سیستم گزارش و داده تصویربرداری پستان (BI-RADS) از بردارهای خروجی تکنیک تبدیل کلمه به بردار در زمانی که از روش فراوانی وزنی کلمات کلیدی استفاده می شود و یا بدون استفاده از روش فراوانی وزنی کلمات کلیدی و هم چنین با تلفیق HIS و نیز بدون HIS برای طبقه بندی کننده های شبکه عصبی پیچشی، پرسپترون چندلایه، درخت تصمیم و k نزدیک ترین همسایه استفاده شد و نتایج به وسیله معیارهای ارزیابی دقت، ویژگی، حساسیت، ارزش پیش بینی شده مثبت، ارزش پیش بینی شده منفی و امتیاز f1 با هم مقایسه شدند. نتایج نشان می دهد که بهترین دقت در روش پیشنهادی با طبقه بندی کننده پرسپترون چندلایه برابر با 74/98 درصد می باشد، اما بدون HIS دقت همین طبقه بندی کننده برابر با 23/92 درصد به دست آمد.
نتیجه گیریترکیب تکنیک تبدیل کلمه به بردار با روش فراوانی وزنی کلمات کلیدی می تواند دقت طبقه بندی متن را افزایش دهد، اما سابقه پزشکی که در تشخیص بیماری مهم است، می تواند دقت را بهبود ببخشد. نتایج نشان می دهد نباید صرفا بر روی بررسی های پزشکی تمرکز کرد و از سایر اطلاعات بالینی و سابقه بیماران نیز باید استفاده کرد. بنابراین استفاده از HIS در کنار گزارش های پزشکی می تواند طبقه بندی سیستم گزارش و داده تصویربرداری پستان را بهبود ببخشد و تاثیر مثبتی بر تشخیص و فرآیندهای درمانی داشته باشد.
کلید واژگان: طبقه بندی متون پزشکی، سرطان پستان، استخراج ویژگی، سیستم گزارش و داده تصویربرداری پستان، سیستم اطلاعات بیمارستانArmaghane-danesh, Volume:29 Issue: 3, 2024, PP 365 -385Background & aimBreast cancer is one of the most common cancers in women and the main cause of death in cancer diseases, and mammography is the primary imaging method for early detection of breast masses. Rapid diagnosis with high accuracy is one of the serious concerns of doctors and healthcare centers when facing certain diseases, so the purpose of this article was to determine the automatic classification of BI-RADS in mammography reports using data fusion.
MethodsThe present descriptive, analytical, and retrospective study was conducted in 2023, the mammography report and the electronic file of the patients were extracted from the archiving and communication system of the patient's image and records obtained from the available information in the medical training center of Shahidzadeh hospital in Behbahan, Iran, which includes the mammography reports and the electronic record of 250 patients who had ample information. To model the proposed method using the collected dataset, Python software was used in the Visual Studio Code environment. Finally, cross-validation was used to evaluate the quality and validity of the results.
ResultsThe results confirmed that the proposed approach, namely the use of Word2vec combined with TFIDF, and their integration with HIS, had a significant impact on the accuracy of medical text classification. The output vectors of Word2vec were used for BI-RADS level classification when TFIDF was applied or not applied, as well as with and without the integration of HIS, for classifiers such as CNN, MLP, DT, and k-NN, and the results were compared using evaluation measures such as accuracy, precision, sensitivity, positive predictive value, negative predictive value, and F1 score. The results indicated that the best accuracy with the proposed method using the multilayer perceptron classifier was 98.74%, but without HIS, the accuracy for the same classifier was 92.23%.
ConclusionBy combining Word2vec with TFIDF, the accuracy of text classification could be increased, but the medical history of patients was important in the diagnosis of disease and could improve the accuracy. The results indicated that one should not focus only on medical reports and other clinical information and patients' history should also be used. Therefore, the use of HIS along with medical text reports could improve BI-RADS classification and have a positive effect on diagnosis and treatment processes.
Keywords: Medical Text Classification, Breast Cancer, Feature Extraction, BI-RADS, HIS -
Purpose
Independent Component Analysis (ICA) decomposition is a commonly used technique for eye blink artifact detection from Electroencephalogram (EEG) signals. Feature extraction from the decomposed ICs is a prime step for blink detection. This paper presents a new model of eye blink detection for ICA based approach, where the decomposed ICs are projected to their corresponding EEG segments (ReEEG), and feature extraction is performed on the ReEEG instead of the IC. ReEEG represents the eye blink activity more distinctly. Hence, ReEEG-based feature extraction is more potential in detecting eye blink artifacts than the traditional IC-based feature extraction.
Materials and MethodsThis paper employs twelve EEG features to substantiate the superiority of ReEEG over IC. Support Vector Machine (SVM) is used as a classifier. A dataset, having 2638 clinical EEG epochs, is employed. All the considered twelve features are extracted from ReEEG and fed to SVM one at a time for blink detection. Then the obtained results are compared with an IC-based model with the same features.
ResultsThe comparison reveals the success of the proposed ReEEG-based blink detection approach over the traditional IC-based approach. Accuracy, precision, recall, and f1 scores are calculated as performance measuring metrics. For almost all features, ReEEG-based approach achieved up to 12.25% higher accuracy, 24.95% higher precision, 13.49% higher recall, and 12.89% higher f1 score than the IC-based traditional method.
ConclusionThe proposed model will be useful for researchers in dealing with the eye blink artifacts of EEG signals with more efficacy.
Keywords: Electroencephalogram, Eye Blink Artifact, Independent Component Analysis, Support Vector Machine, Feature Extraction -
زمینه و هدف
استخراج اطلاعات از سیگنال صدای قلب و تشخیص سیگنال غیرطبیعی در مرحله اولیه می تواند نقش حیاتی در کاهش میزان مرگ و میر ناشی از بیماری های قلبی عروقی داشته باشد. از این رو، تاکنون پژوهش های متعددی در حوزه پردازش این سیگنال ها انجام شده است. لذا هدف از این پژوهش تعیین و بررسی بهبود تشخیص ناهنجاری های قلبی از طریق استخراج ویژگی از سیگنال صدای قلب با به کارگیری الگوریتم های طبقه بندی یادگیری ماشین بود.
روش بررسیاین یک مطالعه توصیفی تحلیلی می باشد که در سال 1402 در دانشگاه آزاد کازرون انجام شد، داده های پژوهش از دادگان چالش 2016 فیزیونت انتخاب شدند، پس از پیش پردازش و حذف نویز، 6 ویژگی جدید و 35 ویژگی مورد استفاده در پژوهش های پیشین در مجموع 41 ویژگی از سیگنال های صدای قلب استخراج شد. 6 ویژگی جدید عبارتند از؛ آشفتگی متوسط نسبی، ضریب اغتشاش دوره پنج نقطه ای، شیمر محلی (برحسب دسی بل)، ضریب اغتشاش دامنه سه نقطه ای، ضریب اغتشاش دامنه پنج نقطه ای و همبستگی مرکز جرم زمانی و مرکز جرم فرکانسی. ویژگی های استخراج شده به عنوان ورودی به چهار طبقه بند شامل؛ جنگل تصادفی، ماشین بردار پشتیبان، K نزدیکترین همسایه و تجزیه و تحلیل افتراق خطی اعمال شد. میزان صحت، حساسیت و اختصاصیت هر یک از طبقه بندها محاسبه گردید و به منظور بررسی تاثیر ویژگی های جدید در تشخیص ناهنجاری های قلبی، نتایج به دست آمده با پژوهش هایی که از دادگان و طبقه بندهای مشابهی استفاده کرده، ولی ویژگی های کمتری از داده ها استخراج کرده بودند مقایسه شد. داده های جمع آوری شده با استفاده از آزمون های آماری تی و رگرسیون لجستیک تجزیه و تحلیل شدند.
یافته هابیشترین مقدار صحت و حساسیت، با استفاده از طبقه بند تجزیه و تحلیل افتراق خطی به دست آمد که به ترتیب به میزان 52/91 و 19/96 می باشد. بیشترین مقدار اختصاصیت نیز در طبقه بند جنگل تصادفی به میزان 90/88 به دست آمد. طبق نتایج به دست آمده، با افزودن ویژگی های جدید، سه شاخص صحت، حساسیت و اختصاصیت در دو طبقه بند K نزدیک ترین همسایه و تجزیه و تحلیل افتراق خطی بهبود می یابد. استخراج این ویژگی ها هم چنین باعث افزایش میزان اختصاصیت در طبقه بند جنگل تصادفی می گردد.
نتیجه گیرینتایج نشان می دهد استخراج ویژگی های جدید باعث افزایش میزان صحت، حساسیت و اختصاصیت در تشخیص ناهنجاری های قلبی در مقایسه با نتایج پژوهش های پیشین شده است.
کلید واژگان: تشخیص ناهنجاری های قلبی، یادگیری ماشین، استخراج ویژگی، طبقه بندی، سیگنال صدای قلبBackground & aimExtracting information from the heart sound signal and detecting the abnormal signal in the early stage can play a vital role in reducing the death rate caused by cardiovascular diseases. Therefore, many researches have been done in processing these signals up to now. So, this study aimed to determine the improvement of heart abnormalities diagnosis by extracting features from the heart sound signal by applying machine learning classification algorithms.
MethodsThe present descriptive–analytical study was conducted at Kazerun Azad University in 2023. The research data were selected from the 2016 Physionet Challenge database. After pre-processing and noise removal, 6 new features and 35 features (41 features) used in previous researches were extracted from the heart sound signals. The 6 new features are " Relative Average Perturbation", " five-point Period Perturbation Quotient", "local shimmer (in dB)", " three-point Amplitude Perturbation Quotient " and " five-point Amplitude Perturbation Quotient " and " correlation of time center of signal and frequency center of signal". The extracted features were applied as input to four classifiers of random forest, support vector machine, K nearest neighbor and linear discriminant analysis. Accuracy, sensitivity and specificity of each classification were calculated. In order to investigate the impact of new features in the diagnosis of cardiac abnormalities, the results obtained were compared with studies that used similar data and classifications but extracted fewer features from the data. The collected data were analyzed using t-tests and logistic regression.
ResultsThe highest accuracy and sensitivity were obtained in the Linear Discriminant Analysis classifier, which are 91.52 and 96.19, respectively. The highest specificity was obtained in the Random Forest classifier at the rate of 88.90. According to the obtained results, by adding new features, the three indices of accuracy, sensitivity and specificity are improved in the two classifiers of K-nearest neighbor and Linear Discriminant Analysis. Extraction of these features also increases the level of specificity in the Random Forest classification.
ConclusionThe results indicated that the extraction of new features led to increase in the accuracy, sensitivity and specificity in the diagnosis of cardiac abnormalities compared to the results of previous researches.
Keywords: Diagnosis of cardiovascular abnormalities, Machine learning, Feature extraction, Classification, Heart sound signal -
زمینه و هدف
طیف اوتیسم یکی از اختلالات روان شناختی کودکان محسوب می شود. تشخیص به موقع و با دقت این اختلال، اهمیت فراوانی در تامین مراقبت و درمان مناسب کودکان دارد. هدف اصلی این تحقیق، تاکید بر اهمیت ویژگی های مرتبط با بیماری اوتیسم و تشخیص آن با استفاده از یک مدل هوشمند است، چراکه برخی از این ویژگی ها از درجه اولویت بالاتری برخوردارند.
روش هابدین منظور، از روش تحلیل مولفه اصلی (PCA) برای اولویت بندی ویژگی ها استفاده شد و پس از استخراج ویژگی های بهینه، با استفاده از شبکه های عصبی مصنوعی، به تشخیص خودکار بیماری پرداخته شده است.
نتایجداده های مورد استفاده در این مطالعه از مجموعه داده Kaggle جمع آوری شده اندکه شامل 1054 فرد بوده، که از این تعداد 728 نفر مبتلا به اوتیسم و 326 نفر سالم بوده اند. بررسی های این مطالعه نشان می دهد که حذف تدریجی ویژگی ها و تقلیل از 18 به 12 ویژگی، می تواند به حصول همان دقت در تشخیص طیف اوتسیم با استفاده از شبکه های عصبی مصنوعی، منجر شود.
نتیجه گیریکاهش تعداد ویژگی ها در مدل های هوش مصنوعی برای تشخیص اوتیسم، ضمن کمک به بهبود و بهینه سازی فرآیند تشخیص بیماری، می تواند منجر به کاهش استرس والدین و حفظ حریم خصوصی آنها بدلیل تعداد کمتر سوالات شده و در نهایت منجر به تولید مدل هایی با عملکرد بهتر و تفسیرپذیرتر شود.
کلید واژگان: اختلال طیف اوتیسم، شبکه عصبی مصنوعی، تحلیل مولفه اصلی، استخراج ویژگیBackground & AimAutism spectrum disorder is one of the psychological disorders in children. Timely and accurate diagnosis of this disorder is of great importance in providing appropriate care and treatment for children. The main objective of this research is to emphasize the significance of features related to autism and their diagnosis using an intelligent model, as some of these features have higher priority.
MethodsFor this purpose, the principal component analysis (PCA) method was employed to prioritize the features, and after extracting the optimal features, automatic disease diagnosis was performed using artificial neural networks.
ResultsThe data used in this study were collected from the Kaggle dataset, including 1054 individuals, out of which 728 were diagnosed with autism and 326 were healthy. The results of this study indicate that the gradual elimination of features and reduction from 18 to 12 features can lead to achieving the same accuracy in diagnosing the autism spectrum using artificial neural networks.
ConclusionReducing the number of features in artificial intelligence models for autism diagnosis not only improves and optimizes the diagnostic process but also helps in reducing parental stress and preserving their privacy due to the reduced number of questions. Ultimately, this leads to the generation of models with better performance and interpretability.
Keywords: Autism spectrum disorder, Artificial neural networks, Principal component analysis, Feature extraction -
Background
Applying efficient feature extraction and selection methods is essential in improving the performance of machine learning algorithms employed in brain-computer interface (BCI) systems.
ObjectivesThe current study aims to enhance the performance of a motor imagery-based BCI by improving the feature extraction and selection stages of the machine-learning algorithm applied to classify the different imagined movements.
Materials & MethodsIn this study, a multi-rate system for spectral decomposition of the signal is designed, and then the spatial and temporal features are extracted from each sub-band. To maximize the classification accuracy while simplifying the model and using the smallest set of features, the feature selection stage is treated as a multiobjective optimization problem, and the Pareto optimal solutions of these two conflicting objectives are obtained. For the feature selection stage, non-dominated sorting genetic algorithm II (NSGA-II), an evolutionary-based algorithm, is used wrapper-based, and its effect on the BCI performance is explored. The proposed method is
implemented on a public dataset known as BCI competition III dataset IVa.ResultsExtracting the spatial and temporal features from different sub-bands and selecting the features with an evolutionary optimization approach in this study led to an improved classification accuracy of 92.19% which has a higher value compared to the state of the art.
ConclusionThe results show that the proposed improved classification accuracy could achieve a high-performance subject-specific BCI system.
Keywords: Brain-computer interface, Motor imagery, Feature extraction, Feature selection, Optimization -
مقدمه
کووید-19 یک ویروس جدید است که باعث عفونت در دستگاه تنفسی فوقانی و ریه ها می شود که تعداد موارد مرگ و میر به طور روزانه در مقیاس یک بیماری همه گیر جهانی افزایش یافته است. تصاویر اشعه ایکس قفسه سینه برای نظارت بر بیماری های مختلف ریه مفید بوده و اخیرا برای نظارت بر بیماری کووید-19 استفاده شده است.
روشدر این پژوهش جهت بازشناسی کووید-19 از روی تصاویر x از یک فرآیند چند مرحله ای بهره گرفته شده است که در مرحله نخست عملیات پیش پردازش با هدف نرمال سازی روی داده ها صورت گرفته است. در گام دوم که مهم ترین گام روش پیشنهادی می باشد، عملیات استخراج ویژگی صورت گرفته است. عملیات استخراج ویژگی براساس شبکه های یادگیری عمیق صورت گرفته است. بعد از عملیات استخراج ویژگی از الگوریتم های یادگیری ماشین جهت دسته بندی تصاویر بهره گرفته شده است. الگوریتم های مورد استفاده در این بخش الگوریتم های ماشین بردار پشتیبان، نزدیک ترین همسایه و درخت تصمیم می باشند. نتایج این دسته بندها در گام چهارم براساس رای اکثریت ترکیب گردیده اند.
نتایجپارامترهای به کاررفته در این پژوهش جزء پارامترهای دسته بندی می باشد که شامل: دقت، صحت، فراخوان و معیار F می باشند که به ترتیب مقادیر 96/5، 92/25، 94 و 93 به دست آمده است.
نتیجه گیرینتایج آزمایش ها نشان دهنده کارایی قابل قبول روش پیشنهادی می باشد زیرا علاوه بر کاهش محاسبات توسط لایه جدا پذیر، از ترکیب دسته بندها و وزن دهی به آن ها برای به دست آوردن نتیجه نهایی استفاده گردیده است.
کلید واژگان: کووید-19، تصاویر پرتو x، استخراج ویژگی، شبکه های یادگیری عمیق، یادگیری ماشین، دسته بندیIntroductionCOVID-19 is a new virus that causes infection in the upper respiratory tract and lungs, and the number of deaths due to the disease has increased daily on the scale of a global epidemic. Chest X-ray images have been useful for monitoring various lung diseases and have recently been used to monitor COVID-19 disease.
MethodIn this research, a multi-stage process was used to recognize COVID-19 from X-ray images. In the first stage, pre-processing was done to normalize the data. In the second step, which is the most important step of the proposed method, feature extraction was done. The feature extraction operation was based on deep learning networks. After feature extraction, machine learning algorithms were used to classify images. The algorithms used in this section are support vector machine, nearest neighbor, and decision tree algorithms. The results of these categories are combined in the fourth step based on the majority vote.
ResultsThe parameters used in this research are among the classification parameters, including precision, accuracy, recall, and F-criterion, which were obtained as 96.5, 92.25, 94, and 93, respectively.
ConclusionThe results of the experiments show the acceptable efficiency of the proposed method because, in addition to reducing the calculations by the separable layer, the combination of categories and their weighting has been used to obtain the final result.
Keywords: COVID-19, X-ray Images, Feature Extraction, Deep Learning Networks, Machine Learning, Classification -
Accurate measurement of Left Ventricular Ejection Fraction (LVEF (is essential for the diagnosis and prediction of LV arrhythmias. This study aims to estimate LVEF using nonlinear and statistical processing in echocardiography images. The Cardiac Acquisition for Multi-Structure Ultrasound Segmentation (CAMUS) dataset is used to estimate LVEF. This dataset includes ultrasound images data from 60 patients in two different group (LVEF>55%, LVEF<45%). Region growing technique and Anatomical markers were used for segmentation of LV in images to measure area changes. LV area changes have been investigated using nonlinear and statistical analysis. In order to facilitate the process of estimating LVEF, feature extraction and an ANN has been used. The results show that: (1) LV area changes in LVEF<45%, has a mean of (3.254) while LVEF>55% has a lower mean of (3.071) but the mean of variance is (3.818) while for LVEF<45% is (3.471) which can be concluded that the data scatter in LVEF>55% was higher than the mean and indicates larger changes in the LV region. Estimated LVEF using nonlinear and statistical features is shows MSE of (5.15).
Keywords: Ultrasound, Left Ventricular Ejection Fraction, Nonlinear Analysis, Statistical Analysis, ImageSegmentation, Feature Extraction -
مجله پزشکی دانشگاه علوم پزشکی تبریز، سال چهل و چهارم شماره 4 (پیاپی 160، مهر و آبان 1401)، صص 281 -289
زمینه:
سرطان دهانه رحم در سلول های سطحی آغاز شده و به مرور زمان می تواند بافت های عمیق تر و بافت های اطراف را مورد تهاجم قرار بدهد. این مقاله ایده خلاقانه ای را در مورد استفاده از الگوریتم طبقه بندی ترکیبی ارایه می دهد که باعث بهبود عملکرد پیش بینی کننده سیستم هوش مصنوعی مبتنی برغربالگری سرطان دهانه رحم می شود. هدف از این تحقیق، طبقه بندی تصاویر پاپ اسمیر توسط روش های مختلف یادگیری ماشین برای دستیابی به میزان تشخیص با دقت بالا است.
روش کار:
این مطالعه بر روی 917 تصویر پاپ اسمیر از پایگاه داده ی عمومی Herlev انجام پذیرفت. در مرحله استخراج ویژگی تعداد 20 ویژگی هندسی و 76 ویژگی بافتی استخراج شده است. سپس با استفاده از روش طبقه بندی ترکیبی تصاویر به دو دسته (طبیعی و غیر طبیعی) و هفت دسته (سطحی طبیعی، متوسط طبیعی و پارابازال طبیعی و سلول های پیش سرطانی خفیف، پیش سرطانی متوسط، پیش سرطانی شدید و سلول های سرطانی) تقسیم شده اند و صحت روش پیشنهادی مورد بررسی قرار گرفته شده است.
یافته ها:
الگوریتم مورد نظر در طبقه بندی ترکیبی توانست به صحت 99/9 درصد با مدت زمان 0/028 ثانیه در طبقه بندی دوکلاسه و صحت 76/5 درصد با مدت زمان 0/033 ثانیه در طبقه بندی هفت کلاسه دست پیدا کند.
نتیجه گیری:
براساس نتایج، الگوریتم طراحی شده می تواند به عنوان یک ابزار کمک تشخیص کامپیوتری به منظور پیش آگاهی و افزایش دقت و سرعت پیش بینی خطر بروز سرطان دهانه رحم استفاده گردد.
پیامدهای عملی:
سرطان دهانه رحم یکی از شایع ترین سرطان ها در بین زنان می باشد که تشخیص به موقع بیماری می تواند از صرف هزینه های مختلف برای بیماران و مراجعات مکرر به مراکز درمانی جلوگیری به عمل آورد. در این مطالعه روش کمک تشخیصی کامپیوتری مناسبی برای تشخیص زود هنگام این بیماری و افزایش دقت در تشخیص ارایه شده است.
کلید واژگان: سرطان دهانه رحم، آزمایش پاپ اسمیر، استخراج ویژگی، طبقه بندیBackgroundCervical cancer begins in superficial cells and over time can invade deeper tissues and surrounding tissues. This paper presents a creative idea of using an ensemble classification algorithm that improves the predictive performance of an artificial intelligence system based on cervical cancer screening. This study aimed to classify Pap-smear images by different machine learning methods to achieve high accuracy detection.
MethodsThis study was performed on 917 Pap-smear images from the Herlev public database. In the feature extraction stage, 20 geometric features and 76 texture features were extracted. After that, using ensemble classification method, the images were classified into two categories (i.e., normal and abnormal) and then into seven categories (i.e., superficial epithelial, intermediate epithelial, columnar epithelial, mild dysplasia, moderate dysplasia, severe dysplasia and carcinoma) and the accuracy of the proposed method was evaluated.
ResultsThe algorithm in the ensemble classification was able to achieve accuracy of 99.9% with a processing time of 0.028 second in the two-class classification and accuracy of 76.5% with a processing time of 0.033 second in the seven-class classification.
ConclusionBased on the results, the designed algorithm can be used as a computer aided diagnostic tool to increase the accuracy and speed of predicting the risk of cervical cancer.
Practical Implications:
Cervical cancer is one of the most common cancers among women. Early diagnosis of the disease can save various costs and prevent the patients’ frequent visits to medical centers. This research proposed an artificial intelligence method for automatic classification of cervical cells and improving the accuracy of diagnosis.
Keywords: Cervical cancer, Pap smear test, Feature extraction, Classification -
Background
Drowsy driving is one of the leading causes of severe accidents worldwide. In this study, an analyzing method based on drowsiness level proposed to detect drowsiness through electroencephalography (EEG) measurements and vehicle dynamics data.
MethodsA driving simulator was used to collect brain data in the alert and drowsy states. The tests were conducted on 19 healthy men. Brain signals from the parietal, occipital, and central parts were recorded. Observer Ratings of Drowsiness (ORD) were used for the drowsiness stages assessment. This study used an innovative method, analyzing drowsiness EEG data were in respect to ORD instead of time. Thirteen features of EEG signal were extracted, then through Neighborhood Component Analysis, a feature selection method, 5 features including mean, standard deviation, kurtosis, energy, and entropy are selected. Six classification methods including K‑nearest neighbors (KNN), Regression Tree, Classification Tree, Naive Bayes, Support vector machines Regression, and Ensemble Regression are employed. Besides, the lateral position and steering angle as a vehicle dynamic data were used to detect drowsiness, and the results were compared with classification result based on EEG data.
ResultsAccording to the results of classifying EEG data, classification tree and ensemble regression classifiers detected over 87.55% and 87.48% of drowsiness at the moderate level, respectively. Furthermore, the classification results demonstrate that if only the single‑channel P4 is used, higher performance can achieve than using data of all the channels (C3, C4, P3, P4, O1, O2). Classification tree classifier and regression classifiers showed 91.31% and 91.12% performance with data from single‑channel P4. The best classification results based on vehicle dynamic data were 75.11 through KNN classifier.
ConclusionAccording to this study, driver drowsiness could be detected at the moderate drowsiness level based on features extracted from a single‑channel P4 data.
Keywords: Driving simulator, drowsy driving, electroencephalography signal, feature extraction, signal classification, supervised learning methods, vehicle dynamics -
اهداف
صرع یک بیماری اختلال مغزی است که کیفیت زندگی افراد را تحت تاثیر قرار می دهد. اگر در مراحل اولیه تشخیص داده شود، گسترش نخواهد یافت. سیگنال های الکتروانسفالوگرافی برای تشخیص تشنج های صرع استفاده می شود. با این حال، این سیستم غربالگری نمی تواند حالت های تشنج صرع را دقیقا تشخیص دهد. با وجود این، با کمک سیستم های تشخیصی به کمک رایانه (CADS)، متخصصان مغز و اعصاب می توانند مراحل تشنج صرع را به درستی تشخیص دهند. هدف از این مطالعه تشخیص تشنج صرع با استفاده از سیگنال های EEG و تشخیص مراحل مختلف آن است. CADS پیشنهادی در این مطالعه با استفاده از ویژگی های آماری و غیرخطی مختلف، قادر به تشخیص دقیق و سریع تشنج های صرع است. بنابراین، این سیستم می تواند به متخصصان مغز و اعصاب در تشخیص دقیق تر کمک کند.
مواد و روش هااین مقاله بر روی یک روش جدید برای تشخیص تشنج صرع بر اساس سیگنال های الکتروانسفالوگرام با استفاده از تکنیک های هوش مصنوعی (AI) تاکید می کند. ابتدا از مجموعه داده بن برای آزمایشات استفاده می شود و سیگنال های الکتروانسفالوگرام به فواصل پنج ثانیه ای تقسیم می شوند. سپس تبدیل موجک عامل q قابل تنظیم برای تجزیه و تحلیل سیگنال های الکتروانسفالوگرام به زیر باندهای مختلف استفاده شد. چند ویژگی آماری و غیرخطی (ابعاد فراکتال FDs)) و آنتروپی) زیرباندهای تبدیل موجک عامل Q قابل تنظیم برای روش های استفاده شده در آنتروپی و فرکتال استخراج می شوند. در روش بعدی از روش هوش مصنوعی با لایه های پیشنهادی برای کاهش ویژگی ها استفاده می شود و در نهایت الگوریتم های طبقه بندی مختلف مانند دستگاه بردار پشتیبانی با الگوریتم بهینه سازی ملخ (SVM-GOA)، نزدیک ترین همسایه K-Nearest Neighbors ،(KNN) و جنگل تصادفی استفاده می شوند. استفاده از AE برای کاهش ویژگی و SVM-GOA برای طبقه بندی، نشان دهنده تازگی این مطالعه است.
یافته هابا توجه به نتایج، روش پیشنهادی، تشخیص تشنج صرع عملکرد بهتری را در مقایسه با کارهای مرتبط نشان داد. روش طبقه بندی پیشنهادی SVM-GOA دارای میزان دقت بالاتری به میزان 99/42 و 99/23 درصد برای مشکلات طبقه بندی دوکلاسه و چند کلاسه است.
نتیجه گیریترکیب ویژگی های موثر در تشخیص دوره های تشنج صرع همراه با روش های طبقه بندی مناسب، دقت CADS را افزایش می دهد. با توجه به اهمیت تشخیص انواع حملات صرع، یک CADS با دقت بالا در این کار معرفی شده است. دقت بالا، استفاده از روش های مختلف برای استخراج ویژگی ها و طبقه بندی از جمله مزایای روش پیشنهادی ماست.
کلید واژگان: تشنج صرع، سیگنال های EEG، تشخیص، استخراج ویژگی، SVM-GOAAimsEpilepsy is a brain disorder disease that affects people’s quality of life. If it is detected at an early stage, seizures will not spread from the initial area. Electroencephalography (EEG) signals are used to diagnose epileptic seizures. However, this method cannot diagnose the state of epileptic seizure precisely. With the help of the Computer-Aided Diagnosis (CAD) system, neurologists can diagnose epileptic seizure stages correctly.
This study aims to present a novel method for epileptic seizures detection in EEG signals.Methods & MaterialsThe Bonn dataset was used in this study with avaibale EEG signals divided into 5-second windows. Then, the Tunable Q-Factor Wavelet Transform (TQWT) was utilized to decompose the segmented EEG signals into various sub-bands. Several statistical and nonlinear features based on fractal dimension and entropy algorithms were extracted from the TQWT sub-bands. Then, the Autoencoder (AE) method with 7 layers was applied to reduce the number of features. Finally, the Support Vector Machine (SVM) and Grasshopper Optimization Algorithm with SVM classifier (GOA/SVM) were used for their classification compared to the K-Nearest Neighbors and Random Forest algorithms. The employment of AE for feature reduction and GOA/SVM for classification are the novelties of this study.
FindingsThe proposed method demonstrated better performance compared to other methods used in different studies. The GOA/SVM classification method had a high accuracy rate of 99.42% and 99.23% for two-class and multi-class classification problems, respectively.
ConclusionThe combination of EEG feature classification methods increases the accuracy of the CAD system in diagnosing epileptic seizures. The method proposed in this study using different methods for extracting features and their classification has high accuracy for epileptic seizures detection.
Keywords: Epileptic seizures, Electroencephalography, Feature extraction, Grasshopper optimization algorithm, Support vector machine -
Biolmpacts, Volume:11 Issue: 2, Mar 2021, PP 101 -109Introduction
Riboswitches are short regulatory elements generally found in the untranslated regions of prokaryotes’ mRNAs and classified into several families. Due to the binding possibility between riboswitches and antibiotics, their usage as engineered regulatory elements and also their evolutionary contribution, the need for bioinformatics tools of riboswitch detection is increasing. We have previously introduced an alignment independent algorithm for the identification of frequent sequential blocks in the families of riboswitches. Herein, we report the application of block location-based feature extraction strategy (BLBFE), which uses the locations of detected blocks on riboswitch sequences as features for classification of seed sequences. Besides, monoand dinucleotide frequencies, k-mer, DAC, DCC, DACC, PC-PseDNC-General and SC-PseDNC-General methods as some feature extraction strategies were investigated.
MethodsThe classifiers of the Decision tree, KNN, LDA, and Naïve Bayes, as well as k-fold crossvalidation, were employed for all methods of feature extraction to compare their performances based on the criteria of accuracy, sensitivity, specificity, and f-score performance measures.
ResultsThe outcome of the study showed that the BLBFE strategy classified the riboswitches indicating 87.65% average correct classification rate (CCR). Moreover, the performance of the proposed feature extraction method was confirmed with average values of 94.31%, 85.01%, 95.45% and 85.38% for accuracy, sensitivity, specificity, and f-score, respectively.
ConclusionOur result approved the performance of the BLBFE strategy in the classification and discrimination of the riboswitch groups showing remarkable higher values of CCR, accuracy, sensitivity, specificity and f-score relative to previously studied feature extraction methods.
Keywords: Riboswitches, Feature extraction, Block-finding algorithm, BLBFE, Classification -
مقدمه
ترموگرافی یک روش تصویربرداری غیرتهاجمی است که می تواند جهت تشخیص سرطان پستان مورد استفاده قرار گیرد. در این مطالعه روشی جهت استخراج ویژگی های مناسب در تصاویر دینامیک ترموگرافی سینه ارایه شد. ویژگی های استخراج شده می توانند جهت طبقه بندی تصاویر ترموگرافی به سرطانی و سالم کمک کننده باشند.
روشدر این مطالعه توصیفی-تحلیلی تصاویر از پایگاه داده پروژه آنلاین IC/UFF استخراج شد. تعداد افراد مورد بررسی 196، شامل 41 مورد سرطانی و 155 مورد سالم بودند. هر فرد دارای 10 تصویر ترموگرافی که جمعا تعداد تصاویر آنالیز شده 1960 تصویر ترموگرافی بود. این تصاویر با استفاده از دوربین FLIR ThermaCam S45 ضبط شد. مدل پیشنهادی بر اساس سلسله تصاویر ترموگرافی پستان یک فرد جهت استخراج 8 ویژگی مناسب ارایه شد. ویژگی های استخراج شده شامل میانگین، انحراف معیار، آنتروپی، کورتوسیس، همگنی، انرژی، اسکوینس و واریانس است.
نتایجعملکرد ویژگی های استخراج شده، توسط طبقه بندکننده های شامل درخت تصمیم، ماشین بردار پشتیبان، تجزیه وتحلیل متقارن درجه دوم و الگوریتم K -نزدیک ترین همسایگی با استفاده از cross validation ده گانه مورد ارزیابی قرار گرفتند. مقادیر دقت و حساسیت به ترتیب، بر اساس الگوریتم های درخت تصمیم 99%، 99/33% و ماشین بردار پشتیبان 98/46%، 95/12% و تجزیه وتحلیل متقارن درجه دوم 100%، 100% و الگوریتم K -نزدیک ترین همسایگی 99%، 97/56% به دست آمد.
نتیجه گیرینتایج نشان داد که از میان ویژگی های آماری مرتبه اول، میانگین تفاوت، چولگی، آنتروپی و انحراف استاندارد ویژگی بسیار موثری هستند که بیشتر به تشخیص عدم تقارن کمک می کنند. ویژگی های استخراج شده با استفاده از مدل پیشنهادی می توانند در طبقه بندی افراد سالم و سرطانی در تصاویر حرارتی بسیار کمک کننده باشند.
کلید واژگان: مدل دینامیک، ترموگرافی، سرطان پستان، استخراج ویژگیIntroductionThermography is a non-invasive imaging technique that can be used to diagnose breast cancer. In this study, a method was presented for the extraction of suitable features in dynamic thermographic images of breast. The extracted features can help classify thermographic images as cancerous or healthy.
MethodIn this descriptive-analytical study, the images were taken from the IC/UFF database. A total of 196 people, including 41 cancer patients and 155 healthy individuals were investigated. Each person had 10 thermographic images and in total, 1960 images were analyzed. The images were captured using the FLIR ThermaCam S45 camera. The proposed model was presented based on a series of breast thermographic images of an individual to extract 8 suitable features. The extracted features included mean, standard deviation, entropy, kurtosis, homogeneity, energy, skewness, and variance.
ResultsThe extracted features were evaluated by the classifiers including the decision tree, support vector machine, quadratic symmetric analysis, and K-nearest neighbor algorithm using the ten-fold cross validation. The accuracy and sensitivity were 99% and 99.33% for decision tree algorithm, 98.46% and 95.12% for support vector machine algorithm, 100% and 100%, and 99% and 97.56% for K-nearest neighbor algorithm.
ConclusionThe results of this study showed that among the first-order statistical features, mean difference, skewness, entropy, and standard deviation are the most effective features which help to detect asymmetry. The features extracted by the proposed model can help classify the individuals into healthy or cancer-affected by thermal images.
Keywords: Dynamic Model, Thermography, Breast Cancer, Feature Extraction -
مقدمه
احساس نقش مهمی در سلامت، ارتباط و تعامل بین انسان ها دارد. توانایی شناخت حالات حسی افراد قسمت مهمی از شاخص های سلامتی و ارتباط های طبیعی است. در پایگاه داده DEAP، سیگنال های الکتروانسفالوگرام و سیگنال های فیزیولوژیکی محیطی مربوط به 32 داوطلب ثبت شده است. شرکت کنندگان در هر ویدیو از نظر سطح انگیختگی، ظرفیت، دوست داشتن/نداشتن، تسلط و آشنایی با ویدیوی مشاهده شده امتیاز داده شدند.
روشدر این مقاله رو ش تجربی و کاربردی جهت طبقه بندی ظرفیت، انگیختگی، تسلط و علاقه، توسط رتبه بندی ویژگی های استخراج شده از سیگنال ها با استفاده از الگوریتم هایی بر روی سیگنال های EEG و سیگنال های فیزیولوژیکی محیطی (نظیر سیگنال های الکترومایوگرام، الکترواوکولوگرام، پاسخ الکتریکی پوست، نرخ تنفس، پلتیسموگرام و دمای پوست) انجام گردید. پس از فراخوانی سیگنال ها از پایگاه داده و پیش پردازش اولیه آنها، ویژگی های مختلف در حوزه زمان و فرکانس از کلیه سیگنال ها استخراج گردید. در این مقاله از طبقه بندی کننده های SVM و KNN، الگوریتم خوشه بندی K-means و شبکه های عصبی PNN و GRNN جهت تشخیص و طبقه بندی احساسات استفاده شد.
نتایجدر نهایت نشان داده شد که نتایج نهایی طبقه بندی احساسات توسط روش ها و طبقه بندی کننده های مختلف در این مقاله با دقت بالا صورت می پذیرد. بهترین نتایج صحت حاصل از به کارگیری روش پیشنهاد شده با استفاده از ویژگی های استخراج شده از سیگنال های محیطی و ویژگی های استخراج شده از سیگنال های EEG به ترتیب برابر 85/5% و 82/4% به ازای ورودی طبقه بندی کننده SVM حاصل گردید.
نتیجه گیریبا توجه به نتایج نهایی درخصوص طبقه بندی احساسات در این مقاله، الگوریتم ارایه شده نتایج نسبتا مناسب تری نسبت به سایر روش های مشابه پیشین ارایه داده است.
کلید واژگان: طبقه بندی احساسات، سیگنال های EEG، سیگنال های فیزیولوژیک، استخراج ویژگی، پردازش سیگنال هاDetection and Classification of Emotions Using Physiological Signals and Pattern Recognition MethodsIntroductionEmotions play an important role in health, communication, and interaction between humans. The ability to recognize the emotional status of people is an important indicator of health and natural relationships. In DEAP database, electroencephalogram (EEG) signals as well as environmental physiological signals related to 32 volunteers are registered. The participants in each video were rated in terms of level of arousal, capacity, liking/disliking, proficiency, and familiarity with the video they watched.
MethodIn this study, a practical empirical method was adopted to classify capacity, arousal, proficiency, and interest by ranking the features extracted from signals using algorithms on EEG signals and environmental physiological signals (such as electromyography (EMG), electrooculography (EOG), galvanic skin response (GSR), respiration rate, photoplethysmography (PPG), and skin temperature. After initializing the signals from the database and pre-processing them, various features in the time and frequency domain were extracted from all signals. In this study, SVM and KNN classifiers, K-means clustering algorithm, and neural networks, such as PNN and GRNN were used to identify and classify emotions.
ResultsIt was indicated in this study that the results of the classification of emotions using various methods and classifiers were well-established with high accuracy. The best accuracy results were obtained by applying the proposed method using SVM classifier based on features extracted from environmental signals (85.5%) and EEG signals (82.4%).
ConclusionAccording to the results of the classification of emotions in this study, the proposed algorithm provides relatively better results compared with previous similar methods.
Keywords: Classification of Emotions, EEG Signals, Physiological Signals, Feature Extraction, Signal Processing -
زمینه و هدف
سرطان پستان مهم ترین و رایج ترین بیماری در بین زنان است که دومین میزان مرگ و میر را بعد از سرطان ریه به خود اختصاص داده است. ماموگرافی دیجیتال تصویر گرفته شده با استفاده از اشعه x برای تجزیه و تحلیل، تفسیر و تشخیص می باشد. تشخیص خودکار سرطان پستان در تصاویر ماموگرافی یک وظیفه چالش برانگیز در بین سیستم های تشخیص به کمک کامپیوتر(CAD) می باشد.
روش کاردر این مقاله یک راهکار برای تشخیص اتوماتیک سرطان پستان ارایه شده است. راهکار ارایه شده شامل 3 مرحله اصلی استخراج ناحیه پستان، حذف عضله پکتورال و طبقه بندی ویژگی های استخراج شده به دو دسته سرطانی و غیر سرطانی می باشد.
یافته هابرای قطعه بندی از روش آستانه گذاری اتسو و سپس حذف عضله پکتورال با استفاده از انتخاب پیکسل دانه و الگوریتم رشد ناحیه میسر شده است. در مرحله بعدی ماتریس هم وقوعی خاکستری تصویر (GLCM)که توصیف کننده بافت تصویر است ایجاد شده و 16 ویژگی از آن استخراج می شود. در نهایت طبقه بندی های مختلفی برای تفکیک ناحیه پستان به بافت های نرمال و سرطانی، آموزش داده می شوند. در نتایج به دست آمده نرخ تشخیص صحیح 100 درصد برای شبکه عصبی و3/96 درصد برای طبقه بندهای درخت تصمیم گیری (C5.0,CHAID) بدست آمده است.
نتیجه گیری:
اعتبار سنجی راهکار ارایه شده در این مقاله با استفاده از داده های پایگاه mini-MIAS انجام شده است و نتایج با کار های قبلی انجام شده مقایسه شده است که نشان می دهد راهکار ارایه شده می تواند با اطمینان برای تشخیص سرطان پستان اعمال شود.
کلید واژگان: سیتم CAD، سرطان پستان، قطعه بندی، استخراج ویژگی، شبکه عصبی مصنوعی، درخت تصمیم گیریBackgroundBreast cancer is the most common type of cancer and the second leading cause of cancer death among American women. In Iran, the rate of breast cancer is lower than in industrialized and western countries, but with the growing trend, it is predicted that breast cancer will become one of the most common cancers in the country in the future. Mammography is currently one of the most effective and popular methods for screening and diagnosing breast cancer. Breast cancer is the primary and most common disease found in women which causes second highest rate of death after lung cancer. The digital mammogram is the X-ray of breast captured for the analysis, interpretation, and diagnosis. Automatic detection of breast cancer in mammograms is a challenging task in Computer Aided Diagnosis (CAD) techniques. This article aims to provide an automated computer diagnostic system to help diagnose early breast cancer. First, breast cancer and the survival statistics of patients with it, breast imaging techniques, and the presence of symptoms that are present in the images are signs of the disease. In the following, by introducing important and efficient methods in designing automatic diagnostic systems and its structure in order to distinguish cancerous images from non-cancerous breasts, the results obtained from this research and validations have been presented.
MethodsBreast cancer, one of the most common cancers in women, has a high mortality rate. Providing a medical assistance system for early detection of abnormalities associated with this cancer will greatly assist pathologists in identifying the causes of the disease and increase performance and accuracy in diagnosis. Studying the background of research in this field to better understand the problem and how to design this system in different ways gives us a more accurate view of this issue and also defines the design challenges of such a system. The results obtained by the methods presented in this paper are abbreviated as BMD_ML. A total of 64 mammograms, 23 cancer images containing benign and malignant masses, and 41 non-cancerous images were used to evaluate the methods used in this paper, and the results were obtained from the inputs of these images. A combination of digital image processing methods, random statistics and machine learning methods is used to perform the pre-processing, segmentation and extraction of ROI, feature extraction and classification at the lowest error rate. CAD is used in mammography screening. Mammography screening is used to detect early breast cancer. The CAD system helps diagnose lesions and classify benign and malignant tumors. This system is mostly used in the United States and the Netherlands. The first CAD system for mammography was developed during a research project at the University of Chicago. CAD systems, despite their high sensitivity, have very few features; This makes the benefits of using CAD unclear. In this report we present a methodology for breast cancer detection in digital mammograms. Proposed methodology consists of three major steps like segmentation of breast region, removal of pectoral muscle and classification of breast muscle into cancerous and normal tissues.
ResultsThis article aims to provide an automated computer diagnostic system to help diagnose early breast cancer. First, breast cancer and the survival statistics of patients with it, breast imaging techniques, and the presence of symptoms that are present in the images are signs of the disease. Then, important and efficient methods in designing automatic diagnostic systems and its structure are introduced and the work done in the past is examined by researchers active in this field. Finally, the techniques used in this paper are presented in order to distinguish between cancerous and non-cancerous breast cancer images. Segmentation of breast muscle was performed by employing Otsus segmentation technique, afterwards removal of pectoral muscle is carried out by seed selection and region growing technique. In next step, Gray Level Co-occurrence Matrices (GLCM) was created form which several features were extracted. At the end, several classifiers were trained to classify breast region into normal and cancerous tissues. The proposed classifier reports classification accuracy of 100 % for ANN and 96.3 % for decision tree algorithms (C5.0 and CHAID). Proposed methodology was validated on Mini-MIAS database and results were compared with previously proposed techniques, which shows that proposed technique can be reliably apply for breast cancer detection. Classification includes the final stage of designing such a system. Machine learning techniques have good performance for classifying tissue features obtained from mammograms. Machine learning is generally divided into two categories, supervised and uncontrolled. Learning without supervision requires a large amount of data to train the network. The classification methods used in this dissertation are one of the supervised methods, so that when creating a feature vector matrix, a column is assigned to whether the data is cancerous or non-cancerous. This method both speeds up learning and compares classified data with the predetermined target value when testing them. In this paper, several machine learning methods will be used to classify methods for classifying and comparing diagnostic accuracy. In this paper, classifications are performed in SPSS modeler software.
ConclusionNumerous methods for extracting features were provided in the Overview of Features Extraction section. The solution presented in this article is to use a GLCM matrix. The matrix of gray surfaces always gives rise to different combinations of the brightness of the pixels in the image. CAD systems, despite their high sensitivity, have very few features; This makes the benefits of using CAD unclear. It can concluded that CAD could not have a significant effect on cancer detection rates, but it would inadvertently increase the recall rate (ie, the FP rate); However, various studies have shown significant inconsistencies in recall effects. In the design of the CAD system, the partitioning and extraction of the feature are of special importance. It should be noted to what extent the extraction characteristics describe the segmented area. In the future, in order to increase the accuracy of classifications and commercialization of this system, flexible features can be extracted from the image, which in addition to the lack of overlap between the features can be very compatible with machine learning methods. It is also possible to classify between types of anomalies, and after diagnosing whether the image is cancerous or non-cancerous, the type of anomaly associated with it can be identified.
Keywords: CAD system, Breast cancer, Segmentation, Feature extraction, ANN, Decision tree classifiers -
Background and Objectives
One of the currently important and widely used research subjects in the healthcare area of cancer patients is the diagnosis procedure of cancer tumors and metastases in magnetic resonance imaging such that it has a high level of accuracy and also be a support for doctors in interpreting and diagnosing medical data. To this aim, a multivariate Hotelling’s T2 control chart is used.
MethodsUsing a two-dimensional discrete wavelet transform, some features of the image texture are extracted by using statistical and transform methods. Then, to reduce the data dimensions and feature selection, a genetic algorithm is used. Afterward, two methods including fuzzy c-Means clustering algorithm and a multivariate Hotelling’s T2 control chart are used to diagnose bone marrow metastasis patients.
ResultsFrom 204 bone marrow samples, 76 features are extracted from which six ones are selected and a 204×6 feature vector matrix is generated. Finally, the performance of the proposed two methods is compared. The results show that the diagnosis and accuracy measures of multivariate Hotelling’s T2 control chart are better than the other method.
ConclusionsIn the context of cancer, one of the current concerns for healthcare providers is to use non-invasive, short response time, and highly accurate methods in diagnosing tumors and metastases. The proposed method appropriately addresses these requirements.
Keywords: Bone marrow metastases, Multivariate Hotelling’s T2 control chart, Fuzzy Clustering, Feature Extraction -
Background and Aim
We aim to build a classifier to distinguish between malaria-infected red blood cells (RBCs) and healthy cells using the two-dimensional (2D) microscopic images of RBCs. We demonstrate the process of cell segmentation and feature extraction from the 2D images.
Methods and MaterialsWe describe an approach to address the problem using mixture discriminant analysis (MDA) on the 2D image profiles of the RBCs. The extracted features are used with Gaussian MDA to distinguish between healthy and malaria infected cells. We also use the neutral zone classifiers where ambiguous cases are identified separately by the classifier.
ResultsWe compare the classification results from the regular classifiers such as linear discriminant analysis (LDA) or MDA and the methods where neutral zone classifiers are used. We see that including the neutral zone improves the classification results by controlling the false positive and false negatives. The number of misclassifications are seen to be lower than the case without neutral zone classifiers.
ConclusionThis paper presents an alternative approach for classification by incorporating neutral zone classifier approach, where a prediction is not made for the ambiguous cases. From the data analysis we see that this approach based on neutral zone classifiers presents a useful alternative in classification problems for various applications.
Keywords: Cell segmentation, Conditional misclassification rates, Feature extraction, Receiver operating characteristic, Sensitivity, specificity -
IntroductionBrain-Computer Interface (BCI) systems provide a communication pathway between users and systems. BCI systems based on Steady-State Visually Evoked Potentials (SSVEP) are widely used in recent decades. Different feature extraction methods have been introduced in the literature to estimate SSVEP responses to BCI applications.MethodsIn this study, the new algorithms, including Canonical Correlation Analysis (CCA), Least Absolute Shrinkage and Selection Operator (LASSO), L1-regularized Multi-way CCA (L1-MCCA), Multi-set CCA (MsetCCA), Common Feature Analysis (CFA), and Multiple Logistic Regression (MLR) are compared using proper statistical methods to determine which one has better performance with the least number of EEG electrodes.ResultsIt was found that MLR, MsetCCA, and CFA algorithms provided the highest performances and significantly outperformed CCA, LASSO, and L1-MCCA algorithms when using 8 EEG channels. However, when using only 1 or 2 EEG channels d, CFA method provided the highest F-scores. This algorithm not only outperformed MLR and MsetCCA when applied on different electrode montages but also provided the fastest computation time on the test set.ConclusionAlthough MLR method has already demonstrated to have higher performance in comparison with other frequency recognition algorithms, this study showed that in a practical SSVEP-based BCI system with 1 or 2 EEG channels and short-time windows, CFA method outperforms other algorithms. Therefore, it is proposed that CFA algorithm is a promising choice for the expansion of practical SSVEP-based BCI systems.Keywords: Brain-Computer Interface (BCI), Electroencephalogram (EEG), Feature extraction, Steady-State Visually Evoked Potential (SSVEP)
-
مجله دانشکده پزشکی دانشگاه علوم پزشکی مشهد، سال شصت و یکم شماره 5 (پیاپی 160، آذر و دی 1397)، صص 1178 -1187مقدمه در سال های اخیر علاقه به پژوهش در زمینه به کارگیری الگوریتم های هوشمند در تشخیص و طبقه بندی بیماری ها به ویژه سرطان، به شدت افزایش یافته است. طبقه بندی تومور یک کار مهم در تشخیص پزشکی محسوب می شود. روش های محاسبات نرم افزاری به دلیل عملکرد طبقه بندی آنها در تشخیص بیماری های پزشکی اهمیت زیادی دارند. تشخیص و طبقه بندی تصاویر پزشکی یک کار چالش برانگیز است. روش کار برای تشخیص درجه بدخیمی سرطان پروستات و خوش خیم یا بد خیم بودن سرطان سینه از طبقه بندی کننده شبکه عصبی عمیق به کمک فریمورک تنسورفلو و بهره گیری از کتابخانه کراس استفاده شده است. در مرحله آموزش، تصاویر آموزشی به همراه کلاس خروجی آن برای شبکه در نظر گرفته می شود. حین آموزش وزن های فیلتر در هر تکرار به روز می شوند. به نحویکه بعد از چندین تکرار وزن های بهینه به روز می شوند و شبکه آموزش می بیند تا بهترین ویژگی را از تصاویر استخراج کند. نتایج روش پیشنهادی در این تحقیق که بر پایه شبکه های عصبی عمیق است، با توجه به استخراج ویژگی های موثرتر و دقیق تر، دقت تشخیص 83/95 %و 5/99 %به ترتیب در سرطان سینه و سرطان پروستات را فراهم می آورد که نسبت به روش های موجود باعث افزایش بیش از 7% در دقت تشخیص گردیده است. نتیجه گیری سرطان یکی از شایع ترین بیماری های پیش رونده در جهان است. سرطان در سلول ها آغاز می شود که پایه های ساختمانی اولیه هستند که بافت را تشکیل می دهند. یکی از چالش های موجود در تکنیک های تشخیص تصاویر پزشکی، مشکل در تجزیه و تحلیل بافت های متراکم است. با توجه به اینکه تشخیص توسط انسان زمان بر و دارای احتمال خطای بیشتری است، محققان در تلاش بوده اند تا با الگوریتم های مختلف تشخیص را به صورت اتوماتیک انجام دهند.کلید واژگان: یادگیری عمیق، سرطان پروستات، سرطان سینه، استخراج ویژگیAbstractIntroductionIn recent years, interest in research into the application of intelligent algorithms for diagnosis and categorization of diseases, especially cancer has increased dramatically. Tumor classification is an important task in medical diagnosis. Technological calculations are important due to their classification function in diagnosis of medical illnesses. Diagnosing and classifying medical images is a challenging task.Materials and MethodsTo detect the malignancy of prostate cancer and the opioid or malignant breast cancer, deep neural network classifier, which is based on Tensor flow framework and Keras library, is used. In the training phase, educational images are considered along with the output class for the network. During training, the weight of the filter is updated every time. However, after several replications, optimal weights are updated and the network is trained to extract the best feature from the images.ResultsIn this research, the proposed method due to using deep neural network and accurate feature extraction provides detection accuracy about 95.83% and 99.5% for breast and prostate cancers, respectively, which is more than 7% compared to other methods.ConclusionCancer is one of the most prevalent diseases in the world. Cancer is started from the cells, which are the basic building blocks making the tissue. One of the challenges in medical diagnostic techniques is the difficulty in analyzing dense tissues. Since the detection of the diagnosis by human is time-consuming and has a higher probability of error, the researchers have been trying to detect it automatically by using different algorithms.Keywords: Deep learning, Prostate cancer, Breast Cancer, Feature Extraction
-
مقدمهبا افزایش امید به زندگی در جهان بویژه در کشورهای پیشرفته، بیماری آلزایمر به یکی از مهم ترین و پرهزینه ترین بیماری ها تبدیل شده است. تخمین زده مd شود که شیوع آلزایمر بعد از 60 سالگی به ازای هر 5 سال دو برابر خواهد شد. متاسفانه این بیماری و انواع دیگر بیماری های فراموشی هزینه زیادی بر جوامع مختلف تحمیل می کنند. در این مقاله، یک روش هوشمند برای تشخیص اتوماتیک بیماری آلزایمر جهت کمک به تشخیص پزشک ارائه و ارزیابی شده است.مواد و روش هاداده های تصویربرداری تشدید مغناطیسی از 236 بیمار در این مطالعه مورد استفاده قرار گرفت. ابتدا با پردازش تصاویر، نواحی سفید، خاکستری و مغزی-نخاعی مغز شرکت کنندگان استخراج شده و مساحت آنها محاسبه گردید و به عنوان بردار ویژگی برای طبقه بندی استفاده شد. سپس طبقه بندی کننده های ماشین پشتیبان بردار و شبکه های عصبی آموزش داده شده و برای طبقه بندی بیماران آلزایمری از افراد سالم مورد استفاده قرار گرفت.یافته هامساحت نواحی خاکستری مغز در بیماران آلزایمری بطور معنی داری کمتر از افراد سالم بود ( 02 / P=0 ). با استفاده از بردار ویژگی مساحت نواحی و استفاده از شبکه های عصبی به عنوان طبقه بندی کننده، بیماران آلزایمری با دقت 85 % از افراد سالم شناسایی شدند.نتیجه گیریبیماری آلزایمر باعث کاهش مساحت و حجم نواحی خاکستری مغز می شود که این تغییرات غیر قابل بازگشت می باشند. استفاده از روش های هوشمند می تواند این تغییرات را شناسایی کرده و بیماری آلزایمر را تشخیص دهد. این رو شها می توانند برای کمک به تشخیص پزشک در فرایند تشخیص بیماری آلزایمر مورد استفاده قرار بگیرند.کلید واژگان: آلزایمر، نواحی مغز، ناحیه سفید، ناحیه خاکستری، ناحیه مغزی نخاعی، استخراج ویژگی، تفکیک و طبقه بندیIntroductionBy increasing life expectancy in the world, especially in developed countries, Alzheimer’s disease has become one of the most important and costly diseases. It is estimated that the prevalence of dementia will double every 5 years for people over 60 years. Unfortunately, this disease and other types of dementias impose a heavy burden on the economies of societies. In this study an automated method is presented and evaluated for Alzheimer disease detection in order to assist physician diagnosis. Methods and Materials: Magnetic resonance images of 236 patients were used. First, the gray and white matter regions and cerebrospinal fluid were extracted by image processing methods and their area were calculated and considered as feature vector for classification. Then, the support vector machine and neural networks were used to classify the Alzheimer patients from healthy ones.ResultsThe gray matter region areas were significantly lower in Alzheimer group than healthy one. Using the regions area as feature vector and by means of support vector machine and neural networks as classifiers, a detection accuracy of 85% was achieved. Discussion andConclusionAlzheimer disease reduces the area of gray matter in brain which this changes are irreversible. Intellectual methods can detect this changes and diagnose Alzheimer disease. This methods could be used to assist physician for detection of disease.Keywords: Alzheimer, Brain Matter, White Matter, Feature Extraction, Classification
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.