به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

multiple linear regression

در نشریات گروه پزشکی
  • Fereshte Saheli, Naser Vosoughi, Zafar Riazi, Fatemeh S. Rasouli, Alireza Jowkar
    Purpose

    Online determination of the elemental composition of tissues near the Bragg peak is a challenge in proton therapy related studies. In the present work, an analysis method based on the whole spectral information is presented for the quantitative determination of the elemental composition (weight %) of an irradiated target from its emitted Prompt Gamma (PG) spectrum.

    Materials and Methods

    To address this issue, four test phantoms with different weights (%) of 12C, 16O, 20Ca, and 14N elements were considered. The simulated PG spectra were recorded using 3 × 3 inch NaI detectors. A library consisting of the spectra of single-element phantoms as well as the spectra of test-irradiated phantoms was produced for 30, 70, and 150 MeV incident protons using the Geant4 Monte Carlo toolkit. The elemental analysis was performed using the information of the whole spectrum by applying two methods, including the well-known Genetic Algorithm (GA) and Multiple Linear Regression (MLR).

    Results

    The results show that the proposed method estimates the oxygen concentration accurately. Furthermore, the estimated weights of other elements, with both methods, agree well with nominal values in each test phantom, for the considered energies.

    Conclusion

    The proposed quantitative elemental analysis of proton-bombarded phantoms using their induced PG spectrum is expected to be beneficial in treatment planning and treatment verification studies.

    Keywords: Proton Therapy, Prompt Gamma-Ray Spectrum, Whole Spectrum Analysis, Genetic Algorithm, Multiple Linear Regression
  • محسن نیازی، علی نقی زاده، منصور بازیار*
    زمینه و هدف

    کدورت آب تصفیه شده به عنوان یک پارامتر مهم در تعیین کیفیت آب آشامیدنی و یا صنعتی در تمامی تصفیه خانه ها اندازه گیری می شود. از دیر باز با توجه به اهمیت یافتن شیوع عوامل بیماریزا مثل ژیاردیا و کریپتوسپوریدیوم که عامل ایجاد بیماری های خطرناکی همچون اسهال خونی می باشند، رابطه کاهش میزان کدورت و افزایش حذف این میکروارگانیزم ها در مطالعات به اثبات رسیده است.

    مواد و روش ها

    در این مطالعه یک مدل شبکه عصبی مصنوعی و رگرسیون خطی چندگانه در پیش بینی کدورت خروجی از آب تصفیه شده تصفیه خانه شهر طبس توسعه و عملکرد آنها با هم مقایسه گردید. کل جامدات محلول، pH، ، دما و کدورت ورودی به عنوان پارامترهای ورودی مدل ها در پیش بینی ها استفاده شد. بهترین الگوریتم پس انتشار و تعداد نورون برای بهینه سازی معماری مدل تعیین شد.

    یافته ها

    نتایج نشان داد که الگوریتم لونبرگ-مارکوارت به عنوان بهترین الگوریتم انتخاب شد و تعداد نورون بهینه نیز 16 تعیین شد. همچنین نتایج تحلیل حساسیت مدل شبکه عصبی نشان داد که کدورت ورودی با مقدار 29 درصد به عنوان مهمترین پارامتر در توسعه مدل شبکه عصبی مصنوعی است.

    نتیجه گیری

    نتایج ضریب همبستگی مدل رگرسیون خطی چندگانه و مدل شبکه عصبی مصنوعی به ترتیب برای داده های آموزش 63/0 و 892/0 و برای داده های تست 60/0 و 8571/0 به دست آمد که نشان از برتری مدل شبکه عصبی مصنوعی در پیش بینی کدورت خروجی از تصفیه خانه آب طبس است.

    کلید واژگان: کدورت، تصفیه خانه آب، شبکه عصبی مصنوعی، رگرسیون خطی چندگانه، پیش بینی
    Mohsen Niazi, Ali Naghizadeh, Mansour Baziar *
    Background and purpose

    The turbidity of treated water is measured as an important parameter in determining the quality of drinking or industrial water in all treatment plants. Due to the importance of the prevalence of pathogens such as Giardia and Cryptosporidium, which cause dangerous diseases such as dysentery, the relationship between reducing turbidity and increasing the elimination of these microorganisms has been proven in studies.

    Materials and methods

    In this study, an artificial neural network (ANN) model and multiple linear regression(MLR) were developed and their performance was compared to predict the turbidity of treated water of Tabas water treatment plant. Total dissolved solids, pH, temperature and input turbidity of raw water were used as input parameters of the models in the predictions. The best backpropagation algorithm and number of neurons were determined to optimize the model architecture.

    Results

    The results showed that the Levenberg–Marquardt algorithm was selected as the best algorithm and the number of optimal neurons was determined to be 16.Also, the results of the sensitivity analysis of the neural network model showed that the input turbidity with a value of 29% is the most important parameter in the development of the ANN model.

    Conclusion

    The results of correlation coefficient of MLR and ANN models were obtained for training data 0.63 and 0.8921 and for testing data 0.60 and 0.8571, respectively, which show the superiority of ANN model in Predicting the turbidity of the output of Tabas water treatment plant.

    Keywords: Turbidity, water treatment, Artificial neural network, multiple linear regression, Prediction
  • Fariba Masoomi Sefiddashti, Saeid Asadpour, Hedayat Haddadi*, Shima Ghanavati Nasab
    Background and purpose

    In this study, the pharmacological activity of 33 compounds of furopyrimidine and thienopyrimidine as vascular endothelial growth factor receptor 2 (VEGFR-2) inhibitors to inhibit cancer was investigated. The most important angiogenesis inducer is VEGF endothelial growth factor, which exerts its activity by binding to two tyrosine kinase receptors called VEGFR-1 and VEGFR-2. Due to the critical role of VEGF in the pathological angiogenesis of this molecule, it is a valuable therapeutic target for antiangiogenesis therapies.

    Experimental approach

    After calculating descriptors using SPSS software and stepwise selection method, 5 descriptors were used for modeling in multiple linear regression (MLR) and artificial neural network (ANN). The calibration series and the test series in this study included 26 and 7 combinations, respectively.

    Findings / Results

    The performance evaluation of models was determined by the R2 , RMSE, and Q2 statistic parameters. The R2 values of MLR and ANN models were 0.889 and 0.998, respectively. Also, the value of RMSE in the ANN model was lower and its Q2 value was higher than the MLR model.

    Conclusion and implications

    The results were evaluated by different statistical methods and it was concluded that the nonlinear neural network method is powerful to predict the pharmacological activity of similar compounds, and because of the complex and nonlinear relationships, the MLR was not capable of establishing a good model with high predictive power.

    Keywords: Artificial neural network, Cancer, Multiple linear regression, Pyrimidine derivatives, QSAR
  • مهدی موسوی، فریدون دریایی، امید رنجبران، بهنام محسنی، سعیده طاهری، عبدالرضا حسن زاده*
    سابقه و هدف

    روش های مدل سازی غیر خطی برای مطالعات رابطه کمی ساختمان- اثر، راه های گویاتری نسبت به روش های خطی، برای رفتارهای مولکولی هستند. شبکه های عصبی مصنوعی، مدل ها و الگوریتم های ریاضی هستند که پردازش اطلاعات و یادگیری مغز انسان را تقلید می کنند. نشان داده شده است برخی مشتقات S-alkyl تیوسمی کاربازون در پیش گیری و درمان عفونت های مایکو باکتریایی اثر بخش بوده اند. این مطالعه با هدف یافتن ارتباط ساختار با اثر این ترکیبات انجام پذیرفت.

    مواد و روش ها

    در این مطالعه وابستگی کمی کنش و ساختار (QSAR)، از رگرسیون خطی چندگانه و شبکه عصبی مصنوعی با تنظیم بایسین برای 47 ترکیب از مشتقات تیوسمی کاربازون، استفاده گردید. توصیف کننده ها از روش انتخاب و حذف گام به گام از مجموع 343 توصیف کننده، انتخاب شدند. یک شبکه ی سه لایه ی پیش خور پس انتشار با تنظیم بایسین به وسیله نرم افزار MATLAB نسخه R2009a طراحی، بهینه و ارزیابی شد.

    یافته ها

    پس از رگرسیون خطی چندگانه یک مدل با 6 توصیف کننده حاصل شد: (039/0 ± 235/0)Qneg - (600/1 ± 706/1)PMIZ - (017/0 ± 066/0)PMIX - (018/0 ± 067/0) + 592/2 Log MIC= RDF060p (021/0 ± 064/0) RDF 140u- (026/0 ± 118/0) RDF03 +
     بهترین مدل BR-ANN یک شبکه سه لایه با سه گره در لایه مخفی بود.

    استنتاج

    مدل BR-ANN قدرت پیش بینی کنندگی بیش تری نسبت به مدل های خطی دارد و احتمالا بهتر می تواند فعالیت ضد سلی ترکیبات جدید با شالوده ساختاری یکسان در میان مشتقات تیوسمی کاربازون را پیش بینی کند.

    کلید واژگان: رابطه کمی ساختمان-اثر، رگرسیون خطی چندگانه، شبکه ی عصبی مصنوعی با تنظیم بایسین، مشتقات تیوسمی کاربازون
    Mehdi Mousavi, Fereidoon Daryaee, Omid Ranjbaran, Behnam Mohseni, Saeideh Taheri, Abdolreza Hassanzadeh*
    Background and purpose

    Nonlinear analysis methods for quantitative structure–activity relationship (QSAR) studies better describe molecular behaviors, than linear analysis. Artificial neural networks are mathematical models and algorithms which imitate the information process and learning of human brain. Some S-alkyl derivatives of thiosemicarbazone are shown to be beneficial in prevention and treatment of mycobacterial infections and this study seeks to find out the relationship between structural features and the anti-tuberculosis activity of these compounds.

    Materials and methods

    Multiple linear regression and Bayesian regularized artificial neural network (BRANN) for 47 compounds of thiosemicarbazone derivatives were designed using QSAR approaches. Descriptors were selected from a pool of 343 descriptors by stepwise selection and backward elimination. A three layer Bayesian regularized back-propagation feed-forward network was designed, optimized, and evaluated using MATLAB version R2009a.

    Results

    The best model with 6 descriptors was found using multiple linear regression analysis: Log MIC= 2.592 + (0.067 ± 0.018) PMIX – (0.066 ± 0.017) PMIZ – (1.706 ± 1.600) Qneg – (0.235 ± 0.039) RDF030p + (0.118 ± 0.026) RDF 140u – (0.064 ± 0.021) RDF060p. The best BRANN model was a three-layer network with three nodes in its hidden layer.

    Conclusion

    The BRANN model has a better predictive power than linear models and may better predict the anti-tuberculosis activity of new compounds with similar backbone of thiosemicarbazone moiety.

    Keywords: quantitative structure–activity relationship, multiple linear regression, Bayesian regularized artificial neural network, Thiosemicarbazone derivatives
  • Ashima Nagpal*, Monika Chauhan
    Background

    With an aim to design a validated two‑dimensional quantitative structure–activity relationship (2D QSAR) model, a probe was executed on a series of reported c‑Jun NH2‑terminal kinase‑1 (JNK1) inhibitors, exhibiting selectivity toward JNKs (and not other members of MAPK family).

    Objective

    The present work focused on obtaining valuable insights from the structural architecture of the selected compounds and their effects on JNK1 inhibitory activity. The present work deciphers the importance of descriptive variables, namely Verloop L (Subst. 1), Bond Dipole Moment (Subst. 2), LogP (Subst. 1), Balaban Topological index (Subst. 1), and  VAMP Total Dipole (whole molecule), in molecules possessing JNK1 inhibitory profile.

    Results

    These explanatory variables, obtained after iteratively reducing the data, did not only provide us with the substantial evidence pertaining to the dependence of bioactivity on the structural features of molecules, but also suggested the measures to optimize the selected compounds so as to obtain potent JNK1 inhibitors with good selectivity profile. Based on these distinct descriptors, exhibiting no apparent intercorrelation and manifesting good correlation with biological activity, a 2D QSAR model was generated.

    Conclusion

    Robustness of the developed model was evaluated by performing multiple linear regression, partial least square, and artificial neural network studies. The reliability and predictive ability of the developed model was ascertained through the values of standard statistical parameters, such as s = 0.38, F = 97.22, r = 0.95, r2 = 0.90, and r2cv = 0.88, for the training set compounds. The generated model was validated through the test set compounds, as well as by leave one out method

    Keywords: Artificial neural network, descriptors, insulin receptor substrate, multiple linear regression, partial least square, quantitative structure–activity relationship
  • احمد سلطان زاده*، حمیدرضا حیدری، حیدر محمدی، ابوالفضل محمدبیگی، ولی سرسنگی، میلاد درخشان جزری
    مقدمه

    بر اساس نتایج مطالعات و گزارش های ارائه شده، حوادث و آسیب های شغلی در صنایع شیمیایی باعث تحمیل خسارت های انسانی و مالی شدیدی شده اند. این حوادث می توانند حتی بقای یک صنعت شیمیایی را تهدید نمایند. شدت این حوادث در صنایع شیمیایی تحت تاثیر فاکتورهای متفاوتی می باشد. بنابراین، تحلیل علی شدت حوادث شغلی در صنایع شیمیایی می تواند به طراحی برنامه های ایمنی برای کاهش آن در این صنایع کمک نماید. این مطالعه جامع با هدف شناسایی و همچنین تجزیه وتحلیل عوامل موثر بر شدت حوادث شغلی در صنایع شیمیایی طراحی و به اجرا درآمده است.

    روش کار

    این مطالعه یک بررسی جامع مقطعی و تحلیلی بود که در 22 صنعت تولید مواد شیمیایی و طی سال های 1395-1396 انجام شده است. داده های این مطالعه بر اساس سوابق و گزارش و تحلیل حوادث جمع آوری گردید. داده های مطالعه شامل 41 متغیر مستقل و 872 حادثه در یک دوره ده ساله (1385-1394) به عنوان متغیر وابسته بود. تجزیه و تحلیل داده های این مطالعه با استفاده از نرم افزارهای SPSS نسخه 0/22 و SPSS Modeler نسخه 2/14 و بر اساس تکنیک الگوریتم انتخاب ویژگی و همچنین آنالیز رگرسیون خطی چندگانه انجام شده است. سطح معنی داری در این مطالعه 05/0 در نظر گرفته شد.  

    یافته ها

    میانگین شاخص شدت حادثه 12/145±63/214 روز محاسبه شد. میانگین سن و سابقه شغلی افراد حادثه دیده به ترتیب 85/5±05/38 و 32/6±34/9 سال بود. نتایج انتخاب ویژگی نشان داد که 30 فاکتور دارای تاثیرگذاری بالا بر شدت حوادث بوده، بعلاوه بر اساس تحلیل رگرسیونی، شدت حوادث در صنایع شیمیایی مورد مطالعه تحت تاثیر 22 فاکتور فردی، سازمانی، آموزش بهداشت، ایمنی محیط زیست (HSE)، مدیریت ریسک، اعمال ناایمن، شرایط ناایمن و همچنین نوع بروز حوادث بوده است (05/0>p).

    نتیجه گیری

    یافته های این مطالعه تایید نمود که شدت حوادث در صنایع شیمیایی بالا می باشد. بعلاوه، میزان شدت حوادث در صنایع شیمیایی از تئوری چند عاملی در حوادث پیروی می کند. یافته مهم این مطالعه بیانگر این بود که بکارگیری ترکیبی دو روش تحلیلی انتخاب ویژگی و رگرسیون خطی چندگانه می تواند برای تحلیل جامع حوادث و دیگر داده های مرتبط با حوزه بهداشت، ایمنی و محیط زیست کاربردی و سودمند باشد.

    کلید واژگان: صنعت شیمیایی، حوادث شغلی، شاخص شدت حادثه (ASR)، انتخاب ویژگی، رگرسیون خطی چندگانه
    Ahmad Soltanzadeh*, Hamidreza Heidari, Heidar Mohammad, Abolfazl Mohammadbeigi, Vali Sarsangi, Milad Darakhshan Jazari
    Introduction

    The causal analysis of occupational accidents’ severity in the chemical industries may improve safety design programs in these industries. This comprehensive study was implemented to analyze the factors affecting occupational accidents’ severity in the chemical industries.

    Methods and Materials

    An analytical study was conducted in 22 chemical industries during 2016-2017. The study data included 41 independent factors and 872 accidents in a ten-year period (2006-2015) as a dependent variable. Feature selection algorithm and multiplied linear regression techniques were used to analyze this study.

    Results

    Accident severity rate mean was calculated 214.63 ± 145.12. The results of feature selection showed that 30 factors had high impacts on the severity of accidents. In addition, based on regression analysis, the severity of accidents in the chemical industries was affected by 22 individuals, organizational, HSE training, risk management, unsafe conditions and unsafe acts, as well as accident types (p<0.05).

    Conclusion

    The findings of this study confirmed that accidents’ severity in the chemical industry followed the multi-factorial theory. In addition, the main finding of this study indicated that the combination of features selection algorithm and multiple linear regression methods can be useful and applicable for comprehensive analysis of accidents and other HSE data.

    Keywords: Chemical Industry, Occupational Accidents, Accident Severity Rate (ASR), Features Selection, Multiple Linear Regression
  • سامان مرادی، جمیل امان اللهی*، فرشید قربانی
     
    زمینه و هدف
    شناسایی آبهای زیرزمینی آلوده به آرسنیک با استفاده از پارامترهای سطحی خاک و مدلسازی این رابطه در دو مدل شبکه عصبی مصنوعی و رگرسیون خطی چندگانه میتواند در مدیریت منابع آبی منطقه مفید باشد.
    مواد و روش ها
    در این مطالعه برآورد پتانسیل آلودگی آرسنیک آب های زیرزمینی سنندج با استفاده از مدل های رگرسیون خطی چندگانه و شبکه عصبی مصنوعی مورد آزمون قرار گرفت. در این راستا از بین چاه ها ی مجوزدار
    شهرستان سنندج 35 چاه با در نظر گرفتن حوضه آبریز، پراکندگی مناسب و ساختار زمین شناختی متفاوت انتخاب 0- شدند. نمونه های آب هر چاه در ظرف های پلی اتیلنی و در دمای 4 درجه سانتیگراد و نمونه های خاک از عمق 20سانتیمتری خاک سطحی بالادست چاه ها به صورت مرکب جمع آوری و به آزمایشگاه منتقل شدند. در آزمایشگاه غلظت آرسنیک نمونه های آب با دستگاه جذب اتمی به روش کوره اندازه گیری گردید. ویژگی های فیزیکی و شیمیای خاک شامل: آرسنیک، آرسنات، آرسنیت، فسفات، نیترات، آهن کل، آهن بیشکل، منگنز کل، منگنز بیشکل، درصد رس، اندازه گیری شدند. در ادامه دقت مدل های رگرسیون چندگانه و CEC و pH ، درصد شن، درصد سیلت، ماده آلی خاک شبکه عصبی مصنوعی برای بررسی رابطه بین پارامترهای ذکر شده خاک و آرسنیک موجود درآب مورد آزمون قرار گرفت.
    یافته ها
    نتایج نشان داد که غلضت آرسنیک آبهای زیرزمینی منطقه کمتر از حد استاندارد است که این می تواند به دلیل بالا بودن غلظت آرسنات خاک های منطقه نسبت به آرسنیت و افزایش ظرفیت تبادل کاتیونی خاک تحت تاثیر ذرات رس، ماده آلی و اکسیدهای آزاد آهن باشد.
    نتیجه گیری
    مقایسه ی دقت مدل ها نیز نشان داد که مدل شبکه عصبی با 835MAE=0/ و 118 RMSE=0/ و 156 R=0/در مرحله آزمون دارایی دقت بیشتر و خطای کمتری MAE=0/ و 158 RMSE=0/ و 177 R=0/ در مرحله آموزش و 816در برآورد آلودگی آرسنیک آبهای زیرزمینی نسبت به مدل رگرسیون خطی چندگانه است.
    کلید واژگان: آرسنیک، رگرسیون خطی چندگانه، شبکه عصبی، آرسنات، آب های زیرزمینی
    Saman Moradi, Jamil Amanoallahi*, Farshid Ghorbani
     
    Background & objective
    Identification of ground waters contaminated by arsenic using surface soil parameters and modeling this relationship in two models including artificial neural network and multiple linear regression can be useful in managing the water resources of the region.
    Material &
    methods
    The purpose of the present study was to estimate the potential of arsenic pollution in the Sanandaj ground waters using multiple linear regression (MLR) and artificial neural
    network (ANN) models. In this regards, 35 number of wells were selected among the permissible wells with considering watershed area, appropriate distribution, and different geological structure. The water samples stored in polyethylene bottles and kept at 4°C until transferred to the laboratory. For consideration of the relationship between the soils characteristics around the wells and ground water, the soil samples were collected from 0-20 cm of topsoil with composite sampling technique. The soil samples were air-dried and prepared for analysis. For long term storage of water samples nitric acid were added and the concentration of arsenic in water samples were measured by graphite furnace atomic absorption analyzer. Physical and chemical characteristics of the soil samples including: arsenic, arsenate, arsenite, phosphate, nitrate, total iron, amorphous iron, total manganese, amorphous manganese, clay, sand, silt, organic matter, pH and CEC were measured. Then all water and soil data were normalized and finally, accuracy of the MLP and ANN models was assessed to investigate the relationship between arsenic of water and soil parameters.
    Results
    Results showed that the arsenic concentration of ground waters were lower than the standard level in the study area. This can be due to high concentration of arsenate in the study area soils
    compared arsenite and increasing the cationic exchange capacity of soil under the influence of clay particles, organic matter and free iron oxides.
    Conclusion
    Compression of models accuracy result showed that ANN model with R=0.835, RMSE=0.156 and MAE =0.118 in the training phase and R =0.816, RMSE=0.177 and MAE=0.158 in the testing phase has higher accuracy and lower errors in the estimation of ground waters arsenic contamination than MLP model
    Keywords: Arsenic, Groundwater, Multiple linear regression, Artificial neural network. Arsenate
  • Slobodan Gaduri *, Sanja O. Podunavac, Kuzmanovi, Milan B. Vrane, Scaron, Marija Petrin, Strahinja Z. Kovacevic
    The purpose of this work is to promote and facilitate forensic profiling and chemical analysis of illicit drug samples in order to determine their origin, methods of production and transfer through the country. The article is based on the gas chromatography analysis of heroin samples seized from three different locations in Serbia. Chemometric approach with appropriate statistical tools (multiple-linear regression (MLR), hierarchical cluster analysis (HCA) and Wald-Wolfowitz run (WWR) test) were applied on chromatographic data of heroin samples in order to correlate and examine the geographic origin of seized heroin samples. The best MLR models were further validated by leave-one-out technique as well as by the calculation of basic statistical parameters for the established models. To confirm the predictive power of the models, external set of heroin samples was used. High agreement between experimental and predicted values of acetyl thebaol and diacetyl morphine peak ratio, obtained in the validation procedure, indicated the good quality of derived MLR models. WWR test showed which examined heroin samples come from the same population, and HCA was applied in order to overview the similarities among the studied heroine samples.
    Keywords: Illicit drug, Heroin, Forensic profiling, Multiple linear regression, Wald, Wolfowitz run test
  • علیرضا احسان زاده*، فرهاد نژادکورکی، ستار خدادوستان
    زمینه و هدف
    ذرات معلق موجود در هوا با منشا طبیعی و انسانی، تاثیرات قابل توجهی بر آب و هوا، محیط زیست و سلامت انسان دارند. مطالعات اپیدمیولوژیک متعددی نشان داده اند که بین غلظت ذرات معلق با نتایج نامطلوب بهداشتی مختلف ارتباط مستقیمی وجود دارد، لذا مطالعه حاضر با هدف کلی تعیین مهم ترین پارامترهای تاثیرگذار بر غلظت PM10 ایستگاه تجریش تهران و ایجاد مدل برآوردگر PM10 انجام شد.
    روش کار
    در مطالعه حاضر یک مدل با استفاده از رگرسیون مولفه های اصلی (PCR) برای بررسی ارتباط بین غلظت ساعتی ذرات معلق کوچک تر از 10 میکرون با پارامترهای هواشناسی (سرعت و جهت باد، فشار، رطوبت و دمای هوا) و آلودگی هوای (CO، NO2، SO2، NOx، NMHC و THC) ایستگاه تجریش شهر تهران مربوط به دوره زمانی 1385 تا 1390 ارائه شد. نتایج ارزیابی عملکرد مدل PCR در مرحله آموزش و آزمون با استفاده از شاخص های آماری RMSE، MAE، R و IA مورد سنجش قرار گرفت.
    یافته ها
    نتایج ورود مولفه های اصلی به مدل رگرسیون چندگانه نشان داد که مهم ترین متغیر موثر بر غلظت PM10، دمای هوا و سرعت باد می باشند. همچنین آلاینده های CO و SO2 عوامل تشدید کننده PM10 هستند. نتایج نشان داد مدل PCR در مرحله آزمون قابلیت تخمین 41 درصد مقادیر PM10 را دارد.
    نتیجه گیری
    نتایج تحلیل رگرسیون مولفه های اصلی نشان داد که پارامترهای هواشناسی از عوامل موثر بر کاهش غلظت PM10 در محدوده ایستگاه تجریش می باشند.
    کلید واژگان: آلودگی هوا، تحلیل مولفه های اصلی، ذرات با قطر کمتر از 10 میکرون، رگرسیون خطی چندگانه، شهر تهران
    Alireza Ehsanzadeh*, Farhad Nejadkoorki, Sattar Khodadoostan
    Background and Objectives
    Air particulate matters which have natural and human made origins have significant effects on the climate, the environment and human health. Several epidemiological studies have shown a direct relationship among the concentrations of suspended particles with different adverse health effects. The general purpose of this research was to determine the most important parameters affecting on the concentration of PM10 in Tajrish station (Tehran) and develop an estimator model for PM10.
    Materials and Methods
    In this study, a model is constructed using principal component regression (PCR) for the relationship between the hourly concentration of particulate matter smaller than 10 microns with meteorological parameters (WD, WS, T, P, H) and air pollution parameters (CO, NO2, SO2, NOx, NMHC, THC) in Tajrish station (Tehran). The results of the performance evaluation of PCR model were measured in training and testing stages using RMSE, MAE, R and IA as statistical indicators.
    Results
    The results of principal components import into multiple regression model showed that the most important variable affecting on the concentrations of PM10, are air temperature and the wind speed. Also, CO and SO2 emissions were known as synergic factors for PM10 concentration. The results showed that PCR model is able to estimate 41% of PM10 concentrations in the testing.
    Conclusion
    The principal components regression analysis showed that meteorological parameters are one of most important factors affecting on the reduction of PM10 concentration in Tajrish station (Tehran).
    Keywords: : Particulate matter smaller than 10 microns, multiple linear regression, principal component analysis, air pollution, Tehran
  • Alireza Jalali, Mehdi Nekoei, Majid Mohammadhosseini
    A robust and reliable quantitative structure-property relationship (QSPR) study was established to forecast the melting points (MPs) of a diverse and long set including 250 drug-like compounds. Based on the calculated descriptors by Dragon software package, to detect homogeneities and to split the whole dataset into training and test sets, a principal component analysis (PCA) approach was used. Accordingly, there was no outlier in the constructed cluster. Afterwards, the genetic algorithm (GA) feature selection strategy was used to select the most impressive descriptors resulting in the best-fitted models. In addition, multiple linear regression (MLR) and support vector machine (SVM) were used to develop linear and non-linear models correlating the molecular descriptors and the melting points. The validation of the obtained models was confirmed applying cross validation, chance correlation along with statistical features associated with external test set. Our computational study exactly showed a determination coefficient and of 0.853 and a root mean square error (RMSE) of 11.082, which are better than those MLR model (R2=0.712, RMSE 15.042%) accounting for higher capability of SVM-based model in prediction of the theoretical values related to melting points. In fact, using the GA approach resulted in selection of powerful descriptors having useful information concerning effective variables on MPs, which can be utilized in further designing of drug like compounds with desired melting points.
    Keywords: Melting point, QSPR, Genetic algorithm (GA), Support vector machine, Multiple linear regression, Molecular descriptors
  • Bhatia Manish Sudesh *, Choudhari Prafulla Balkrishna, Ingale Kundan Bhanudas
    This paper describes 3D-QSAR analysis and biological evaluation of 1,5-benzodiazepine analogues. Benzodiazepine nucleus with its simple structure gives a good opportunity for further modification regarding an increase of its antimicrobial activity. We synthesized a series of benzodiazepine analogues from condensation of various chalcones and halo substituted o-phenelynene diamines. All compounds were assayed in vitro against, E. coli, P. aeruginosa, S. aureus. The models were generated on the Vlife MDS 3.5; selected models showed a correlation coefficient (r2) above 0.9 with cross-validated correlation coefficient (q2) above 0.8, respectively, for all the selected organisms. The 3D-QSAR models generated were externally validated for all models using a test set of 6 molecules for which the predictive r2 (r2-pred) was found to be above 0.45. The results of 3D-QSAR indicate that contours can be used to design some potent antibacterial agents.
    Keywords: Antibacterial, 1, 5-Benzodiazepine, 3D-QSAR, Multiple Linear Regression
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال