predictive modeling
در نشریات گروه علوم پایه-
This research study focuses on the utilization of machine learning models to predict transesterification reactions using zirconium-based Metal-Organic Framework (MOF) as a catalyst. Various machine learning algorithms, including Multiple Linear Regression (MLR), Polynomial regression (PLR), Decision Tree (DT), Random Forest (RF), Adaboost (AB), XGBoost (XGB), K-Nearest Neighbors (KNN), Support Vector Machines (SVM), and Artificial Neural Networks (ANN), were employed to analyze the collected data. The performance of each model was evaluated using mean accuracy and median accuracy metrics. Among the tested models, XGBoost exhibited the highest predictive accuracy, with a mean accuracy of 91.07% and a median accuracy of 96.72%. These results demonstrate that XGBoost effectively captures the intricate relationships between the input features and the outcomes of transesterification reactions. Furthermore, a feature importance analysis conducted using XGBoost revealed the relative significance of various factors in the reaction process. The analysis revealed that the preparation method held the highest importance. The factors ranked by importance were: preparation method, catalyst loading, alcohol type, reaction temperature, MOF, reaction time, acid functionalized, base functionalized, metal precursor, and linker. These findings enhance our understanding of transesterification reactions catalyzed by zirconium-based MOFs and highlight the effectiveness of machine learning models in predicting their outcomes.Keywords: Transesterification Reactions, Zirconium-Based Metal-Organic Framework, Machine Learning, Xgboost, Predictive Modeling, Feature Importance
-
بیش از 50 سال پیش، جان توکی فراخوانی برای بازسازی آمار دانشگاهی داد. او در مقاله « آینده تحلیل داده ها » به وجود علمی اشاره کرد که آن زمان به رسمیت شناخته نشده بود و موضوع مورد توجه آن یادگیری از داده ها یا « تحلیل داده ها » بود. پدیده ای مربوط به این اواخر که رو به گسترش نیز است ، ظهور برنامه های « علم داده » در دانشگاه های بزرگ است. این مقاله در پی مرور برخی از اجزای « برهه علم داده» کنونی، ازجمله بر اظهارنظرهای اخیر درباره علم داده در رسانه های همگانی، است که آیا علم داده واقعا با آمار تفاوت دارد یا خیر و اگر دارد، چگونه. برداشت فعلی از علم داده به مثابه زبرمجموعه ای از رشته های آمار و یادگیری ماشین است که مقداری فناوری به منظور « ارتقای مقیاس » آن برای « داده های بزرگ » به آن افزوده شده است. انگیزه انتخاب این زبرمجموعه، پیشرفت های تجاری است و نه اندیش ورزانه. چنین انتخابی محتملا رویدادهای اندیش ورزانه مهم 50 سال آینده را نادیده خواهد گرفت. ازآنجاکه خود کل علم به زودی بدل به داده می شود که می توان آن را کاوید، انقلاب در شرف وقوع در علم داده محدود به « ارتقای مقیاس » نبوده، بلکه در مقابل، در ظهور مطالعات علمی تحلیل داده ها در سطح کل علم است. دیدگاهی از علم داده را بر اساس فعالیت های افرادی که « از داده ها یاد می گیرند » ارائه می کنم و یک رشته دانشگاهی را که به بهبود این فعالیت به شیوه ای مبتنی بر شواهد اختصاص دارد توصیف می کنم. این رشته جدید وسعت بخشی علمی بهتری از آمار و یادگیری ماشین در مقایسه با ابتکارعمل های امروزی در علم داده است، و هم زمان توان آن را دارد که همان اهداف کوتاه مدت را برآورده کند.
کلید واژگان: علم داده، یادگیری ماشین، آمار، تحلیل داده ها، مدل بندی پیشگوگرMore than 50 years ago, J. Tukey called for a reformation of academic statistics. In “The future of dataanalysis,” he pointed to the existence of an as-yet unrecognized science, whose subject of interest waslearning from data, or “data analysis.” A recent and growing phenomenon has been the emergence of “data science” programs atmajor universities. This article reviews some ingredients of the current “data science moment,” including recent commentary about data science in the popular media, and about how/whether data science is really different from statistics. The now-contemplated field of data science amounts to a superset of the fields of statistics and machine learning, which adds sometechnology for “scaling up” to “big data.” Because all of science itself will soon become data that can be mined, the imminentrevolution in data science is not about mere “scaling up,” but instead the emergence of scientific studies ofdata analysis science-wide. I present a vision of data science based on the activities of people who are “learning from data,” and I describe an academic field dedicated to improving that activity in an evidence-basedmanner. This new field is a better academic enlargement of statistics and machine learning than today’s data science initiatives, while being able to accommodate thesame short-term goals.
Keywords: Cross-Study Analysis, Data Analysis, Data Science, Meta Analysis, Predictive Modeling, Quantitative Programming Environments, Statistics -
Pollution, Volume:10 Issue: 1, Winter 2024, PP 210 -235
Computational toxicology is a rapidly growing field that utilizes artificial intelligence (AI) and machine learning (ML) to predict the toxicity of chemical compounds. Computational toxicology is an important tool for assessing the risks associated with the exposure of finfish and shellfish to environmental contaminants. By providing insights into the behavior and effects of these compounds, computational models can help to inform management decisions and protect the health of aquatic ecosystems and the humans who depend on them for food and recreation. In aqua-toxicology research, Quantitative Structure-Activity Relationship (QSAR) models are commonly used to establish the relationship between chemical structures and their aquatic toxicity. Various ML algorithms have been developed to construct QSAR models, including Random Forest (RF), Artificial Neural Networks (ANNs), Support Vector Machines (SVMs), Bayesian networks (BNs), k-Nearest Neighbor (kNN), Probabilistic Neural Networks (PNNs), Naïve Bayes, and Decision Trees. Deep learning techniques, such as Convolutional Neural Networks (CNNs) and Recurrent Neural Networks (RNNs), have also been applied in computational toxicology to improve the accuracy of QSAR predictions. Moreover, data mining graphs, networks and graph kernels have been utilized to extract relevant features from chemical structures and improve predictive capabilities. In conclusion, the application of artificial intelligence and machine learning in the field of computational toxicology has immense potential to revolutionize aquatic toxicology research. Through the utilization of advanced algorithms and data analysis techniques, scientists can now better understand and predict the effects of various toxicants on aquatic organisms.
Keywords: Predictive modeling, QSPR modeling, Data integration, analysis, Toxicity prediction, classification, Data mining, knowledge discovery
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.