data preprocessing
در نشریات گروه فنی و مهندسی-
شبکه های اجتماعی عمدتا در قالب نمودارهایی با تعداد زیادی راس و یال در قالب یک ماتریس مجاورت نمایش و تحلیل می شوند. لبه ها روابط بین افراد را نشان می دهند و به عنوان پیوند بین رئوس عمل می کنند. ویژگی های ساختاری هر شبکه با ویژگی های لبه ها و رئوس درون آن تعیین می شود. در این تحقیق که بر روی انواع داده های شبکه های اجتماعی از پایگاه داده دانشگاه استنفورد انجام شد، از روش پیش پردازش با استفاده از الگوریتم استعماری رقابتی برای عملیات انتخاب ویژگی هایی با بالاترین شایستگی (کمترین هزینه) استفاده شد. برای ارزیابی تاثیر انتخاب ویژگی بر خروجی نهایی، آزمایش هایی با و بدون عملیات انتخاب ویژگی با استفاده از الگوریتم های مختلف که معمولا در این زمینه استفاده می شوند، انجام شد. شاخص های معتبر مانند دقت، تشخیص، حساسیت و عمده به طور مستقل بر روی نتایج خروجی با میانگین 10 اجرای برنامه اندازه گیری شدند. مقایسه نتایج بین سناریوهای با و بدون انتخاب ویژگی تاثیر قابل توجهی بر همه شاخص های نتیجه نهایی نشان داد. بسیاری از ویژگی ها در مجموعه داده ها یا استفاده نشده بودند یا حاوی حداقل اطلاعات بودند. حذف نکردن این ویژگی ها نه تنها بار محاسباتی را افزایش داد، بلکه بر دقت نتایج خروجی به دلیل اجرای زمان بر تاثیر گذاشت.
کلید واژگان: پیش بینی لینک، الگوریتم های فرااکتشافی، پیش پردازش داده هاSocial networks are primarily represented and analyzed in the form of graphs with a large number of vertices and edges, structured as an adjacency matrix. The edges indicate relationships between individuals and act as connections between the vertices. The structural characteristics of each network are determined by the features of the edges and vertices within it. In this research, conducted on various types of social network data from the Stanford University database, a preprocessing method was employed using a competitive colonial algorithm for feature selection with the highest merit (lowest cost). To evaluate the impact of feature selection on the final output, experiments were conducted both with and without feature selection operations using various algorithms commonly used in this field. Valid metrics such as accuracy, precision, sensitivity, and recall were independently measured on the output results with an average of 10 program executions. The comparison of results between scenarios with and without feature selection showed a significant impact on all metrics of the final outcome. Many features in the datasets were either unused or contained minimal information. Not removing these features not only increased the computational burden but also affected the accuracy of the output results due to time-consuming execution.
Keywords: Link Prediction, Meta-Heuristic Algorithms, Data Preprocessing -
کریگینگ بهعنوان بهترین روش تخمینی خطی نااریب در مدل سازی دو بعدی و سه بعدی مطالعات مربوط به علوم زمین، به ارزیابی معیارهای مختلف وابسته است. علاوه بر شناسایی داده های خارج از ردیف و خوشه زدایی داده های مورد مطالعه، شاخص هایی از قبیل تعریف شعاع جستجو بهینه و مناسب، نقش مهمی در افزایش دقت مدل سازی دارند. در این مقاله، با استفاده از معیار آزمون کمی شعاع جستجوی کریگینگ (QKNA)، مدل سازی بهینه ای از معدن شماره یک سنگ آهن گل گهر سیرجان ارایه شده است. اهمیت و ضرورت آزمون QKNA به دلیل آن است که وزن های تخمین مستقیما تحت تاثیر معیارهایی از قبیل شعاع جستجو، تعداد نقاط موجود در پنجره جستجو، استفاده یا عدم استفاده از روش اکتانت و غیره است. برای این منظور، مجموعه داده های مورد مطالعه براساس تغییرات کانسار به دو زون مگنتیتی و هماتیتی تقسیم شد و سپس با تغییر معیارهای معرفی شده، برای هر کدام از زون ها تعداد 180 استراتژی تخمین، مورد بررسی قرار گرفت. به منظور به دست آوردن معیارهای بهینه تخمین در هر زون، در استراتژی های تعریف شده شاخص هایی از قبیل واریانس تخمین، شیب رگرسیون بین داده های واقعی و تخمینی، بازده کریگینگ و وزن میانگین ارزیابی شدند. بر این اساس، شعاع های جستجوی بهینه در زون اول 688، 226 و 152 و در زون دوم 482، 233 و 303 بهدست آمدند. همچنین، بازه بهینه تعداد نقاط موجود در بیضیگون جستجو، در زون اول بین 3 تا 12 و در زون دوم بین 5 تا 15 است.کلید واژگان: کریگینگ، پیش پردازش داده ها، واریوگرافی، شعاع جستجوی بهینه، آزمون کمی شعاع جستجوی کریگینگAs the best linear estimator, Kriging is now a well-established method in all types of 2D and 3D modeling, including geochemical mapping, rock types modeling, geophysical mapping, and resource estimation. In general, a multi-stage approach can be used for evaluating kriging parameters. The first step in the assessment of mineral resources using linear geostatistics is to remove outlier data and to find the best de-cluster size. After this stage, variogram models in the area under study must be provided by a spherical model. In this context, investigating kriging performance has always been of interest to numerous researchers. Evaluating kriging implementation for different applications has been a growing field of study in the last few decades. Although many authors have discussed various kriging parameters, it seems necessary to conduct more detailed reviews on range searching, high and low nugget effect, as well as 2D and 3D estimations. In this paper, an optimal search range was determined using quantitative kriging neighborhood analysis (QKNA), and the utility of this search range was explored by assessing kriging efficiency. To this end, the borehole dataset of the Gol-E-Gohar No.1 mine was used. In total, 2579 samples (of length 3 m) make up the database for this study. In this research, the dataset was divided into two zones based on their associated geological domains. Based on the aforementioned parameters, 180 estimation strategies were generated for each rock type. The results indicate that the optimal search ranges of zone 1 are 688, 226, and 152, and the optimal search ranges of zone 2 are 482, 233, and 303.Keywords: Kriging, Data Preprocessing, Variogram, Optimal search range, Quantitative Kriging Neighborhood Analysis
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.