جستجوی مقالات مرتبط با کلیدواژه
تکرار جستجوی کلیدواژه compositional data (coda) در نشریات گروه فنی و مهندسی
compositional data (coda)
در نشریات گروه مهندسی معدن
تکرار جستجوی کلیدواژه compositional data (coda) در مقالات مجلات علمی
-
تحلیل رگرسیونی به عنوان بخش مهمی از اکتشاف ذخایر طلا با داده های ژئوشیمیایی با ماهیت ترکیبی سر و کار دارد. در داده های ترکیبی، متغیرهای عیاری بخشی از کل بوده و اطلاعات مفید در آنها در قالب نسبت متغیرها وجود دارد. محدود بودن داده ها در بازه صفر تا 100 درصد باعث ایجاد همبستگی تحمیلی و کوواریانس دروغین شده و این موضوع، تحلیل های آماری مرسوم را با اشتباه و عدم قطعیت همراه خواهد کرد. این موضوع برای داده های ژئوشیمیایی که مجموع آنها به 100 درصد نمی رسد نیز ثابت شده است. در این پژوهش تحلیل رگرسیونی عیار طلا در یک رخداد معدنی طلا در شمال غربی ایران با دو رویکرد سنتی (رگرسیون غیرخطی چند متغیره داده های خام) و ترکیبی (رگرسیون غیرخطی چند متغیره بالانس های به دست آمده از تبدیل نسبت لگاریتمی ایزومتریک (ilr)) مورد توجه قرار گرفته است. هدف از این کار مقایسه توانایی دو رویکرد در برآورد دقیق عیار طلا است. ضریب همبستگی مقادیر واقعی و تخمینی برای رویکرد سنتی 74/0 و برای رویکرد ترکیبی 84/0 و نرخ طبقه بندی صحیح (CCR) به عنوان مثال در عیار ppb40 به ترتیب 688/0 و 875/0 است. به علاوه، تابع توزیع مقادیر تخمینی با رویکرد ترکیبی بیش از رویکرد سنتی به تابع توزیع داده های واقعی شبیه است. همچنین، رویکرد سنتی در یک نمونه، عیار طلا را کم تر از صفر تخمین زده است. این تناقض آشکار نشانه ای از نامناسب بودن روش های سنتی ریاضی برای کار با داده هایی با سیستم بسته است. به علاوه، رویکرد ترکیبی در برآورد چارک های اول و سوم که مقادیر حیاتی تری در جدایش داده های آنومال هستند، تخمین های دقیق تری ارائه نموده است. مجموع این موارد دلالت بر این دارند که به منظور یک تحلیل آماری دقیق و قابل اعتماد، باید ماهیت ترکیبی داده های ژئوشیمیایی مورد توجه واقع شده و داده ها با روش نسبت لگاریتمی مناسب تحلیل شوند.کلید واژگان: داده ترکیبی، تبدیل نسبت لگاریتمی ایزومتریک ilr، رگرسیون چند متغیره، فاصله ماهالانوبیس، طلا، قره چرJournal of Aalytical and Numerical Methods in Mining Engineering, Volume:9 Issue: 18, 2019, PP 1 -16SummaryWhen a geochemical sample is analyzed, grades are reported as strictly positive and constrained values, which are a form of compositional data (CoDa). It is proven that spurious correlations of closed data can affect the conventional statistical analysis such as regression modeling. The problem is that one cannot say how much of the uncertainty of the model is due to spurious covariance and correlations. Thus, it is wiser to choose the safe side and consider the compositional nature of the data using proper logratio approach. In this study, we assessed the regression analysis of gold grade in a gold occurrence located in the NW Iran. Compositional and noncompositional approaches were followed and the consequent results were compared to understand the impact of neglecting the compositional nature of data on gold grade regression analysis. Isometric logratio (ilr) balances were calculated and used to perform the compositional approach.
Comparison of the two approaches was carried out based on Correct Classification Rate (CCR) of the estimated values and the correlation coefficient of the estimated and real gold grades (R2). Additionally, the resemblance between the distribution of the estimated and real data were compared. R2 values for compositional and noncompositional approaches are 0.84 and 0.74 respectively, and CCR values at 40 ppb cut-off are 0.875 and 0.688 for the same set. On the other side, the distribution of estimated grades by compositional approach is closer to the real gold grades. It is notable that the noncompositional approach has estimated a negative grade, which is an evident inconsistency. Although the noncompositional approach is returning the exact value of the average, the compositional approach is more accurate at the first and the third quartiles, which are more critical.
All above-mentioned results approve that CoDa analysis of lithogeochemical data is essential. It is concluded that neglecting the compositional nature of data will compromise the reliability of the regression models. Thus, to stay away from the falsification, it is highly recommended to perform the proper logratio approach in multivariate statistical studies of geochemical data.IntroductionAlmost all geochemical data are reported as constrained and strictly positive grades and concentrations. They count as a form of compositional data. Statistical analysis of such data, in the raw form, is exposed to inconsistency and can result unrealistic models. Logratio approach is an adequate way to treat the problem.Methodology and ApproachesMultivariate regression analysis of the raw and logratio transformed data was performed and the results were compared. Isometric logratio (ilr) transform was executed to calculate unconstrained balances for the compositional approach.Results and ConclusionsThe compositional approach outperforms the noncompositional approach in terms of Correct Classification Rate (CCR) and R2 (correlation coefficient of estimated and real data). In addition, the noncompositional approach inconsistently estimated a negative grade and is less accurate in the first and the third quartiles of the population. It is concluded that the compositional data analysis is essential when we are working with multivariate geochemical data.Keywords: Compositional data (CoDa), Isometric logratio transform (ilr), Multivariate regression analysis, Mahalanobis distance, Gold, Qareh Char
نکته
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.