hierarchical clustering
در نشریات گروه کشاورزی-
Persian oak (Quercus brantii) is a critical, economic, and environmental species of Zagros forests in Iran. The effects of climate change and drought have caused a decline in Persian oak populations, leading to a severe reduction in genetic resources for future conservation programs. This study aims to evaluate the diversity and population structure of Persian oak in the western forests of Iran using morphological features. A total of 187 samples were collected from 15 locations in the Ilam province. Twenty phenotypic traits related to leaf, seed, and trunk characteristics were evaluated. Several multivariate statistical analyses were performed. The results revealed significant morphological diversity among the Persian oak ecotypes. Correlation analyses revealed a significant positive correlation between leaf length attribute and distance from leaf base to maximum leaf width (0.55) and maximum width of the leaflet (0.64) traits. The leaf width at 50% attribute with the maximum width of the leaflet and distance from leaf base to maximum leaf width have a positive (0.8 and 0.51 respectively) and significant correlation (p≤0.05). According to principal component analysis, the components of leaf and seed traits have the most impact on morphological variance. Hierarchical cluster analysis divided the locations into two groups, with some oak locations distributed in two clusters, indicating higher diversity of this species in different locations. Further research is needed to determine the optimal ecotype; however, the oaks in Ghallaje region have characteristics that can increase their ability to resist water scarcity, making them potentially appropriate for reforestation in Ilam province.Keywords: Ecotype, Hierarchical Clustering, Multivariate analysis, Persian oak, population structure
-
خوشه بندی از پرکاربردترین روش های مختلف طبقه بندی و خوشه بندی بتای انعطاف پذیر از روش های موفق سلسله مراتبی تجمعی در طبقه بندی جوامع گیاهی است. هدف این بررسی، تعیین مقدار بتای مناسب در روش خوشه بندی بتای انعطاف پذیر است. برای این پژوهش داده های پوشش گیاهی از جنگل های هیرکانی و جنگل های بلوط زاگرس انتخاب شدند و مقدار مختلف بتا در نتایج خوشه بندی بتای انعطاف پذیر (1/0-، 25/0-، 4/0-، 6/0- و 08/-) با چهار معیار ارزیابی کننده MRPP، PARATNA، Silhouette و همبستگی فی ارزیابی شد و نتایج هر معیار ارزیابی کننده از بهترین به بدترین رتبه بندی شدند. سپس با برآورد میانگین کل ارزیابی کننده ها، عملکرد خوشه بندی ها مشخص شد. نتایج این پژوهش نشان داد که در داده های ناحیه رویشی هیرکانی خوشه بندی بتای انعطاف پذیر با مقدار بتای 1/0- بهترین عملکرد را دارد، اما خوشه بندی با مقدار بتای 25/0- و 4/0- نیز عملکرد مناسبی دارد. در داده های ناحیه رویشی زاگرس خوشه بندی بتای انعطاف پذیر با مقدار بتای 25/0- بهترین عملکرد را دارد و خوشه بندی بتای انعطاف پذیر با مقدار بتای 1/0- در رتبه دوم قرار دارد. بنابراین با توجه به تاثیر اهمیت انتخاب درست روش طبقه بندی در تفسیر اکولوژیکی نتایج حاصل، این بررسی با در نظر گرفتن همه نتایج، استفاده از ضریب بتای 1/0- و 25/0- را برای طبقه بندی پوشش گیاهی پیشنهاد می کند.کلید واژگان: جنگل های زاگرس، جنگل های هیرکانی، سلسله مراتبیAmong different methods for classification, clustering is commonly used methods. Flexible-Beta clustering is successful hierarchical agglomerative clustering which is employed by ecologists as effective clustering method. The aim of the research was to detect the suitable value of beta for flexible-clustering methods. For this purpose, two different forest regions from Hyrcanian and Zagros Oak regions were selected. The clustering algorithms included Flexible-beta algorithms with five value of beta (-0.1, -0.25-, -0.4, -0.6 and -0.8). Five evaluators (Silhouette, MRPP, PARATNA, Phi coefficient) were employed on each cluster solution to evaluate different clustering algorithms. Algorithms were ranked from best to worst on each clustering evaluator for each data set. The results showed that Flexible-beta clustering with beta value -0.1 had best performance and Flexible-beta clustering with beta value -0.25 and -0.4 were proper performance in Hyrcanian regions. Flexible-beta clustering with beta value -0.25 was superior to others and Flexible-beta clustering with beta value -0.1 had the second rank. Since, choosing the most suitable clustering method is critical for achieving maximally ecological interpretable results, therefore, we suggested using flexible beta clustering with beta value equal to -0.1 and -0.25 in the studies area.Keywords: Hyrcanian forest, Hierarchical clustering, Zagros forest
-
نشریه تحقیقات منابع طبیعی تجدید شونده، سال دوازدهم شماره 1 (پیاپی 35، بهار و تابستان 1400)، صص 147 -157امروزه به صورت گسترده از الگوریتم های خوشه بندی استفاده می شود، هرچند که تصمیم گیری برای انتخاب روش مناسب به دلیل روش های مختلف خوشه بندی و عوامل موثر بر آنها دشوار است. هدف این پژوهش مقایسه نتایج روش های خوشه بندی سلسله مراتبی و بررسی روش اندازه گیری فاصله موثر برای خوشه بندی است. برای این پژوهش، داده های جنگل های راش هیرکانی واقع در حوزه استحافظی اداره کل منابع طبیعی نوشهر مورد بررسی قرار گرفت. برای تعیین مراکز قطعات نمونه از روش منظم تصادفی با ابعاد شبکه 200×100 استفاده شد و در هر مرکز قطعه نمونه، قطعات نمونه صد مترمربعی (10×10 متر) برای بررسی گونه های علفی و چهارصد مترمربعی (20×20 متر) برای بررسی گونه های درختی و درختچه ای انتخاب شد. در مجموع 120 قطعه نمونه اندازه گیری شد. برآورد فراوانی و پوشش گونه های درختی، درختچه ای و علفی بر اساس مقیاس براون بلانکه انجام پذیرفت. سه روش اندازه گیری فاصله بری کورتیس، هلینگر و منهتن و الگوریتم های خوشه بندی، روش میانگین، روش وارد، روش بتای انعطاف پذیر با مقدار بتای 0/1-، 0/25-، 0/4- برای پژوهش انتخاب شدند و با استفاده از شش شاخص ارزیابی کننده (شاخص میانگین سیلویت، آنالیز پارتیشن، آنالیز گونه های معرف، آنالیز گونه های معرف خوشه ها برای کمینه کردن ثبات میانی، روش پاسخ چندگانه جایگشت و ضریب فی) مورد بررسی قرار گرفتند. نتایج هر معیار ارزیابی کننده از بهترین به بدترین رتبه دسته بندی شدند. یافته ها نشان داد روش خوشه بندی وارد و روش خوشه بندی بتای انعطاف پذیر با مقدار بتای 0/1- بهترین عملکرد را دارد و روش اندازه گیری فاصله هلینگر در داده های همگن بهتر از سایر روش های اندازه گیری فاصله است.کلید واژگان: جنگل های هیرکانی، خوشه بندی، روش اندازه گیری فاصله، طبقه بندی سلسله مراتبیNowadays, the application of clustering methods is widely increased, although choosing the right method due to the existence of different method and effective factors is difficult. The present study aimed to compare the results of widely used clustering algorithms and to determine the most effective methods according to the different evaluators and evaluate the effective distance measurement method for clustering algorithms. The data of Hyrcanian beech forests were examined in an area protected by the department of natural resources of Nowshahr. Random-systematic sampling method with regular grid of 100×200 m was used for determining the center of sample plots; 100-m2 (10×10 m) sample plots had been used to check the shrub species and 400-m2 (20×20 m) to check the herbaceous species. A total of 120 sample plots were measured. The abundance and coverage of tree, shrub and herbaceous species were estimated based on Braun-Blanquette scale. Three distance methods of measuring distance Bray Curtis, Hellinger and Manhattan were used and five clustering methods (Average method clustering methods, Ward method, flexible beta method with beta values of -0.1, -0.25, -0.4) with six evaluation indicators (silhouette evaluation criterion, PARATNA criterion, Indval criterion, ISAMIC criterion, MRPP criterion and Phi correlation coefficient) were examined. Different clustering algorithms were arranged from best to worst for each dataset. The comparison analysis revealed that Ward’s and flexible-beta with beta value of -0.1 had the best performance. The present findings illustrated that Hellinger distance measurement method is better in homogeneous data than other distance measurement methods.Keywords: Classification, Distance measures, Hierarchical clustering, Hyrcanian Forest
-
در این پژوهش به منظور بررسی کیفی آب رودخانه های گاماسیاب و قره سو واقع در استان کرمانشاه از اطلاعات یک دوره آماری 5 ساله در طی سال های 1397-1393 استفاده شد. جهت ارزیابی هیدروشیمی آب، ابتدا تیپ و رخساره هیدروژیوشیمیایی آب رودخانه ها با استفاده از نمودارهای استیف و پایپر تعیین شد. سپس براساس نمودار گیبس و نسبت های یونی عوامل کنترل کننده پارامترهای شیمیایی آب دو رودخانه مشخص گردید. همچنین به منظور تعیین فرآیندهای تاثیرگذار بر هیدروشیمی آب دو رودخانه از تحلیل عاملی و خوشه ای استفاده شد. در نهایت برای پیش بینی امکان انحلال و رسوب برخی از کانی ها از شاخص های اشباع استفاده شد. نتایج این پژوهش نشان داد که، در هر دو رودخانه تیپ و رخساره غالب بی کربنات کلسیت می باشند. همچنین عامل اصلی در تغییر کیفیت شیمیایی آب در هر دو رودخانه گاماسیاب و قره سو واکنش آب-سنگ می باشد. این عامل را می توان با توجه به نتایج حاصل از تحلیل عاملی و خوشه ای به انحلال (1) سازندهای کربناته و تبخیری و (2) سازندهای دولومیتی در حوضه آبخیز دو رودخانه نسبت داد. هرچند که انحلال سازندهای کربناته با توجه به فراوانی و گسترش آنها در دو حوضه تاثیر پررنگ تری در تغییر شیمی آب دارد. بطوریکه باعث افزایش چشمگیر برخی از پارامترهای شیمیایی نظیر کلسیم، منیزیم و بی کربنات در آب این دو رودخانه و همچنین اشباع بودن آب آنها نسبت به آراگونیت، کلسیت و دولومیت شده است. با توجه به سهم کم عامل دوم در تغییر پارامترهای شیمیایی، آب هر دو رودخانه نسبت به کانی های تبخیری نظیر گچ، هالیت و انیدریت در همه ایستگاه ها تحت اشباع می باشد.
کلید واژگان: اندیس اشباع، تحلیل عاملی، خوشه بندی سلسله مراتبی، کیفیت آب های سطحی، هیدروشیمیIn this study, to investigate the water quality of Gamasyab and Ghareh-Sou rivers in Kermanshah province, data from a 5-year statistical period during 2014-2018 was used. To evaluate the water hydrochemical properties, the water type and hydrogeochemical facies of rivers water were first determined using Stiff and Piper diagrams. Next, the controlling factors of the water chemistry of two rivers were determined using Gibbs diagram and Ionic ratios. Also, factor analysis and cluster analysis were used to determine the processes affecting the hydrochemistry of river water. Finally, to predict the possibility of dissolution and precipitation of some minerals, their saturation indices were estimated. The results showed that water type and facies are bicarbonate calcite in both rivers. Also, the main factor in changing the chemical quality of water in both Gamasyab and Ghareh-Sou rivers is water-rock reaction. According to the results of factor and cluster analysis, this factor can be attributed to the dissolution of (1) carbonate and evaporation (2) dolomite formations in the rivers watershed. However, the dissolution of carbonate formations due to their abundances and distributions two watersheds has a more significant effect on the change in water chemistry.This resulted an increase in some chemical parameters such as calcium, magnesium and bicarbonate in the water of these two rivers and also caused positive water saturation index for aragonite, calcite and dolomite minerals. Considering the low contribution of the second factor in changing the chemical parameters, the saturation indices for evaporative minerals of gypsum, halite and anhydrite is negative.
Keywords: saturation index, Factor analysis, Hierarchical clustering, Surface waters quality, Hydrochemistry -
فقدان پوشش کامل داده های هیدرولوژی، هیدرولوژیست ها را مجبور به استفاده از روش همگن بندی در تحلیل منطقه ای می کند. در این پژوهش، به منظور انتخاب بهترین روش خوشه بندی سلسله مراتبی در گروه بندی حوضه ها، با استفاده از داده های جریان روزانه رودخانه، جریان پایه و شاخص آن از روش فیلتر رقومی برگشتی دو پارامتره در 43 ایستگاه آب سنجی مربوط به حوضه های درجه چهار استان کرمان، استخراج شد. پارامترهای هیدرولوژیکی و اقلیمی، محاسبه و عوامل فیزیوگرافی در محیط رقومی استخراج شد. با استفاده از روش آزمون تحلیل عاملی از بین 14 پارامتر موثر در شاخص جریان پایه، شش عامل ثابت افت منحنی هیدروگراف، بارش متوسط سالانه، تبخیر و تعرق واقعی، نفوذ پذیری، توپوگرافی (شیب و ارتفاع) و شماره منحنی، به عنوان عوامل مستقل انتخاب شدند. همگن بندی حوضه ها با استفاده از عوامل مستقل انتخابی به روش های مختلف سلسله مراتبی شامل: نزدیک ترین همسایه، دورترین همسایه، فاصله از مرکز ثقل و روش وارد، انجام شد. سپس روابط منطقه ای به روش رگرسیون خطی، در سطوح معنی داری کمتر از یک درصد برای گروه های همگن تمام روش ها به دست آمد. ارزیابی صحت و کارایی مدل های برآوردی، به روش های آزمون استقلال خطاها، نرمال بودن توزیع خطاها و هم خطی انجام شد. سپس دقت مدل های استخراج شده با استفاده از ایستگاه های شاهد محاسبه و با یکدیگر مقایسه شد. نتایج نشان داد که دقت مدل های استخراج شده در حوضه های همگن انتخاب شده به روش "فاصله از مرکز ثقل" به دلیل حداقل خطای برآورد نسبی به میزان 27/137% برای منطقه یک و 36/89% برای منطقه همگن دو، حداقل خطای برآورد استاندارد و ضریب همبستگی بالا، به عنوان بهترین روش همگن بندی سلسله مراتبی برای برآورد منطقه ای شاخص جریان پایه در منطقه پژوهش تشخیص داده شد.کلید واژگان: تحلیل عاملی، تحلیل منطقه ای، خوشه بندی سلسله مراتبی، شاخص جریان پایه، کارایی مدلThe lack of complete coverage of hydrological data forces hydrologists to use the homogenization methods in regional analysis. In this research, in order to choose the best Hierarchical clustering method for regional analysis, base flow and related index were extracted from daily stream flow data using two parameter recursive digital filters in 43 hydrometric stations of the Kerman province. Physiographic, climatic and hydrological parameters were calculated. Using factor analysis of 14 parameters, six factors including: hydrograph recession constant, mean annual precipitation, actual evapotranspiration, permeability, topography (slope and height) and curve number were chosen as the most important independent factors. Hierarchical clustering of catchments using independent factors in different methods including: Nearest neighbor, Furthest neighbor, Centroid clustering and Ward were down. Then the regional equations using linear regression at 1% significant level for each homogeny region were determined. To compare and evaluate the accuracy and efficiency of the models, Independence errors, Colinerity and normal distribution of errors were tested. The results showed that “Centroid clustering method " because of low relative error with the amount of 27.137% for zone A and 36.89% for zone B of homogeneous region, minimum standard error of the estimate and the high correlation coefficient, diagnosed as the best homogeneity method to estimate regional base flow index in the study area.Keywords: Base Flow Index, Factor Analysis, Hierarchical Clustering, Model Efficiency, Regional Analysis
-
نشریه سنجش از دور و سامانه اطلاعات جغرافیایی در منابع طبیعی، سال دهم شماره 1 (بهار 1398)، صص 88 -105شوری خاک ازجمله مخاطرات محیطی بالقوه محسوب می شود. هدف از این تحقیق یافتن بهترین شاخص و مناسب ترین رابطه جهت برآورد شوری خاک و تهیه نقشه آن با استفاده از داده های دورسنجی است. بدین منظور ابتدا نمونه برداری تصادفی با استفاده از روش تور ماهی و اندازه گیری هدایت الکتریکی خاک سطحی (EC) انجام شد. سپس سطوح حد آستانه (92%، 95% و 98%) روی تصاویر خروجی هر شاخص اعمال شد. از روش های کمترین مربعات رگرسیون شده (LS-fit) و آنالیز مولفه اصلی (PCA) برای کانی های هالیت و ژیپس، همبستگی بین خروجی شاخص ها و داده های زمینی، خوشه بندی و تحلیل عاملی بین مقادیر EC و تصاویر خروجی استفاده شد. جهت انتخاب بهترین مدل حاصل از ترکیب باندهای لندست-8 و میزان شوری، از آزمون هم خطی، آزمون دوربین-واتسون و رگرسیون چندمتغیره پس رو استفاده شد. همچنین جهت ارزیابی رگرسیون چندمتغیره باندهای لندست8، از ضریب کاپای کوهن استفاده شد. کارایی شاخص ها براساس چهار معیار مجذور میانگین مربعات خطا (RMSE)، میانگین انحراف خطا (MBE) و میانگین خطای مطلق (MAE) و ضریب تعیین (R2) ارزیابی شد. نتایج تحلیل عاملی کمترین فاصله را بین EC، شاخص شوری (SI) و شاخص درجه روشنایی (BI) نشان داد. به طوری که شاخص SI با مقدار 0.89 بیشترین همبستگی پیرسون را با EC داشت. در نمودار دندروگرام، شاخص SI با EC در یک خوشه قرار گرفتند و مقدار RMSE، MBE، MAE و R2 برای شاخص SI به ترتیب 0.16، 0.11، 0.12 و 0.76 برآورد شد. شاخص SI نسبت به بقیه شاخص ها و رگرسیون چند متغیره خطی (با ضریب توافق کاپای کوهن 60%)، نتایج بهتری ارائه کرده است.کلید واژگان: شاخص های شوری، تحلیل عاملی، رگرسیون چندمتغیره، خوشه بندی سلسله مراتبی، بهشت گمشده- فارسSoil salinity is considered as one of the potential environmental hazards. The purpose of this study was to find the best index and the most suitable relationship for estimating soil salinity and its mapping using remote sensing data. At the first step, random sampling was performed using fishnet method and surface soil electrical conductivity (EC) measurements. Then, the threshold levels (92%, 95%, and 98%) were applied to the output images of each indicator. The methodology included using the least squares fitting (LS-fit) technique and principal components analysis (PCA) for halite and gypsum minerals, determining the correlation between the output of indices and ground data, and performing clustering and factor analysis between EC and output images. In order to select the best model derived from Landsat-8 band combinations and the amount of salinity, collinearity test, Durbin-Watson test, and backward multivariate regression were employed. The Cohen‘s kappa coefficient was also applied to evaluate the multivariate regression formed by Landsat-8 bands. The performance of the indicators was evaluated based on four criteria of root mean square error (RMSE), mean bias error (MBE), mean absolute error (MAE) and R-squared (R2). The results of the factor analysis showed the smallest distance between the EC, salinity index (SI) and brightness index (BI). The SI with an amount of 0.89 had the highest Pearson correlation with EC. In the dendrogram diagram, SI index with EC was placed in a cluster, and the RMSE, MBE, MAE and R2 values of the SI index were estimated to be 0.16, 0.11, 0.12, and 0.76, respectively. Compared to the rest of the indicators and linear, multivariate regression (with Cohen‘s kappa coefficient of 60%,), the SI index has provided better outcomes.Keywords: Salinity indices, Factor analysis, Multivariate regression, Hierarchical clustering, Behesht-e- Gomshodeh-Fars
-
Silene L. ایرانی متعلق به تیره Caryophyllaceae از روی صفات گردهشناسی به 21 بخش تقسیم می شود. به علت اهمیت این جنس در فلور ایران و پیچیدگی های آن، ریختشناسی گرده 33 گونه Sileneاز 15 بخش در مقاله حاضر مورد مطالعه قرار گرفته است تا تطابق میان گردهشناسی، بخش های ریختشناسی و درختان تبارزایشی را مورد مطالعه قرار دهد. دانه های گرده با استفاده از روش استولیز آماده شدند. برای مطالعه صفات کمی و کیفی ریز ریختشناسی گرده Silene میکروسکوپ نوری و الکترونی نگاره مورد استفاده قرار گرفتند. به منظور مطالعه تطابق میان گردهشناسی، بخش های ریختشناسی و درختان تبارزایشی گونه ها با استفاده از یک روش آماری خوشه بندی سلسله مراتبی (روش پیوند میانگین) دوباره دسته بندی شدند. براساس این رده بندی، گونه ها به هشت دسته تقسیم شدند. با وجود برخی شباهت ها، بین گروه های گردهشناسی و بخش های ریختشناسی مطابقت کامل وجود نداشت. به علاوه، بین مطالعه حاضر و مطالعات تبارزایشی Silene شباهت هایی مشاهده شد. رده بندی گونه ها در این دو مطالعه دارای تشابه اما با بخش های ریختشناسی تطابق نداشت.
کلید واژگان: ایران، پیوند میانگین، تبار زایشی، خوشه بندی سلسله مراتبیIn this study، the palynology of 33 species of Silene belonging to 15 sections was investigated to examine the correspondence between palynology، morphological sections and phylogenetic trees. The pollen grains were prepared using the acetolysis method. Quantitative and qualitative micromorphological features of pollens were investigated using light microscopy and scanning electron microscopy. Differences in quantitative and qualitative pollen characters within sections were used to regroup species using a statistical hierarchical clustering method (average linkage). According to this classification، the species were divided into eight groups، some of which differed from morphological groupings، but had some similarities to previous phylogenetic studies.Keywords: Average linkage, hierarchical clustering, Iran, phylogeny
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.