فهرست مطالب

اندیشه آماری - سال بیست و دوم شماره 2 (پیاپی 44، پاییز و زمستان 1396)

نشریه اندیشه آماری
سال بیست و دوم شماره 2 (پیاپی 44، پاییز و زمستان 1396)

  • تاریخ انتشار: 1396/12/18
  • تعداد عناوین: 10
|
  • الهام رحیمیان، محمدرضا ربیعی، داود شاهسونی صفحه 1
    هنگامی که در مجموعه داده ها، مشاهدات دور افتاده وجود دارند روش رگرسیون استوار، جایگزین مناسبی برای رگرسیون معمولی است. همچنین اگر مشاهدات، فازی باشند نیز روش های رگرسیون معمول، نمی توانند راه گشای مدل بندی اینگونه از مشاهدات باشند و در این حالت روش رگرسیون فازی، روش جایگزین مناسبی است. برای حالتی که مشاهدات، فازی بوده و در مجموعه داده ها، مشاهدات دور افتاده وجود داشته باشند از روش های جایگزین استوار فازی استفاده می شود. در این مقاله برای حالتی که متغیر های وابسته و ضرایب رگرسیونی اعداد فازی بوده و مجموعه داده ها حاوی مشاهدات دور افتاده است، تحلیل رگرسیون کمترین توان های دوم فازی اصلاح شده ای مطرح می شود. در این روش برای مقایسه مجموعه های فازی، باقی مانده ها رتبه بندی می شوند. باقی مانده ها با استفاده از شاخص حضور سراسری برای هر مجموعه فازی (OM) به دست می آیند. سپس ماتریس وزن توسط تابع عضویت باقیمانده ها تعریف می شود و برآورد های کمترین توان های دوم فازی موزون با استفاده از ماتریس وزن بدست می آیند. برای نشان دادن عملکرد روش پیشنهادی، دو مثال را مطرح و نتایج حاصل از آن ها ارائه می شود.
    کلیدواژگان: رگرسیون استوار، داده دورافتاده، رگرسیون فازی، شاخص OM
  • صفحه 2
  • محمد بهرامی صفحه 3
    تعیین تعداد مولفه ها در یک توزیع آمیخته، مسئله ای دشوار بوده و حائز اهمیت زیادی می باشد. برای تعیین تعداد بهینه مولفه ها در توزیع های آمیخته، روش های مختلفی وجود دارد که در این مقاله به ذکر چند مورد از آن ها خواهیم پرداخت. روش اول که تحت عنوان الگوریتم greedy EM بیان شده، بر اساس الگوریتمی است که طی هر مرحله آن مولفه ای جدید به مدل اضافه می شود و این روند تا زمانیکه منجر به تعیین تعداد بهینه مولفه ها در توزیع آمیخته شود، ادامه دارد. روش دوم بر اساس ماکسیمم آنتروپی ادغام در تکرار زیرکلاس های روی هم افتاده تا زمانی است که در نتیجه ادغام این مولفه ها، توزیع آمیخته مورد بررسی دارای یک مولفه شود. این روش با عنوان ادغام آمیختگی شرح داده شده است و روش سوم نیز توسط تعریف متغیرهای نشانگر به صورت ناپارامتری تعداد مولفه های توزیع آمیخته را تعیین می کند. لازم به ذکر است که در این مقاله توزیع آمیخته ای را مورد مطالعه قرار داده ایم که مولفه های آن دارای توزیع تی-نرمال چوله است.
    کلیدواژگان: توزیع آمیخته متناهی، تعداد مولفه ها، الگوریتم greedy EM، آنتروپی، ادغام آمیختگی، توزیع تی، نرمال چوله
  • سیدمحمود طاهری * صفحه 4
    در موضوع رگرسیون فازی (به سخن دقیق تر: رگرسیون در محیط فازی) دو رویکرد اصلی وجود دارد: رویکرد مبتنی بر کمترین مجموع فاصله ها (شامل دو شیوه کلی: کمترین مجموع مربعات و کمترین مجموع انحرافات) و رویکرد امکانی (رویکرد کمترین ابهام کل تحت برخی قیود). در کنار این دو رویکرد اصلی، روش هاای ابتکاری متعددی در موضوع رگرسیون فازی پیشنهاد شده ااند. برخی از این روش ها بر پایه ترکیب دو رویکرد بالا هستند. برخی از روش های ابتکاری بر اساس الگوریتم هاای محاسباتی خاص می باشند. برخی دیگر، از سیستم های استنتاج فازی استفاده می کنند.
    در برخی از روش ها، مساله رگرسیون فازی به چند زیر مساله تقسیم می شود که با حل آنها مساله اصلی حل و فصل می گردد.
    برخی روش ها نیز بر اساس خوشه بندی است. به کارگیری شبکه های عصبی مصنوعی، الگوریتم های تکاملی و یا شیوه های ناپارامتری از دیگر رویکردهای مورد استفاده است. در این مقاله، ضمن اشاره به تاریخچه و مبانی دو رویکرد کلاسیک به رگرسیون فازی (رویکرد کمترین مجموع فاصله ها و رویکرد امکانی)، برخی روش های ابتکاری در رگرسیون فازی، معرفی و بررسی کوتاه می شوند. نیز، ده ملاک (/ معیار) برای ارزیابی مدل های رگرسیون فازی مطرح می گردد که طبق آن ها بتوان روش ها و مدل های مختلف را ارزیابی و مقایسه نمود.
    کلیدواژگان: کمترین مجموع خطاها، رگرسیون امکانی، روش های ابتکاری، خوشه بندی، پهناهای متغیر
  • مهرناز محمدپور، سمانه رضوی صفحه 5
    تولیدکنندگان امروزه به طور فزاینده ای با یک رقابت شدید روبرو هستند و برای اینکه سودآور باقی بمانند، نیاز به طراحی، توسعه و تولید محصولات قابل اعتماد دارند. یکی از روش هایی که تولیدکنندگان نظر مصرف کنندگان را به محصولات خود جلب می کنند به کار بردن گارانتی برروی محصولات خود می باشد. از طرفی مصرف کنندگان نیز مایل به خرید یک محصول با طول گارانتی بالا می باشند که اتخاذ چنین سیاستی هزینه زیادی را برای تولیدکنندگان ایجاد می کند. بنابراین تعیین طول گارانتی مطلوب و مناسب برای تولیدکنندگان بسیار حائز اهمیت می باشد. در این مقاله به کمک روش بیزی و استفاده از یک تابع مطلوبیت مناسب، تعیین طول گارانتی بهینه برای محصولاتی که توزیع طول عمرآنها نمایی است مورد بررسی قرار می گیرد.
    کلیدواژگان: هزینه نارضایتی، سود اقتصادی، توزیع پسین پیش بینی کننده، هزینه گارانتی
  • آنیتا عبدالهی نانواپیشه صفحه 6
    در این مقاله ابتدا به بررسی تابع چگالی احتمال و تابع نرخ شکست چند خانواده از توزیع های نمایی پرداخته و سپس ویژگی های آنها از جمله امیدریاضی، واریانس، گشتاورها و برآورد درستنمایی را ارائه می کنیم و انعطاف پذیرترین توزیع را با توجه به نمودار تابع چگالی احتمال و تابع نرخ شکست آنها مشخص نموده و در نهایت، مثالهایی کاربردی از آنها را ارائه می کنیم.
    کلیدواژگان: توزیع نمایی تک پارامتری، دو پارامتری و سه پارامتری، توزیع پواسون، وایبل نمایی شده، برآورد درستنمایی ماکسیمم، گشتاورها
  • علی شادرخ، شهرستانی شهرام یعقوب زاده صفحه 7
    در این مقاله‏، یک توزیع جدید پنج پارامتری به نام توزیع بتا گومپرتز هندسی معرفی می شود که دارای تابع خطر افزایشی، کاهشی-افزایشی-کاهشی، تک مدی و گودالی شکل می باشد. تابع چگالی احتمال، تابع توزیع تجمعی و تابع خطر آن به دست آورده می شود. همچنین به کمک چند جمله ای های استرلینگ، گشتاورها، گشتاورهای آماره های مرتب و منحنی های بن فرنی و لورنتس این توزیع جدید به دست آورده می شود. پارامترهای آن به روش ماکسیمم درستنمایی‏، برآورد شده و در نهایت نیز با استفاده از یک مجموعه داده های واقعی‏، کاربردی از آن نشان داده می شود.
    کلیدواژگان: توزیع گومپرتز، چند جمله ای های استرلینگ، توزیع بتا، تابع خطر، برآورد ماکسیمم درستنمایی
  • سارا جذن، سید مرتضی امینی صفحه 8
    یکی از عوامل تاثیرگذار در تحلیل آماری داده ها، وجود مشاهدات دورافتاده است. به روش هایی که تحت تاثیر مشاهدات دورافتاده قرار نمی گیرند، روش های آماری استوار گفته می شود. علاوه بر وجود مشاهدات دورافتاده، وجود وابستگی خطی میان متغیرهای پیشگو، که از آن با عنوان همخطی چندگانه یاد می شود و نیز تعداد زیاد متغیرها در مقابل حجم کم نمونه، به خصوص در مدل های تنک با بعد بالا، از دیگر مشکلاتی هستند که منجر به کاهش کارایی استنباط های حاصل از روش های کلاسیک رگرسیونی می شوند.

    در این مقاله، ابتدا معایب روش رگرسیونی کلاسیک کمترین توان های دوم در مقابل مشاهدات دورافتاده، همخطی چندگانه و مدل های تنک با بعد بالا را بررسی می کنیم. سپس به معرفی و بررسی روش های رگرسیون استوار و رگرسیون تاوانیده به عنوان راهکارهای حل این مشکلات می پردازیم. همچنین با در نظر گرفتن مشاهدات دورافتاده و همخطی چندگانه و یا مدل های تنک به طور هم زمان به بررسی روش های رگرسیون استوار تاوانیده می پردازیم. در نهایت به منظور مقایسه ی عملکرد برآوردگرهای مختلف مطرح شده در این مقاله، ابتدا سه مطالعه ی شبیه سازی را انجام داده و سپس به تحلیل یک مجموعه داده ی واقعی با استفاده از روش های رگرسیون استوار تاوانیده می پردازیم.
    کلیدواژگان: مشاهدات دورافتاده، رگرسیون استوار، همخطی چندگانه، مدل تنک، رگرسیون تاوانیده
  • علی هدایتی، اسماعیل خرم، سعید رضاخواه صفحه 9
    برآورد درست نمایی ماکسیمم در توزیع های چندمتغیره، نیازمند بهینه سازی با ابعاد زیاد (به تعداد پارامترهای مجهول) است. در این مقاله برآورد دومرحله ای پارامترها با استفاده از تابع مفصل را ارائه می کنیم. این روش مسئله را به چند مسئله بهینه سازی کوچک تر تقسیم می کند و موجب سهولت و صرفه جویی در محاسبات می گردد، همچنین دو روش برای بررسی سازگاری برآورد مطرح می شود. از پارتو دومتغیره به عنوان مثال استفاده می کنیم و دو مجموعه داده (تولید شده و واقعی) نیز برای روشن شدن اهداف، تحلیل می کنیم.
    کلیدواژگان: برآورد درست نمایی ماکسیمم، برآورد دومرحله ای پارامترها، تابع مفصل، سازگاری برآورد، پارتو دومتغیره
  • امید خوارزمی، علی سعادتی نیک صفحه 10
    در این مقاله یک توزیع احتمال جدید بر اساس خانواده توزیع های کسینوس هیپربولیک ( ) پیشنهاد و ویژگی های مختلف آماری و قابلیت اعتمادی آن بررسی می گردد. رده جدید توزیع های از طریق ترکیب یک توزیع انباشته F با تابع کسینوس هیپربولیک بدست می آید ( خوارزمی و سعادتی نیک [9] ). ما بر اساس توزیع پایه لوگ لجستیک، یک توزیع جدید تحت عنوان کسینوس هیپربولیک لوگ لجستیک ( ) معرفی و ویژگی های مختلف توزیع پیشنهاد شده شامل: گشتاورها، چندک ها، تابع مولد گشتاور، تابع نرخ شکست، میانگین باقیمانده عمر، آماره های ترتیبی و پارامتر تنش-مقاومت را به دست می آوریم. برآورد پارامترهای توزیع برای یک مجموعه داده واقعی ازطریق سه روش حداکثر درست نمایی، بیزی، بوت استرپ (پارامتری و ناپارامتری) بررسی می شود. همچنین در بخش کاربرد با استفاده از یک مجموعه داده واقعی برتری مدل نسبت به توزیع های نمایی تعمیم یافته، وایبل، کسینوس هیپربولیک نمایی، گاما و نمایی وزنی از طریق معیارهای مختلف انتخاب مدل نشان داده می شود.
    کلیدواژگان: تابع کسینوس هیپربولیک، توزیع لوگ لجستیک، میانگین باقیمانده عمر، برآورد ماکسیمم درست نمایی، روش بوت استرپ
|
  • E. Rahimiyan, Mr Rabiei, D. Shahsavani Page 1
    Robust regression is an appropriate alternative for ordinal regression, when outliers exist in a given data set. If we have fuzzy observations, using ordinal regression methods can’t model them; In this case, using fuzzy regression is a good method. When observations are fuzzy and there are outliers in the data sets, using robust fuzzy regression methods are appropriate alternatives. In this paper, we propose a fuzzy least square regression analysis. When independent variables are crisp, the dependent variable is fuzzy number and outliers are present in the data set. In the proposed method, the residuals are ranked as the comparison of fuzzy sets. In the proposed method, the residuals are ranked as the comparison of fuzzy sets, and the weight matrix is defined by the membership function of the residuals. Weighted fuzzy least squares estimators (WFLSE) are obtained by using weight matrix. Two examples are discussed and results of these examples are presented.
    Keywords: Robust regression, outlier, fuzzy regression, OM index
  • Mohammad Bahrami Page 3
    One of the main goal in the mixture distributions is to determine the number of components. There are different methods for determination the number of components, for example, Greedy-EM algorithm which is based on adding a new component to the model until satisfied the best number of components. The second method is based on maximum entropy and finally the third method is based on nonparametric. In this manuscript it is considered the mixture distributions with Skew-t-Normal components.
    Keywords: Finite Mixture Distribution, Number of components, Greedy, EM algorithm, Maximum Entropy, Skew, t, Normal distribution
  • S. Mahmoud Taheri * Page 4
    There are two main approches to the fuzzy regression (more precisely: regression in fuzzy environment): the least of sum of distances (including two methods of least squared errors and least absolute errors) and the possibilistic method (the method of least whole vaguness under some restrictions). Beside, some heuristic methods have been proposed to deal with fuzzy regression. Some of them are based on a combination of two mentioned approaches. Some of them are based on computational algorithmes. A few of heuristic methods use the fuzzy inference systems. Also, there are some methods based on clustering, artificial neural networks, evolutionary algorithms, and nonparametric procedures.
    In this paper, a history and basic ideas of the two main approaches to fuzzy regression are reveiwed, and some heuristic methods in this topic are investigated. Moreover, 10 criterion are proposed by which one can evaluate and compare fuzzy regression models.
    Keywords: least of sum of errors, possibilistic regression, heuristic methods, clustering, variable spreads
  • Mahnaz Mohamadpoor, Samane Razavi Page 5
    Today's manufacturers face increasingly intense competition and to remain profitable they needed to design, develop and produce high reliable products. One way by which manufacturers attract consumers to their products is by providing warranties on the products. Consumers are willing to purchase a longer warranty period product. While maintaining such a policy needs very high cost for manufacturers. Determining the appropriate warranty length becomes an important decision problem for manufacturers. In this article, by Bayesian approach and using an appropriate utility function, we determine the optimal warranty lengths for product with exponential life time distribution.
    Keywords: Bayesian analysis, dissatisfaction cost, economic benefit, posterior predictive distribution, warranty cost
  • Anita Abdollahi Nanvapisheh Page 6
    In this paper, first, we investigate probability density function and the failure rate function of some families of exponential distributions. Then we present their features such as expectation, variance, moments and maximum likelihood estimation and we identify the most flexible distributions according to the figure of probability density function and the failure rate function and finally we offer practical examples of them.
    Keywords: univariate, bivariate, three parameters of Exponential distribution, exponentiated weibull, poisson distribution, maximum likelihood estimation, moments
  • Ali Shadrokh, Shahram Yaghoobzadeh Shahrastani Page 7
    ýýIn this paperý, ýwe introduce a new five-parameter is called Beta-Gompertz Geometric (BGG) distributioný. ýýýýIt can have a decreasingý, ýincreasingý, ýand bathtub-shaped failure rate function depending on its parametersý. ýSome mathematical properties of the new distributioný, ýsuch as the density ýandý ýhazard rate ýfunctionsýý, ýmomentsý, ýmoment generating functioný, ý$Racute{e}nyi$ and Shannon entropyý, ýBonferroni and Lorenz curves and the mean deavations are providedý. ýWe discuss maximum likelihood estimation of the BGG parameters from one observed sampleý. ýAt the endý, ýin order to show the BGG distribution flexibilityý, ýan application using a real data set is ýpresented.ý
    Keywords: ýGompertz distributionýý, ýPloynomial Sterlings, Beta ýGompertz ýGeometric distribution, hazard function, Maximum liklihood estimationýýý
  • Sara Jazan, Seyyed Morteza Amini Dr Page 8
    ýOne of the factors affecting the statistical analysis of the data is the presence of outliersý. ýThe methods which are not affected by the outliers are called robust methodsý. ýBesides outliersý, ýthe linear dependency of regressor variablesý, ýwhich is called multicollinearityý, ýthe large number of regressor variables with respect to sample sizeý, ýspecially in high dimensional sparse modelsý, ýare problems which result in efficiency reduction of inferences in classical regression methodsý. In this paper, ýwe first study the disadvantages of classical least squares regression methodý, ýwhen facing with outliersý, ýmulticollinearity and high dimensional sparse modelsý. ýThený, ýwe introduce and study robust and penalized regression methodsý, ýas a solution to overcome these problemsý. ýFurthermoreý, ýconsidering outliers and multicollinearity or sparse modelsý, ýsimultaneouslyý, ýwe study penalized-robust regression methodsý. We examine the performance of different estimators introdused in this paper through three different simulation studies. A real data set is also analyzed using the proposed methods.
    Keywords: Outliers, ý Robust ýregression, ý ýMulticollinearity, ý Sparse ýmodel, ýý Penalized regressioný
  • Ali Hedayati, Esmaile Khorram, Saeid Rezakhah Page 9
    Maximum likelihood estimation of multivariate distributions needs solving a optimization problem with large dimentions (to the number of unknown parameters) but twoý- ýstage estimation divides this problem to several simple optimizations. ýIt saves significant amount of computational timeý. ýTwo methods are investigated for estimation consistency checký. ýWe revisit Sankaran and Nair's bivariate Pareto distribution as an exampleý. ýTwo data sets (simulated data and real data) have been analyzed for illustrative purposesý.
    Keywords: ýMaximum likelihood estimationý, ýtwoý, ýstage estimationý, ýcopula functioný, ýestimation consistencyý, ýbivariate Pareto distributioný
  • Omid Kharazmi, Ali Saadati Nik Page 10
    In this paper, a new probability distribution based on the family of hyperbolic cosine distributions is proposed, and its various statistical and reliability characteristics are investigated. The new category of HCF distributions is obtained by combining a baseline F distribution with the hyperbolic cosine function (Kharazmi and Saadatinik [9]). Based on the base log-logistics distribution, we introduce a new distribution called HCLL and we derive the various properties of the proposed distribution including the moments, quantiles, moment generating function, failure rate function, mean residual lifetime, order statistics and stress-strength parameter. Estimation of the parameters of HCLL for a real data set is investigated by using three
    Methods
    maximum likelihood, Bayesian and bootstrap (parametric and non-parametric). In addition, in the application section, by using a realistic data set, the superiority of HCLL model to generalized exponential, Weibull, hyperbolic cosine exponential, gamma, weighted exponential distributions is shown through the different criteria of selection model.
    Keywords: Hyperbolic cosine function, Log, Logistics distribution, Mean residual lifetime, Maximum likelihood estimation, Bootstrap