فهرست مطالب

مجله علوم آماری
سال شانزدهم شماره 2 (پیاپی 32، پاییز و زمستان 1401)

  • تاریخ انتشار: 1401/12/07
  • تعداد عناوین: 12
|
  • جلال اطمینان، محمد خنجری صادق*، مجید چهکندی صفحات 253-273

    در این مقاله  سیستم های سری و موازی با مولفه های دو به دو مستقل و هم توزیع  در نظر گرفته شده است.  قابلیت اعتماد  سیستم ها  با روش کاهش  افزایش یافته است. در روش کاهش، قابلیت اعتماد  سیستم با کاهش نرخ شکست زیرمجموعه ای از مولفه های اصلی سیستم با ضرب عامل 0<ρ<1  در تابع نرخ شکست مولفه بهبود می یابد. شکل کلی برای تعدادی از عامل های هم ارزی قابلیت اعتماد بدست آمده است. این عامل ها برای مقایسه کارایی سیستم ها مفید هستند. روش کاهش، به عنوان حالت خاص مدل نرخ شکست متناسب مورد بحث و بررسی قرار گرفته و  شرط های کافی برای مقایسه سالخوردگی نسبی سیستم های سری و موازی بهبود یافته تحت مدل نرخ های شکست متناسب و روش کاهش،  مورد کنکاش قرار گرفته است.

    کلیدواژگان: روش کاهش، مدل نرخ شکست متناسب، عامل هم ارزی قابلیت اعتماد، ترتیب سالخوردگی نسبی
  • رباب افشاری* صفحات 275-294

    اگر چه طرح نمونه گیری تعویقی چندگانه به دلیل نیاز به اندازه نمونه کم نسبت به طرح های غیرشرطی اولویت دارد، اما به کارگیری آن در شرایطی که کیفیت محصولات تولیدی به بیش از یک مشخصه کیفیت بستگی دارد، امکان پذیر نیست. در این مطالعه، به منظور بهبود عملکرد طرح مذکور، طرح نمونه گیری تعویقی چندگانه مبتنی بر اندیس کارایی S^T_{pk} پیشنهاد می شود که قابلیت اجرا برای بازرسی محصولات تولیدی با مشخصه های کیفیت نرمال چندمتغیره و مستقل را دارد. در ادامه، برای توسیع دامنه کاربرد طرح پیشنهادشده در حضور متغیرهای وابسته، از تکنیک آنالیز مولفه های اصلی استفاده می شود. همچنین بر اساس مسیله بهینه سازی غیرخطی، جداول مقادیر بهینه پارامترهای طرح برای استفاده کاربران طراحی می شود. یافته ها حاکی از آن است که تحت شرایط یکسان، طرح پیشنهادی نسبت به طرح نمونه گیری ساده و گروهی مکرر مبتنی بر اندیس کارایی S^T_{pk}، به دلیل قدرت تشخیص بالا، کاهش در زمان و هزینه بازرسی مقرون به صرفه است. در پایان، چگونگی اجرای طرح پیشنهادی با ارایه یک مثال از داده های واقعی صنعتی تشریح می شود.

    کلیدواژگان: طرح نمونه گیری برای پذیرش، طرح نمونه گیری تعویقی چندگانه، اندیس کارایی
  • علا الحمیده، مهران نقی زاده قمی*، آزاده کیاپور صفحات 295-308

    در این مقاله، به محاسبه برآوردگرهای بیزی و  E-بیزی در مدل بر نوع 12 پرداخته می شود. برآوردگرها بر اساس داده های سانسور شده نوع دوم تحت تابع زیان کراندار گامای برگردانده به دست می آیند. رابطه بین برآوردگرهای E-بیز و همچنین ویژگی های مجانبی آن ها ارایه می شوند. عملکرد برآوردگرهای ارایه شده با استفاده از شبیه سازی مونت کارلو مورد بررسی قرار می گیرند.

    کلیدواژگان: برآوردگر بیز، برآوردگر E-بیز، تابع زیان گامای برگردانده، مدل بر نوع 12
  • ابوذر بازیاری* صفحات 309-330

    در این مقاله، مدل مخاطره انفرادی شرکت بیمه با خسارت وابسته در نظر گرفته شده و فرض می شود که بردار دوتایی متغیرهای تصادفی اندازه های خسارت از یکدیگر مستقل و دارای یک تابع چگالی توام مشترک باشند. یک رابطه بازگشتی برای احتمال ورشکستگی زمان نامتناهی بر حسب سرمایه اولیه و تابع چگالی احتمال توام متغیرهای تصادفی اندازه های خسارت با استفاده از نامساوی های احتمالی و روش استقراء محاسبه شده است. برای بررسی نتایج، مثال های عددی همراه با روش شبیه سازی در ارتباط با توزیع دم سبک پواسون دو متغیره، توزیع های دم سنگین لاگ نرمال و پارتو، تابع مفصل فارلی-گامبل-مورگنشترن و تابع مفصل فرانک دو متغیره ارایه شده و نیز اثر خسارت های با توزیع های دم سنگین روی احتمال ورشکستگی مورد بررسی قرار می گیرد.

    کلیدواژگان: احتمال ورشکستگی زمان نامتناهی، تابع مفصل فارلی-گامبل-مورگنشترن، توزیع پواسن دو متغیری، توزیع های دم سبک و سنگین، مدل مخاطره انفرادی
  • علیرضا چاجی* صفحات 331-348

    قابلیت تفسیر پذیری بالا و سادگی فهم درختان تصمیم، آنها را به یکی از پرکاربرد ترین الگوریتم های یادگیری ماشین تبدیل کرده است. موضوع کلیدی در ساخت درختان تصمیم کارامد و موثر، بکارگیری روش انشعاب مناسب است. این مقاله یک روش انشعاب جدید جهت تولید درخت مبتنی بر معیار تی‐ آنتروپی برای نقطه انشعاب پیشنهاد می کند. روش ارایه شده روی سه مجموعه داده توسط 11 معیار ارزیابی، مورد بررسی قرارگرفته است. نتایج نشان می دهد که روش معرفی شده در ساخت درخت تصمیم نسبت به روش های معروف شاخص جینی، آنتروپی های شانون، تیسالیس و رنی عملکرد دقیقتری دارد و می تواند به عنوان روش جایگزین در تولید درخت تصمیم مورد استفاده قرار گیرد.

    کلیدواژگان: درخت تصمیم، آنتروپی، تی‐آنتروپی، روش انشعاب، معیار ارزیابی
  • الهام خالق پناه نوقابی، مجید چهکندی*، مجید رضائی صفحات 349-372

    در این مقاله، نمایش جدیدی از میانگین گذشته عمر یک سیستم منسجم با مولفه های  وابسته و هم توزیع به دست می آید. این نمایش برای مقایسه میانگین گذشته عمر دو سیستم به کار گرفته شده است. برخی از شرایط کافی برای اینکه یک سیستم، سیستم دیگر را براساس ترتیب سالخوردگی سریع تر در میانگین و واریانس گذشته عمر احاطه کند، نیز بحث شده است. این نتایج براساس نمایشی از تابع قابلیت اعتماد سیستم بعنوان یک تابع دگرشکلی از تابع قابلیت اعتماد مشترک مولفه ها به دست آمده است. چند مثال برای توضیح نتایج، ارایه شده است.

    کلیدواژگان: تابع دگرشکلی، ترتیب میانگین گذشته عمر، سالخوردگی، سیستم منسجم
  • رضا ذبیحی مقدم، مسعود یارمحمدی*، حسین حسنی، پرویز نصیری صفحات 373-395

    روش تحلیل مجموعه ی مقادیر تکین  (SSA)   یک روش   ناپارامتری قدرتمند  درحوزه ی  تحلیل  سری های  زمانی بوده و به دلیل دارا بودن ویژگی هایی نظیر عدم نیاز به برقراری فروض مانایی و یا محدودیت در تعداد مشاهدات جمع آوری شده مورد توجه قرار گرفته است. هدف اصلی روش SSA  تجزیه سری های زمانی به اجزای تفسیرپذیر مانند روند، مولفه نوسانی و نوفه بدون ساختار است. در سالهای اخیر  تلاش های مستمری از جانب محققان در حوزه های مختلف پژوهشی  در جهت بهبود این روش خصوصا در زمینه ی پیش بینی سری های زمانی  صورت گرفته است.   در این مقاله روش جدیدی برای بهبود پیش بینی روش  SSA  با استفاده از الگوریتم فیلتر کالمن در مدل های ساختاری معرفی می شود. سپس کارایی عملکرد این روش و چند روش تعمیم یافته SSA    با روش  SSA پایه با استفاده از معیار ریشه میانگین مربعات خطاها مورد مقایسه قرار می گیرد.  برای انجام این مقایسه، از داده های شبیه سازی شده از مدل های ساختاری و نیز داده های واقعی مصرف گاز در انگستان استفاده شده است.  نتایج به دست آمده از این بررسی نشان می دهد که روش معرفی شده جدید از دقت بیشتری نسبت به سایر روش ها برخوردار است.

    کلیدواژگان: پیش بینی، فیلتر کالمن، فضای حالت، تحلیل مجموعه ی مقادیر تکین، پیش بینی بازگشتی
  • علی رستمی، محمد خنجری صادق*، محمد خراشادیزاده صفحات 397-416

    در این مقاله برآورد  R{r,k}= P(X{r:n1} < Y{k:n2}) در صورتی که تنش X  و مقاومت Y  دو متغیر تصادفی مستقل دارای توزیع نمایی معکوس با پارامترهای مقیاس مجهول هستند در نظر گرفته شده است. برآورد ماکسیمم درستنمایی R{r,k}   و بازه اطمینان مجانبی برای آن بدست آورده شده است. مطالعات شبیه سازی و عملکرد این مدل برای دو مجموعه داده واقعی نیز مورد بررسی قرار گرفته است.

    کلیدواژگان: قابلیت اعتماد، مدل تنش−مقاومت، برآورد ماکسیمم درستنمایی، بازه اطمینان مجانبی
  • زهرا زندی*، حسین بیورانی صفحات 417-434

    این مقاله برآوردگرهای انقباضی نوع-لیو را برای ضرایب مدل رگرسیونی خطی با حضور هم خطی چندگانه تحت اطلاعات زیرفضا پیشنهاد می دهد. عملکرد برآوردگرهای معرفی شده از نظر کارایی نسبی آن ها از طریق شبیه سازی مونت کارلو و یک مجموعه داده واقعی با برآوردگر نوع-لیو مقایسه می شود. نتایج آشکار می کنند که برآوردگرهای معرفی شده نسبت به برآوردگر نوع-لیو عملکرد بهتری دارند.

    کلیدواژگان: مدل رگرسیون خطی، هم خطی چندگانه، برآوردگرهای انقباضی نوع-لیو، شبیه سازی مونت کارلو
  • علی محمدیان مصمم*، الناز عباسی، خورخه متیو صفحات 435-448

    در تحلیل بیزی داده های فضایی-زمانی جرم و جنایت معمولا به دلیل ناگاوسی بودن توزیع متغیر پاسخ و وجود تعداد زیادی متغیر پنهان در مدل تحت بررسی شکل بسته ای برای توزیع پسینی وجود ندارد. در این شرایط در استفاده از روش های مونت کارلوی زنجیر مارکوفی با چالش هایی نظیر وجود پارامترهای متعدد در ساختار سلسله مراتبی، محاسبات سنگین و زمان بر، انجام شبیه سازی گسترده، به ویژه زمانی که بعد میدان تصادفی بزرگ است و سرانجام عدم همگرایی توزیع پسینی مواجه می شویم. برای حل این مشکلات روش تقریب لاپلاس آشیانی جمع بسته پیشنهاد شده است. مزیت این روش این است که برآوردهایی از منظر وقوع جرم وجنایت در مکان و زمان معین ارایه کرده و همچنین نواحی با رفتار غیر معمول را تشخیص می دهد. در این مقاله با استفاده همزمان از  GIS و روش قریب لاپلاس آشیانی جمع بسته در یک مطالعه موردی به  تحلیل داده های جرم و جنایت بخشی از کشور کلمبیا می پردازیم.

    کلیدواژگان: تقریب لاپلاس آشیانی جمع بسته، تحلیل سلسله مراتبی بیزی، آمار فضایی-زمانی
  • میثم مقیم بیگی* صفحات 449-468

    ‏در این مقاله یک مدل رگرسیون لوژستیک چند جمله ای نیمه پارامتری برای رده بندی پیکربندی های برچسب دار معرفی شده است. در مدل رگرسیونی متغیر تبینی تابع هسته ای است که با استفاده از معیار توان-واگرایی به دست آمده است. همچنین متغیر پاسخ به صورت رسته ای بوده و رده هر پیکربندی را نشان می دهد. این مدل رگرسیونی نیمه پارامتری بر اساس فواصل تعریف شده در فضای شکل معرفی شده و به همین دلیل میزان رده بندی درست اشکال با استفاده از این روش در مقایسه با روش های پیشین بهبود یافته است‎. عملکرد این مدل در قالب یک مطالعه شبیه سازی مورد بررسی قرار گرفته است. در انتها نیز کاربردی از این روش در رده بندی دو مجموعه داده واقعی به نمایش گذاشته شد. همچنین روش ارایه شده در این مقاله با روش های معرفی شده در نوشتگان مقایسه گردید که نشان از عملکرد مناسب این روش در رده بندی پیکربندی ها دارد.

    کلیدواژگان: رگرسیون لوژستیک، رگرسیون نیمه پارامتری، داده شکل، رده بندی
  • محمدجواد نورالهی، عین الله دیری*، عزت الله بالوئی جامخانه صفحات 469-492

    در این مقاله،  به منظور مدل سازی داده های سری زمانی گسسته مقدار، فرایند خودبازگشتی گسسته مقدار جدید بر اساس توزیع نمایی-وایبل گسسته معرفی شده است.  نظر به اهمیت توزیع های گسسته در مدل سازی داده های شمارشی، همتای گسسته توزیع نمایی-وایبل معرفی و برخی ویژگی های آماری آن از قبیل تابع بقا، نرخ خطر، تابع مولد گشتاور، چولگی و کشیدگی بررسی می شود.  شاخص های پراکندگی فیشر، چولگی و کشیدگی، بیانگر انعطاف پذیری و کارایی توزیع نمایی-وایبل گسسته در برازش انواع مختلف داده های شمارشی است. توزیع نمایی-وایبل گسسته، برازش داده هایی با ویژگی های مختلف پراکندگی (کم پراکندگی، بیش پراکندگی و همسان)، دم راست بلند (چوله به راست) و دم سنگین را پوشش می دهد. پارامترهای مدل با استفاده از سه رویکرد ماکسیمم درستنمایی شرطی، کمترین توان های دوم شرطی تعمیم یافته و یول-واکر  برآورد شده است. در پایان، کارایی و برتری فرایند مدنظر در برازش داده های تعداد فوت ناشی از بیماری COVID-19 نیز، در مقایسه با سایر مدل های رقیب بررسی می شود.

    کلیدواژگان: فرایند(1)INAR، نمایی-وایبل گسسته، شاخص پراکندگی، دم سنگین
|
  • Jalal Etminan, Mohammad Khanjari Sadegh*, Maid Chahkandi Pages 253-273

    This paper considers series and parallel systems with independent and identically distributed component lifetimes. The reliability of these systems can be improved by using the reduction method. In the reduction method, system reliability is increased by reducing the failure rates of some of its components by a factor 0<ρ<1, called the equivalent reliability factor. Closed formulas are obtained for some reliability equivalence factors. In comparisons among the performance of the systems, these factors are helpful. We discuss that the reduction method can be considered as a particular case of the proportional hazard rates (PHR) model. Sufficient conditions for the relative aging comparison of the improved series and parallel systems under the PHR model and reduction method are also developed.

    Keywords: Reduction Method, Proportional Hazard Rates Model, Reliability Equivalence Factors, Relative Ageing Order
  • Robab Afshari* Pages 275-294

    Although the multiple dependent state sampling (MDS) plan is preferred over the conditional plans due to the small size required, it is impossible to use it in a situation where the quality of manufactured products depends on more than one quality characteristic. In this study, to improve the performance of the mentioned method, S^T_{pk}-based MDS plan is proposed, which is applicable to inspect products with independent and multivariate normally distributed characteristics. The principal component analysis technique is used to develop an application of the proposed plan in the presence of dependent variables. Moreover, optimal values of plan parameters are obtained based on a nonlinear optimization problem. Findings indicate that compared to S^T_{pk}-based variable single sampling and repetitive group sampling plans, the proposed method is the best in terms of required sample size and OC curve. Finally, an industrial example is given to explain how to use the proposed plan.

    Keywords: Acceptance sampling plan, Multiple dependent state sampling plan, Process capability
  • Alla Alhamidah, Mehran Naghizadeh* Pages 295-308

    This paper discusses the  Bayesian and E-Bayesian estimators in Burr type-XII model is discussed. The estimators are obtained based on type II censored data under the bounded reflected gamma loss function. The relationship between E-Bayesian estimators and their asymptotic properties is presented. The performance of the proposed estimators is evaluated using Monte Carlo simulation.

    Keywords: Bayesian estimator, E-Bayesian estimator, reflected gamma loss function, Burr type XII distribution
  • Abouzar Bazyari* Pages 309-330

    In this paper, the individual risk model of the insurance company with dependent claims is considered and assumes that the binary vector of random variables of claim sizes is independent. Also, they have a common joint distribution function. A recursive formula for infinite time ruin probability is obtained according to the initial reserve and joint probability density function of random variables of claim sizes using probability inequalities and the induction method. Some numerical examples and simulation studies are presented for checking the results related to the light-tailed bivariate Poisson, heavy-tailed Log-Normal and Pareto distributions. The results are compared for Farlie–Gambel–Morgenstern and bivariate Frank copula functions. The effect of claims with heavy-tailed distributions on the ruin probability is also investigated.

    Keywords: Bivariate Poisson distribution, Farlie–Gambel–Morgenstern copula function, Individual risk model, Infinite time ruin probability, Light, heavy tailed distributions
  • Alireza Chaji* Pages 331-348

    High interpretability and ease of understanding decision trees have made them one of the most widely used machine learning algorithms. The key to building efficient and effective decision trees is to use the suitable splitting method. This paper proposes a new splitting approach to produce a tree based on the T-entropy criterion for the splitting method. The method presented on three data sets is examined by 11 evaluation criteria. The results show that the introduced method in making the decision tree has a more accurate performance than the well-known methods of Gini index, Shannon, Tisalis, and Renny entropies and can be used as an alternative method in producing the decision tree.

    Keywords: Decision tree, entropy, T-entropy, splitting method, evaluation criteria
  • Elham Khaleghpanah Noughabi, Majid Chahkandi *, Majid Rezaei Pages 349-372

    In this paper, a new representation of the mean inactivity time of a coherent system with dependent identically distributed (DID) components is obtained. This representation compares the mean inactivity times of two coherent systems. Some sufficient conditions such that one coherent system dominates another system concerning ageing faster order in the reversed mean and variance residual life order are also discussed. These results are derived based on a representation of the system reliability function as a distorted function of the common reliability function of the components. Some examples are given to explain the results.

    Keywords: Distortion ‎Function‎, Reversed Mean Residual, ‎Life Order‎, ‎Ageing, ‎Coherent System‎
  • Reza Zabihi Moghadam, Masoud Yarmohammadi*, Hossein Hassani, Parviz Nasiri Pages 373-395

    The Singular Spectrum Analysis (SSA) method is a powerful non-parametric method in the field of time series analysis and has been considered due to its features such as no need to stationarity assumptions or a limit on the number of collected observations. The main purpose of the SSA method is to decompose time series into interpretable components such as trend, oscillating component, and unstructured noise. In recent years, continuous efforts have been made by researchers in various fields of research to improve this method, especially in the field of time series prediction. In this paper, a new method for improving the prediction of singular spectrum analysis using Kalman filter algorithm in structural models is introduced. Then, the performance of this method and some generalized methods of SSA are compared with the basic SSA   using the root mean square error criterion. For this comparison, simulated data from structural models and real data of gas consumption in the UK have been used. The results of this study show that the newly introduced method is more accurate than other methods.

    Keywords: Forecasting, Kalman Filter, Singular Spectrum Analysis, State Space Form, Recurrent Forecasting
  • Ali Rostami, Mohammad Khanjari Sadegh*, Mohammad Khorashadizadeh Pages 397-416

    In this article, we consider the estimation of R{r,k}= P(X{r:n1} < Y{k:n2}), when the stress X and strength Y are two independent random variables from inverse Exponential distributions with unknown different scale parameters. R{r,k} is estimated using the maximum likelihood estimation method, and also, the asymptotic confidence interval is obtained. Simulation studies and the performance of this model for two real data sets are presented.

    Keywords: Reliability, stress­-strength Model, Maximum Likelihood Estimation, Asymptotic Confidence Interval
  • Zahra Zandi*, Hossein Bevrani Pages 417-434

    This paper suggests Liu-type shrinkage estimators in linear regression model in the presence of multicollinearity under subspace information. The performance of the proposed estimators is compared to Liu-type estimator in terms of their relative efficiency via a Monte Carlo simulation study and a real data set. The results reveal that the proposed estimators outperform better than the Liu-type estimator.

    Keywords: Linear Regression Model, Multicollinearity, Liu-type Shrinkage Estimators, Monte Carlo Simulation
  • Ali Mohammadian Mosammam*, Jorge Mateu Pages 435-448

    An important issue in many cities is related to crime events, and spatio–temporal Bayesian approach leads to identifying crime patterns and hotspots. In Bayesian analysis of spatio–temporal crime data, there is no closed form for posterior distribution because of its non-Gaussian distribution and existence of latent variables. In this case, we face different challenges such as high dimensional parameters, extensive simulation and time-consuming computation in applying MCMC methods. In this paper, we use INLA to analyze crime data in Colombia. The advantages of this method can be the estimation of criminal events at a specific time and location and exploring unusual patterns in places.

    Keywords: Integrated Nested Laplace Approximation, Bayesian Statistics, Spatial-temporal Statistics
  • Meisam Moghimbeygi* Pages 449-468

    This article introduces a semiparametric multinomial logistic regression model to classify labeled configurations. In the regression model, the explanatory variable is the kernel function obtained using the power-divergence criterion. Also, the response variable was categorical and showed the class of each configuration. This semiparametric regression model is introduced based on distances defined in the shape space, and for this reason, the correct classification of shapes using this method has been improved compared to previous methods. ‎The performance of this model has been investigated in the comprehensive simulation study‎. ‎Two real datasets were analyzed using this article's method as an application‎. ‎Finally‎, ‎the method presented in this article was compared with the techniques introduced in the literature‎, ‎which shows the proper performance of this method in classifying configurations‎.

    Keywords: Logistic regresion, ‎S‎emiparametric regression, Shape data, ‎Classification
  • Einolah Deiri, Ezzatallah Jamkhaneh Pages 469-492

    In this paper, a new integer-valued autoregressive process is introduced based on the discrete exponential-Weibull distribution to model integer-value time series data. Regarding the importance of discrete distributions in counting data modeling, the discrete counterpart of the exponential-Weibull distribution is introduced, and some of its statistical properties, such as survival function, hazard rate, moment generating function, skewness and kurtosis, are investigated. The Fisher dispersion, skewness and kurtosis indices show the flexibility and efficiency of the discrete Exponential-Weibull distribution in fitting different types of counting data. The discrete Exponential-Weibull distribution covers data fits with different dispersion characteristics (overdispersion, underdispersion and equidispersion), long right tail  (skewed to the right) and heavy-tailed. The model parameters are estimated using three approaches maximum conditional likelihood, minimum generalized conditional squares, and Yule-Walker. Finally, the efficiency and superiority of the process in fitting counts data of deaths due to COVID-19 disease are compared with other competing models.

    Keywords: INAR(1) process, Discrete Exponential-Weibull, Dispersion index, Heavy-tailed