فهرست مطالب

دانشگاه علوم پزشکی خراسان شمالی - سال سوم شماره 4 (زمستان 1390)

نشریه دانشگاه علوم پزشکی خراسان شمالی
سال سوم شماره 4 (زمستان 1390)

  • ویژه نامه آمار زیستی و اپیدمیولوژی 2
  • تاریخ انتشار: 1390/10/11
  • تعداد عناوین: 18
|
  • حبیب الله اسماعیلی، مریم سالاری، بهزاد قلی زاده، مصطفی بسکابادی، حسین لشگردوست، آزاده ساکی صفحات 7-14
    یکی از متداول ترین مطالعات در حیطه علوم پزشکی جهت یافتن ریسک فاکتورها و عوامل مرتبط با بیماری ها مطالعات موردی – شاهدی هستند که شاخص مهم قابل محاسبه درآن OR یا خطرنسبی است. اما در این بین بعضی عوامل مخدوش گرکه بر پاسخ موثرند اعتبارOR به دست آمده را زیر سوال می برند و OR را کمتر یا بیشتر نشان می دهد یکی از روش های حذف اثر مخدوش گر، طراحی مطالعات matching است. رگرسیون لجستیک یکی از روش های متداول مدل سازی برای این نوع مطالعات است که در مطالعه حاضر سه روش رگرسیون لجستیک در حالت استقلال ،حاشیه ای و شرطی با هم مقایسه می شوند.
    این مطالعه بر روی داده های شبیه سازی شده وابسته به هم انجام پذیرفته است. بدین ترتیب که داده ها از توزیع نرمال دو متغیره با ضریب همبستگی های (0،0. 2،0. 4،0. 6،0. 8) تولید می شوند. سپس با انتخاب نقاط برش (0. 25،0. 25) ، (0. 25،0. 15) ، (0. 25،0. 1) ، (0. 25، 0. 05) برای تابع احتمال تجمعی آنها این داده ها که از توزیع پیوسته هستند به توزیع گسسته صفر و یک که به هم وابسته هستند تبدیل می شوند. سپس سه مدل رگرسیون لجستیک در حالت استقلال ، حاشیه ای و شرطی به داده ها برازش داده می شود و OR محاسبه می شود. با10000بار تکرار مقدار صدک 2. 5 و 97. 5 و همچنین میانه OR سه مدل در نقاط برش ذکرشده با هم مقایسه می شوند.
    در همبستگی صفر هر سه مدلOR مشابه دارند و تغییر درنقاط باز هم ضرایب مشابه دارد. اما با افزایش میزان همبستگی بین مشاهداتOR بین مدل حاشیه ای و استقلال متفاوت نیست ولی مقدار آن با مدل شرطی متفاوت خواهد بود. به عنوان مثال در نقطه برش (0. 25،0. 1) و ضریب همبستگی 0. 6 میانه OR به دست آمده در مدل استقلال و حاشیه ای 2. 8 است ولی در مدل شرطی این مقدار 5 یعنی دوبرابر مقدار برازش شده است.
    استفاده ازمدل های شرطی زمانی که همبستگی بین مشاهدات زیاد است قطعا روش صحیح تری است و هرچه میزان این همبستگی بالا برود میزان خطای ما در استفاده از مدل استقلال یا حاشیه ای بالا می رود. اما زمانی که همبستگی بین مشاهدات ناچیز است استفاده از سه مدل برآوردهای یکسانی می دهد.
    کلیدواژگان: مطالعات موردی شاهدی، مدل لجستیک حاشیه ای، مدل لجستیک شرطی، شبیه سازی، مخدوش گر
  • اکبر بیگلریان، عنایت الله بخشی، مهدی رهگذر، مسعود کریملو صفحات 15-22
    رگرسیون لجستیک یک مدل عمومی برای بررسی رابطه بین متغیرهای مستقل و پاسخ های دوحالتی است. یکی از مدل های انعطاف پذیرکه به طور جایگزین می تواند مورد استفاده قرار گیرد، مدل شبکه عصبی مصنوعی است. این مطالعه با هدف مقایسه ی قدرت پیش بینی پاسخ های دوحالتی داده های پزشکی، با مدل شبکه عصبی مصنوعی و رگرسیون لجستیک انجام شد.
    برای انجام این پژوهش، از داده های 639 بیمار مبتلا به سرطان معده، گردآوری شده توسط مرکز تحقیقات گوارش و کبد دانشگاه علوم پزشکی شهید بهشتی طی سال های 1381-1385، استفاده شد. مرحله بیماری به عنوان متغیر وابسته در نظر گرفته شد. ارزیابی شبکه بر اساس ملاک حداقل مربعات خطای پیش بینی صورت گرفت و مقایسه پیش بینی های مدل نهایی شبکه با مدل رگرسیونی با استفاده از شاخص هماهنگی و منحنی راک صورت پذیرفت. تحلیل داده ها با نرم افزار R 2. 12 و SPSS 17. 0 انجام شد.
    سطح زیر منحنی مشخصه عملکرد مدل شبکه عصبی برابر 725/0 و مدل رگرسیون لجستیک برابر 699/0 به دست آمد. همچنین صحت پیش بینی کل برای مدل شبکه عصبی و رگرسیونی به ترتیب برابر 771/0 و 710/0 محاسبه گردید. همچنین اختلاف پیش بینی های دو مدل معنی دار شد (002/0 = P).
    صحت پیش بینی شبکه در تشخیص مرحله ی بیماری سرطان معده بیش تر از مدل رگرسیونی لجستیک به دست آمد و لذا این مدل برای تشخیص مرحله ی بیماری پیشنهاد می شود.
    کلیدواژگان: شبکه عصبی مصنوعی، رگرسیون لجستیک، پیش بینی، پاسخ های دوحالتی
  • فاطمه خراشادیزاده، میترا هاشمی، اکرم کرمی دهکردی، امیرعلی رهسپار، ربابه لطیف نژادرودسری، مریم سالاری، حبیب الله اسماعیلی صفحات 23-32
    ناباروری آثار متعددی بر ابعاد جسمی، روانی و اجتماعی زنان دارد. از طرفی تصویر ذهنی از بدن می تواند پیشگویی کننده رفتارهای مختلف آنها از جمله رفتارهای جنسی باشد. در این راستا مطالعه ای با کاربرد مدل تحلیل مسیر برای تعیین ارتباط همزمان تصویر ذهنی از بدن با عملکرد جنسی و سازگاری زناشویی در زنان بارور و نابارور انجام گردید.
    در این پژوهش 130 زن بارور و 130 زن نابارور مورد مطالعه قرار گرفتند. تحلیل داده ها با استفاده از نرم افزار AMOS 18 و بکارگیری مدل تحلیل مسیر انجام شد.
    در زنان بارور بیشترین ضریب مسیر متعلق به مسیر تصویر ذهنی بدن بر سلامت عمومی و در گروه زنان نابارور بیشترین ضریب متعلق به مسیر تصویر ذهنی بر عملکرد جنسی بوده است. در هر دو گروه زنان بارور خانه دار و شاغل بیشترین ضریب مسیر متعلق به مسیر تصویر ذهنی بدن بر سلامت عمومی بوده است. در هر دو گروه زنان ناباروری که همراهی همسرشان را داشته اند بزرگترین ضریب مسیر متعلق به مسیر تصویر ذهنی بدن بر عملکرد جنسی بوده و در گروه زنان ناباروری که با عدم همراهی همسرشان مواجه بودند بزرگترین ضریب مسیر متعلق به عملکرد جنسی بر سازگاری زناشویی بوده است.
    با توجه به نتایج بدست آمده، لزوم بررسی مدل تحلیل مسیر در شناخت اثرات مستقیم، غیر مستقیم و اثرات کل در مدلهایی مشابه مدل قبل کاملا ضروری به نظر میرسد و میتواند جایگزین سایر روش ها نظیر رگرسیون باشد
    کلیدواژگان: تصویر ذهنی از بدن، عملکرد جنسی، سازگاری زناشویی، تحلیل مسیر
  • اسحاق درتاج، عباس بهرامپور، علی اکبر حق دوست، کاظم زنده دل، منصوره جابری پور، مریم مرزبان صفحات 33-44
    با افزایش روز افزون بیماری سرطان، داشتن داده صحیح امری ضروری می باشد. برنامه ثبت سرطان در ایران دارای مشکلات متعددی است، درصورت اطمینان از کیفیت داده های مرگ ومیر در کشور و رفع خطاهای آن، منبع بسیار خوبی برای تحقیقات و سیاستگزاری ها خواهد بود. در این طرح کیفیت پوشش داده های مرگ ومیر ناشی از سرطان را به وسیله شیوه صید و باز صید مورد بررسی قرار دادیم.
    در ابتدا اطلاعات مرگ ومیر (از سال85 -1383) و ثبت سرطان (از سال85-1383) از معاونت بهداشتی تهیه شده و سپس با تمامی بیمارستان های استان فارس به استثنای شهرستان های جهرم و فسا تماس گرفته شد و اطلاعات بیماران سرطانی از سال (از سال85 -13830) جمع آوری و سپس10 سرطان انتخاب و با اتصال داده ها (Record Linkage) موارد مشترک شناسایی و در صورتیکه نام فرد در اطلاعات مرگ معاونت بهداشتی یا به صورت مشترک در هر کدام از منابع دیگر بود وی را فوت شده تلقی و ما بقی افراد با تماس تلفنی با بیماران یا خانواده های آنان، در صورتیکه فرد در طی فاصله زمانی 83 الی 85 فوت شده بود وارد مطالعه شده و در نهایت با نرم افزار STATA و با استفاده از شیوه لگاریتم خطی و ایجاد 8 مدل، داده ها آنالیز شد.
    از میان 44863 داده جمع آوری شده تعداد 9401 بررسی و در نهایت 2232 نفر وارد مطالعه شدند. حساسیت سیستم در تشخیص کل سرطانها 58% بوده و بهترین مدل مربوط به بررسی همزمان (بیمارستان و پاتولوژی) بوده و مقدار تخمین زده شده برای کل سرطان ها بر اساس مناسب ترین مدل برابر با 3309 نفر بوده است.
    پوشش سیستم معاونت بهداشتی برای تشخیص تعداد موارد فوت ناشی از سرطان ضعیف بوده، و برای رفع این مشکل فراهم آوردن تمهیدات اساسی برای بالا بردن کیفیت اطلاعات مرگ و میر امری ضروری است و بایستی در اولویت های اولیه سیاست گذاری های بهداشتی قرار گیرد.
    کلیدواژگان: سرطان، صید و باز صید، فارس، میرایی
  • دائم روشنی، نمامعلی آزادی، نادر اسماعیل نسب، مختار یعقوبی صفحات 45-52
    مدل مخاطره متناسب کاکس، رایج ترین روش برای تجزیه و تحلیل اثر متغیرها بر روی زمان بقا می باشد، اما تحت شرایط معین، مدل های پارامتری می توانند بر مدل کاکس برتری داشته باشند. در مطالعه حاضر با استفاده از مدل کاکس و جایگزین های پارامتری از قبیل مدل های وایبول، نمایی و همچنین برآورد ناپارامتری کاپلان- مه یر، عوامل موثر بر بقاء بیماران مبتلا به سکته قلبی حاد، ارزیابی و کارآیی مدلها برای ارائه بهترین مدل مقایسه گردید.
    تحقیق حاضر یک مطالعه توصیفی- تحلیلی از نوع طولی بوده که به روش آینده نگر بر روی 650 نفر از بیماران دارای سکته قلبی حاد انجام گرفت. بیماران به مدت یک سال از لحظه ابتلا به سکته قلبی به لحاظ مرگ یا عدم مرگ پی گیری و اطلاعات لازم با استفاده از چک لیست جمع آوری شدند. رویکردهای پارامتری، نیمه پارامتری و ناپارامتری جهت تعیین عوامل موثر بر مرگ بیماران مبتلا به عروق کرونر در نظر گرفته شدند و برای مقایسه این روش ها از معیار آکائیکه استفاده شد. تحلیل داده ها با نرم افزار STATA نسخه 11 انجام و سطح معنی داری 05/0 در نظر گرفته شده است.
    میزان مرگ و میر در بین بیماران مورد بررسی در طی یک سال 67 نفر (3/10%) بود. 48% بیماران سیگاری، 4/33%دارای سابقه پرفشاری خون، 7/17% دیابتی، 3/15% دارای لیپید بالا و 30% دارای آریتمی بودند. 3/10% دارای بلوک بودند. از نظر عوامل موثر بر میزان بقا نتایج مدلهای پارامتری و مدل کاکس یکسان بودند. از نظر رویکردهای ناپارامتری سن بالا، عدم مصرف استرپتوکیناز و داشتن بلوک قلبی با خطر بالاتر مرگ همراه بودند.
    اگرچه نسبت مخاطره در مدل کاکس و مدل های پارامتری تقریبا مشابه بود و نیز نتایج حاصل از رویکرد ناپارامتری کاپلان مه یر تا حد زیادی شبیه به رویکردهای پارامتری و نیمه پارامتری بود، ولی بر اساس معیارآکائیکه، مدل وایبول برازش دقیق تری داشت.
    کلیدواژگان: بقا، سکته قلبی، مدل کاکس، مدل پارامتری، کاپلان، مه یر، آکائیک
  • محمدتقی شاکری، حبیب الله اسماعیلی، هادی جباری نوقانی، فاطمه همایی شاندیز، حسین باغیشنی، وحید قوامی قنبرآبادی صفحات 53-64
    در مدل رایج خطرهای متناسب کاکس یکی از فرضیات اساسی برقراری فرض استقلال میان زمان سانسور و زمان پیشامد می باشد. در مطالعات بالینی زمانی که سانسور به دلایلی همچون خروج فرد از مطالعه یا خطر رقابتی رخ می دهد همواره نگرانی در خصوص اعتبار نتایج مبتنی بر فرض استقلال سانسورها وجود دارد. ارائه راهکاری جهت بررسی فرض استقلال و نیز تعمیم مدل خطرهای متناسب کاکس در حالت عدم برقراری فرض استقلال مفید می باشد.
    برای رسیدن به این هدف به معرفی تعمیمی از مدل خطرهای متناسب کاکس با استفاده از تابع مفصل می پردازیم. این مدل امکان انجام آنالیز حساسیت، جهت بررسی فرض استقلال را فراهم می نماید. تعمیم تابع درستنمایی و برآورد پارامترها با یک روش عددی با استفاده از نرم افزار R انجام شد. در ادامه با استفاده از این مدل، برقراری فرض استقلال زمان سانسور و پیشامد در مجموعه داده های مربوط به بیماران دارای سرطان پستان که طی سال های 1380 تا 1388جهت درمان به بخش آنکولوژی بیمارستان های قائم (عج) و امید مراجعه نموده بودند مورد بررسی قرار گرفت.
    با استفاده از شبیه سازی ابتدا مناسب بودن مدل ارائه شده اثبات گردید سپس تاثیرات عدم برقراری فرض استقلال بین زمان سانسور و پیشامد بر روی برآورد پارامترها بررسی گردید. در مجموعه داده های واقعی برقراری فرض استقلال مورد تایید قرار گرفت.
    عدم برقراری فرض استقلال می تواند باعث نتایج اریب در مدل خطرهای متناسب کاکس گردد که میزان اریبی با میزان وابستگی میان سانسور و پیشامد ارتباط مستقیم دارد. در مجموعه داده های مربوط به بیماران دارای سرطان پستان مشخص گردید که تشخیص بیماری در مراحل اولیه نقش مهمی در موفقیت درمان و عدم عود بیماری دارد.
    کلیدواژگان: مدل خطرهای متناسب کاکس، آنالیز حساسیت، تابع مفصل، خطرات رقابتی، سرطان پستان
  • محمدتقی شاکری، احسان صباغیان، حبیب الله اسماعیلی صفحات 67-79
    با گسترش روش های استخراج داده های ژنتیکی، روش های تجزیه و تحلیل این نوع داده ها نیز در حال توسعه می باشند. این مطالعه با هدف مقایسه یکی از پرکاربردترین روش های تجزیه و تحلیل این نوع داده ها، یعنی خوشه بندی انجام شده است.
    در این پژوهش با استفاده از 5 مجموعه داده مایکروآرایه، نه ترکیب روش خوشه بندی سلسله مراتبی تجمعی، سلسله مراتبی تقسیم شونده و K- میانگین با متریک های فاصله اقلیدسی، منهاتان و ضریب همبستگی پیرسون پیوند و با استفاده از شاخص پهنای نیمرخ با استفاده از روش نمونه گیری بوت استرپ مقایسه شده است.
    نتایج نشان داد روش خوشه بندی سلسله مراتبی تجمعی با پیوند متوسط دارای بهترین عملکرد بود. همچنین این روش در مقایسه با دیگر روش ها از پایایی بیشتری برخوردار بود. درعین حال روش خوشه بندی سلسله مراتبی تقسیم شونده عملکرد نسبتا مشابهی با روش خوشه بندی K- میانگین داشته است.
    با توجه به نتایج می توان گفت که مبتنی بر شرایط موجود در داده ها بهترین روش خوشه بندی انتخاب می شود
    کلیدواژگان: خوشه بندی، ریزآرایه، بوت استرپ، شاخص های ارزیابی نتایج روش های خوشه بندی
  • محسن شجاع، سید حمید نبوی، عزیز کسانی، سید عباس باقری یزدی صفحات 81-91
    رشد سریع سالمندی باعث توجه بیشتر به مسائل آنها از جمله سلامت روان شده است. در این راستا سرمایه اجتماعی می تواند با ایجاد حمایت های مختلف بر سلامت روان سالمندان تاثیرگذار باشد. از این روی این مطالعه به بررسی رابطه سلامت روان و سرمایه اجتماعی در سالمندان منطقه نه شهر تهران می پردازد.
    پژوهش حاضر یک مطالعه مقطعی است. این مطالعه در نیمه دوم سال 1389 در منطقه 9 شهر تهران و بر روی سالمندان بالای 60 سال انجام گرفت. تعداد 320 سالمند نمونه پژوهش این مطالعه توسط نمونه گیری تصادفی چند مرحله ای انتخاب شده اند. جهت سنجش سلامت روان از پرسشنامه 28 سوالی سلامت عمومی (GHQ -28) و برای سنجش سرمایه اجتماعی از پرسشنامه مطالعه عدالت شهری (Urban HEART) استفاده شد. و جهت تشخیص مولفه های سرمایه اجتماعی از تحلیل عاملی اکتشافی استفاده شد.
    ) با سلامت روانی سالمندان رابطه مشاهده شد. اما بین مولفه اعتماد اجتماعی و روابط انجمنی سرمایه اجتماعی با سلامت روان سالمندان مطالعه رابطه ای مشاهده نشد.
    هر اندازه فرد از سرمایه اجتماعی بیشتری برخوردار باشد؛ از سلامت روانی مطلوبتری برخوردار است. و از طرفی فرد دارای سلامت روانی بهتر واجد شرایط پذیرش مسئولیت ها و نقش های اجتماعی در جامعه است. که این مسئله نشان از رابطه دو طرفه سلامت روان و سرمایه اجتماعی دارد. از این روی ارتقاء هر یک از این مقوله ها می تواند بر دیگری تاثیر گذار باشد.
    کلیدواژگان: سلامت روان، سالمند، اعتماد، سرمایه اجتماعی، تحلیل عاملی
  • سحر نوری، آرش اکابری، کاظم محمد، محمدحسین نیکنام، مهدی محمودی، لاریس آندونیان، کرامت نوری جلیانی صفحات 93-102
    پیشرفت های سریع تکنولوژی قرن اخیر در زمینه مطالعات ژنتیکی ما را با حجم زیاد اطلاعات مواجه کرده و چالشی را در تحلیل این قبیل داده های با تعداد بسیار زیاد متغیر پیشگو بوجود آورده است. مطالعه حاضر با در نظر گرفتن داده ها با تعداد متغیرهای بسیار زیاد همراه با اثرات متقابل آنها که ممکن است در تحلیل آماری داده های ژنتیکی با آن مواجه شویم و با هدف بررسی روش های نوین برای تحلیل اینگونه داده های با بعد زیاد انجام پذیرفت.
    در این مطالعه روش آماری ناپارامتری و نوین جنگل های تصادفی برای تعیین فاکتورهای مهم و اثرگذار ژنتیکی بر روی بیماری آنکیلوزان اسپوندیلیت بکار برده شد. داده ها حاوی اطلاعات مربوط به ژن HLA-B27 و 12 پلی مرفیسم تک نوکلئوتیدی ژنی موسوم به ERAP-1 از 401 بیمار مبتلا به آنکیلوزان اسپوندیلیت و 316 کنترل سالم بود. تحلیل های فوق متعاقبا به کمک رگرسیون لجستیک نیز اجرا شد و نتایج آن با جنگل های تصادفی مقایسه گردید.
    بر اساس نتایج مدل رگرسیون لجستیک گام به گام متغیرهای HLA-B27 و پلی مرفیسم rs28096 به طور معنی دار در ارتباط با بیماری مذکور بودند در حالیکه روش جنگل های تصادفی متغیرهای HLA-B27 و rs1065407 را متغیرهای اصلی اثرگذار روی این بیماری تشخیص داد و rs28096 در رتبه سوم اهمیت قرار داشت.
    نتایج حاصل از این مطالعه حاکی از ارتباط زیاد HLA-B27 با بیماری آنکیلوزان اسپوندیلیت بود. روش کلاسیک و متداول رگرسیون لجستیک پلی مرفیسم rs28096 را مهم ترین فاکتور خطر در رابطه با بیماری معرفی کرد در حالیکه روش جنگل های تصادفی rs1065407 را نیز مهمترین پلی مرفیسم تشخیص داد. لذا محققین بایستی نتایج آماری حاصل از روش های متداول کلاسیک را با روش های جامع و کامل تر نوین از قبیل جنگل های تصادفی در مطالعات غربالگری مدنظر داشته باشند.
    کلیدواژگان: جنگل های تصادفی (RF)، داده های بعد بالا، اثرمتقابل، رگرسیون لجستیک، درخت
  • محمد غلامی فشارکی، فرید زایری، انوشیروان کاظم نژاد صفحات 103-114
    آنالیز چند سطحی روشی کارا برای تحلیل داده های اجتماعی است که در بیش از یک سطح قرار گرفته اند، و در واقع حالت بسط داده شده از مدل های خطی تعمیم یافته می باشد که در آن علاوه بر مدل بندی متغیر پاسخ ضرایب رگرسیونی نیز مدل بندی می شوند. در این مقاله سعی داریم تا بصورت مختصر در مورد جنبه های نظری و شیوه های برازش این تحلیل در حالت سه سطحی و کاربرد آن در داده های طولی فشار خون سخن بگوئیم.
    داده های استفاده شده در این مطالعه با استفاده از مشاهدات سالیانه مرکز بهداشت حرفه ای شرکت فولاد مبارکه اصفهان طی سال های 81 تا 88 و از بین کلیه پرسنل شاغل در این شرکت استخراج گردید. در این مطالعه اثر متغیر نوبتکاری بر فشار خون دیاستولیک افراد با تعدیل اثر متغیرهای BMI و سن مورد ارزیابی قرار گرفت. در این مقاله از نرم افزارهایMLwiN و SPSS جهت برازش مدل چند سطحی استفاده گردید.
    این مطالعه شامل 6713 (2/45% روزکارها، 6% گردش کارهای هفتگی و 8/48% گردش کار های معمولی) بود. در این مطالعه با کنترل عوامل مخدوشگر، نوبتکاری با فشار خون دیاستولیک رابطه معنی داری نشان نداد.
    سرعت بالا و همچنین توان برازش مدلهایی با حجم داده زیاد از جمله مزایای روش های تکراری نسبت درستنمایی بوده همچنین از الگوی کاری کارخانه فولاد مبارکه اصفهان می توان به عنوان الگوی مناسب جهت کنترل نوبتکاری بر فشار خون استفاده نمود
    کلیدواژگان: فشار خون، تحلیل چندسطحی، مطالعه طولی، نوبتکاری
  • سمانه منصوری، محمدحسین نصراصفهانی، کاظم محمد، محمدرضا اشراقیان، مهدی یاسری، محمودرضا گوهری، کرامت نوری جلیانی صفحات 115-125
    تکنیک های لقاح آزمایشگاهی برای درمان ناباروری، سالهاست که مورد استفاده قرار می گیرند در این روش ها بهتر است یک جنین با کیفیت بالا به رحم انتقال داده شود تا موفقیت این روش ها را بالا ببرد. لذا پژوهشی جامع برای شناسایی عوامل مرتبط با کیفیت جنین ها ی حاصل از تلقیح مصنوعی با در نظر گرفتن همبستگی بین جنین های هر زوج انجام پذیرفت که در آن روابط غیر خطی این فاکتورها نیز مورد بررسی قرار گرفت.
    در این مطالعه پس از گردآوری اطلاعات لازم ، روش آماری که از طریق مدل های جمعی تعمیم یافته ارایه شده است برای بررسی روابط غیر خطی متغیرهای پیشگوی کمی با متغیر پاسخ مورد استفاده قرار گرفت و از نتایج حاصل از آن و به کمک روش معادلات برآوردی تعمیم یافته داده های حاصل مورد تجزیه و تحلیل قرار گرفت. این روش با در نظر گرفتن همبستگی بین جنین های حاصل از یک زوج نابارور داده ها را با روش صحیح مورد بررسی قرار می دهد.
    بر اساس نتایج حاصل از روش معادلات برآوردی تعمیم یافته و بررسی روابط خطی اثر دارو ، نوع ناباروری و سندروم تخمدان پلی کیستیک بر روی کیفیت جنین معنی دار شد. این درحالی است که بعد از بررسی روابط غیرخطی متغیر های کمی با کیفیت جنین به کمک روش مدل های جمعی تعمیم یافته ، علاوه بر این متغیرها، استعمال دخانیات و میزان تحرک اسپرم و فاکتور رحمی نیز معنی دار گزارش شد.
    از آنجایی که مشاهدات مربوط به یک فرد دارای همبستگی می باشند نه تنها همبستگی درون خوشه ایدر آنالیز این نوع داده ها توسط روش هایی مثل معادلات برآوردی تعمیم یافته باید مد نظر قرار گیرد بلکه روابط غیر خطی نیز باید مورد بررسی قرار گیرد. نتایج این مطالعه که حاکی از اثر مصرف دخانیات، مصرف دارو، ابتلا به سندروم پلی کیستیک، نوع ناباروری و از بین متغیرهای کمی که توسط مدل جمعی تعمیم یافته مورد بررسی قرار گرفتند میزان تحرک اسپرم بر روی کیفیت جنین معنی دار بود که میزان تحرک اسپرم رابطه ای به صورت غیر خطی با کیفیت جنین های حاصل از لقاح مصنوعی داشت و به طور معنی داری باعث بهبود کیفیت جنین گردید.
    کلیدواژگان: مدل های جمعی تعمیم یافته (GAM)، معادلات برآوردی تعمیم یافته (GEE)، رگرسیون لجستیک رتبه ای، لقاح مصنوعی، تزریق درون سیتوپلاسمی اسپرم
  • الهه کاظمی، مهدی رهگذر، عنایت الله بخشی، ایمانه عسگری، مسعود کریملو صفحات 127-139
    رگرسیون لوجستیک مدلی عمومی برای تحلیل داده های پزشکی و اپیدمیولوژیکی می باشد و اخیرا محققین معدودی تحقیقات خود را به تحلیل مدل های رگرسیون لوجستیک با وجود مقادیر گمشده در متغیرهای کمکی معطوف داشته اند. در بسیاری از پژوهش ها محققین با مجموعه داده هایی مواجه هستند که دارای مقادیر گمشده است. گمشدگی تهدید عمده ای برای درستی نتایج حاصل از مجموعه داده ها محسوب می شوند و اجتناب از آن بسیار مشکل است.
    ساتن و کارول تابع درستنمایی ویژه ای را برای برآورد پارامترهای مدل رگرسیون لوجستیک وقتی که برخی متغیرهای کمکی با مقادیر گمشده از نوع مکانیسم گمشدگی تصادفی (MAR) باشند و سایر متغیرها به طور کامل مشاهده شده باشند، معرفی کرده اند. در این پژوهش از این تابع درستنمایی در تحلیل بیزی برای برآورد پارامترهای مدل رگرسیون لوجستیک استفاده شده است و نتایج به دست آمده با روش های جانهی چندگانه و واحد کامل مقایسه شده است.
    روش های مذکور را بر روی داده های شبیه سازی شده و داده های دندانپزشکی اجرا کرده و نتایج مقایسه ها نشان داد که برآوردهای به دست آمده از روش بیزی دارای انحراف معیارکوچکتری نسبت به دو روش دیگر می باشند.
    پس از مقایسه نتایج حاصل از سه روش مذکور نتیجه گرفته شد که اگر مکانیسم گمشدگی تصادفی باشد، به کارگیری تحلیل بیزی با تکنیک زنجیرهای مارکوف مونت کارلویی (MCMC) منجر به برآوردهای دقیق و فاصله اطمینان کوتاه تری نسبت به روش جانهی چندگانه و روش واحد کامل می شود.
    کلیدواژگان: رگرسیون لوجستیک، گمشدگی تصادفی (MAR)، تحلیل بیزی، زنجیرهای مارکوف مونت کارلویی (MCMC)، جانهی چندگانه، DMFT
  • یدالله واقعی، سمانه نیک طینت، غلامرضا محتشمی برزادران صفحات 141-149
    امروزه مفاهیمی چون عدالت و برابری در بیشتر جوامع، از مفاهیم قابل توجه دولتمردان و مردم به شمار می آیند. مفهوم عدالت در نظام سلامت، هزینه برابر خانوارها در این زمینه تعریف می شود. هدف این تحقیق بررسی نابرابری هزینه های بهداشتی و درمانی خانوارهای استان ها با استفاده از شاخص های معمول اندازه گیری نابرابری و روش های آماری می باشد.
    در این تحقیق از داده های هزینه بهداشتی و درمانی خانوارها در سال 1387، دریافت شده از مرکز آمار ایران استفاده شده است که مراحل آماده سازی داده ها، برآورد و محاسبه شاخص ها و رسم نمودارها با برنامه نویسی در نرم افزارS-PLUS انجام گرفته است. برای رسم نقشه های مقایسه ای شاخص ها از نرم افزار Arcgis9. 2 استفاده شده است.
    با برآورد شاخص های نابرابری، رسم نمودار ها و نقشه ها دریافتیم که نابرابری هزینه های بهداشتی و درمانی در استانها بسیار زیاد بوده بطوریکه استان های خراسان رضوی و هرمزگان به ترتیب با ضریب جینی71/0 و 92/0 کمترین و بیشترین رتبه را بین استان ها دارند. از طرف دیگر میانگین این هزینه از حدود 90000 ریال تا 630000 ریال تغییر می کند و استان های محروم واقع در مرزهای شرقی کمترین میانگین هزینه را دارند.
    میانگین هزینه های بهداشتی و درمانی خانوارها بین استان ها با حرکت از شرق به غرب افزایش می یابد. به عبارت دیگر هزینه کرد خانوارهای استان های محرومی که درآمد کمتری دارند و از امکانات کمتری برخوردارند، در امر بهداشت و درمان نیز کمتر است. از طرف دیگر نابرابری در توزیع این هزینه ها بین خانوارها در استان ها بسیار زیاد است. دولت ها باید با افزایش امکانات بهداشتی و درمانی در نقاط محروم و با اختصاص کمک های مالی به روش های مختلف مانند انواع بیمه ها، یارانه های غیر مستقیم و… این نابرابری را کاهش دهند.
    کلیدواژگان: هزینه های بهداشتی و درمانی، نقشه، ضریب جینی، منحنی لورنتس
  • میرسعید یکانی نژاد، کرامت نوری جلیانی، آرش اکابری، مهدی یاسری صفحات 151-159
    امروزه داده های زیادی وجود دارند که در آنها فرض استقلال داده ها که پیش فرض اصلی بسیاری از مدلهای آماری است برقرار نیست. داده های حاصل از نمونه گیری خوشه ای، مطالعات طولی با اندازه گیری های مکرر و یا داده های زوجی مانند داده های دو چشم و همچنین مطالعات همسان سازی شده نمونه هایی از این داده ها هستند دو مدل آماری با در نظر گرفتن همبستگی بین مشاهدات، مدلهای آمیخته و مدلهای حاشیه ای هستند که در این مقاله مورد مقایسه قرار گرفته اند. این مدلها از نظر روشی که همبستگی بین داده ها را در نظر می گیرند و تفسیر ضرایب رگرسیونی با یکدیگر تفاوت دارند. در مدلهای غیر خطی ضرایب رگرسیونی مدل حاشیه ای تغییرات در سطح جامعه را نشان می دهد در حالیکه در مدلهای آمیخته این ضرایب تغییرات را در یک فرد یا خوشه خاص نشان می دهند. در مدلهای خطی تفسیر ضرایب رگرسیونی در هر دو مدل یکسان است. به عنوان یک نتیجه گیری کلی در مدلهای غیر خطی که تفسیر نتایج متفاوت است بر اساس کاربرد مورد نیاز بهتر است از یکی از این دو مدل استفاده شود. در واقع برای سیاستگذاران بهداشتی که دید جامعه نگر دارند استفاده از مدل حاشیه ای توصیه می شود در حالیکه برای پزشکان معالج که بیشتر به تغییرات فردی در یک بیمار علا قمند هستند استفاده از مدل آمیخته مناسبتر است.
  • سعید موسوی، علیرضا سلطانیان، قدرت الله روشنایی، جواد فردمال صفحات 161-169
    در اغلب کشورهای جهان، بیماری های قلبی به عنوان اولین علت مرگ در بین بیماری های غیر واگیر شناخته شده است که در ایران نیز یکی از علل مهم مرگ و میر می باشد. بنابراین شناخت عوامل موثر بر بقای این بیماران حائز اهمیت می باشد. در این مطالعه اثرجمعی عوامل خطر بر مخاطره مرگ افرادی که دچار سکته حاد قلبی شده اند، بررسی شده است.
    در این مطالعه هم گروهی تاریخی،197 بیمارکه طی سال های1376 تا 1380 برای اولین بار دچار سکته قلبی حاد شده و به بیمارستان های شهر بوشهر مراجعه کرده بودند، مورد بررسی قرار گرفتند. در این مطالعه از مدل مخاطرات جمعی آلن برای بیان رابطه بین میزان مخاطره مرگ بعد ازاولین سکته قلبی و عواملی از جمله سن بیمار هنگام سکته، جنس، فشارخون سیستولیک و دیاستولیک،کلسترل سرم تام،LDL و HDLاستفاده شد.
    ) اگر چه ارتباط سن هنگام بروز سکته قلبی با بقای بیمار معنی دار بود (0. 05p<).
    مدل مخاطرات جمعی آلن نشان می دهد که با افزایش سن در هنگام سکته، خطر بقا بیماران سکته قلبی حاد افزایش می یابد.
    کلیدواژگان: سکته قلبی، مدل مخاطرات جمعی آلن، بقا
  • زینب مقدمی فرد، جمیله ابوالقاسمی، علی عسگری داریان، محمودرضا گوهری صفحات 171-180
    بررسی عوامل موثر بر بروز سرطان پستان جهت دستیابی به راه هایی برای افزایش سلامت افراد و طول عمر مبتلایان یکی از دغدغه های هر روزه دانشمندان شاخه های مختلف علوم زیستی و پزشکی است. این مطالعه به منظور تحلیل عوامل مرتبط با بقای بیماران مبتلا به سرطان پستان با استفاده از مدل مخاطرات جمعی آلن و بررسی مزیت های نمودار آلن انجام پذیرفت.
    طی سال های 1384 تا 1386 تعداد 133 زن مبتلا به سرطان پستان برای درمان به بیمارستان شهید فیاض بخش تهران مراجعه نمودند. بیماران تا فروردین سال 1390 مورد پیگیری قرار گرفته و آخرین وضعیت آنان ثبت گردید. برای تحلیل داده ها از مدل مخاطرات جمعی آلن استفاده شد. برای برآورد اثر عوامل پیش آگهی دهنده در طول زمان از نمودار آلن استفاده گردید.
    عوامل معنی دار در تحلیل تک متغیره وارد تحلیل چند متغیره شده و از بین آنها HER2 مثبت) 03/0= (p، درجه بدخیمی تومور سوم 001/0< (p و تعداد گره های درگیر بیش از 10) 02/0= (p در مدل چندمتغیره به عنوان عوامل افزایش دهنده خطر مرگ بیماران سرطان پستان تعیین گردیدند.
    مدل مخاطرات جمعی به عنوان جایگزینی مناسب برای مدل کاکس به کار می رود که در آن انحراف معیار برآوردها نسبت به مدل کاکس کوچک تر خواهد بود.
    کلیدواژگان: سرطان پستان، بقا، مدل مخاطرات جمعی آلن
  • آزاده احمدی، محمودرضا گوهری، بیستون حسینی، مسعود رودباری صفحات 181-189
    افزایش میزان ابتلا و مرگ و میر ناشی از سرطان معده در ایران و جهان طی سال های اخیر، ضرورت تحقیق در زمینه این بیماری را آشکار می سازد. در این مطالعه تابع مخاطره بیماران مبتلا به سرطان معده با استفاده از روش موجک، برآورد و با روش هسته مقایسه شد و برخی عوامل موثر بر مخاطره این بیماری، مورد بررسی قرار گرفت.
    95 بیمار مبتلا به سرطان معده که طی سال های 1375 تا 1382 به بیمارستان شهید فیاض بخش تهران مراجعه کرده بودند، تحت بررسی قرار گرفتند. در این مطالعه اثر متغیرهای سن، جنس، مرحله بیماری و نوع درمان بر طول عمر بیماران مورد ارزیابی قرار گرفت. برای تجزیه تحلیل داده ها از آنالیز بقاء، به روش موجک و آزمون لگ رتبه در نرم افزار R استفاده شد.
    3/25% از بیماران، زن و بقیه مرد بودند. 14% درمان با جراحی و بقیه درمان بدون جراحی داشتند. 7/74% تا پایان مطالعه فوت و بقیه سانسور شدند. 5/9% در مرحله ابتدایی، 7/53% در مرحله گسترش موضعی و 8/36% در مرحله متاستاتیک بودند. برآورد تابع مخاطره به روش موجک برای مرحله بیماری، تفاوت معنی داری با مقدار احتمال001/0P< داشت و برای جنسیت، سن و نوع درمان تفاوت معنی داری را نشان نداد.
    تنها متغیر اثرگذار بر مخاطره بیماری، متغیر مرحله بیماری است و بیشتر بیماران در مراحل پیشرفته تشخیص داده شده اند که می تواند یکی از مهم ترین دلایل مخاطره بالای مرگ و بقای پایین این بیماران باشد. بنابراین آموزش علائم اولیه این بیماری از طریق رسانه های گروهی و انجام آزمایشات دوره ای و غربالگری برای تشخیص زودهنگام آن، ضروری می نماید.
    کلیدواژگان: مخاطره، سرطان معده، موجک، هسته
  • کرامت الله نوری جلیانی، کاظم محمد، کمال اعظم، محمدرضا اشراقیان، حجت زراعتی، آرش اکابری، سعید یکانی نژاد، مهدی یاسری صفحات 191-201
    هدف از این مطالعه بررسی شیوع گواتر قابل مشاهده ناشی از کمبود ید است اختلال های ناشی از کمبود ید از مهمترین مسائل بهداشتی- تغذیه ایی است. در بیشتر مناطق تنها عارضه قابل مشاهده کمبود ید، گواتر است.
    اطلاعات این مقاله مربوط به بررسی سلامت و بیماری که در سال 1378 در کل کشور انجام گرفته است. در این مطالعه جمعا 53633 نفر از لحاظ غده تیروئید مورد معاینه قرار گرفتند. برای تعیین ریسک فاکتورهای موثر بر بیماری گواتر قابل مشاهده از رگرسیون لجستیک چندگانه آمیخته بهره گرفتیم.
    بر اساس نتایج این مطالعه1/32 درصد افراد مبتلا به درجات مختلفی از گواتر بودند. و 5/4 درصد افراد گواتر قابل مشاهده داشتند. ابتلا به انواع درجات گواتر در رده های سنی مختلف ، دردو جنس و در شهر و روستا تفاوت معنی دار آماری داشت (p-value<0/001). در ضمن1/6 درصد از زنان مبتلا به گواتر قابل مشاهده بودند وشانس ابتلا به گواتر قابل مشاهده در زنان 29/2 برابر (CI95%=(2/09،2/50) ) مردان بود. همچنین4/5 درصد از روستاییان مبتلا به گواتر بودند وشانس ابتلا به گواتر در روستائیان 39/1 برابر (CI95%=(1/28،1/50) ) ساکنین شهرها بود. بیشترین ابتلا به گواتر در رده سنی 18-13 سال با شیوع 6 درصد بود
    با توجه به نتایج حاصله توجه بیشتری به تغذیه گروه سنی 13 تا 18 سال و روستائیان و خانمها برای جلوگیری از گواتر قابل مشاهده نیاز است.
    کلیدواژگان: گواتر، ایران، رگرسیون لجستیک آمیخته، طرح سلامت و بیماری
|
  • Pages 7-14
    Background and Objectives
    One of the popular studies in medical sciences for finding risk factors and the reason of the disease, are case-control studies that the important index we can calculate is odds ratio. but some confounders which effect on response variable challenge the OR’s validity and present OR more or less than the real value. One way of omitting the effect of confounder is designing matched studies. Logistic regression is one of the general method for modeling this studies. This article compares 3 logistic regression model: independence, marginal and conditional.
    Materials and Methods
    This study has been conducted on correlated simulated data. Thus the data is simulated from bivariate normal distribution with the correlation coefficients (0,0.2,0.4,0.6,0.8). Then with changing cut-off points at(0.05,0.25), (0.25,0.1), (0.25,0.15), (0.25,0.25) for their c.d.f ,we convert continues distribution to categorical binary distribution which data are related together. Then 3 logistic regression model in independence, marginal and conditional version fit to data and calculate OR. With 10000 times iteration, we compare 2.5 and 97.5 percentiles values and the median OR percentile value at the above cut-off points for all there models.
    Results
    When the correlation is zero, all three models have the same quantity for OR and also changing in point have the same coefficient. But with the increasing correlation between the observations, OR between marginal model and independence model is not different. But its value will vary with the conditional model. For example, the cut-off point (0.25,0.1) and when the correlation is 0.6, median of OR that obtained in marginal model and independence model is 2.8, but in conditional model this quantity is 5 and it is twice of fitted value.
    Conclusion
    When the correlation between observation is high, using of conditional model is more correctly method and with increasing this correlation , our error rate by using independence or marginal model rises. But when correlation between observations is negligible, using of the three models give similar estimates.
    Keywords: case, control studies, marginal logistic model, conditional logistic model, simulation, confounder
  • Pages 15-22
    Background and Objectives
    Logistic regression is a general model to determine the relationship between covariates and binary response variables. Artificial neural network model is an alternative flexible model which can be used in these cases, too. This study aimed to make a comparison between the predictions of ANN and logistic regression model for binary outcome of medical data.
    Material &
    Methods
    Data gathered from 639 registered gastric cancer patients between January 2002 and October 2007 at the Research Center for Gastroenterology and Liver Diseases of Shahid Beheshti University of Medical Sciences, Tehran, Iran. Stage of disease was considered as the dependent variable. Network performance was assessed by using of least square error of prediction and then concordance indexes and area under receiver operative characteristic curves (AUROC) were used to comparison of neural network and logistic regression models. Data analysis was performed by R 2.12 software.
    Results
    Results showed that the concordance index of ANN and LR for drug treatment was calculated as 0.771 and 0.710; respectively. In addition AUROC for ANN and LR models were 0.725 and 0.699, respectively. The difference between the values of observed and predicted of the dependent variable by two models was significant (P=0.002).
    Conclusion
    As a result, the total accuracy prediction of the ANN model is better than LR model, so this model is suggested to predict the stage of gastric cancer disease and also diagnostic goals.
    Keywords: Artificial neural network, Logistic regression, Prediction, Binary response
  • Pages 23-32
    Background and Objective
    Infertility has several adverse effects on body, psychological and social aspects of women. Otherwise, body image could be a predictor of different behaviors including sexual behavior. Thus, in the present study we aimed to assess the association between body image with sexual function and marital adjustment in fertile and infertile women.
    Materials and Methods
    One-hundred and thirty fertile and 130 infertile women were enrolled in this study. Statistical analysis was performed by using AMOS 18 with structural equation modeling.
    Results
    In fertile women, the strongest path coefficient was related with the effect of body image on general health, while in infertile women, the strongest path coefficient was associated with the effect of body image on sexual function. In both occupying and non-occupying women the strongest path coefficient was related with the effect of body image on general health. In those infertile women who had the supports of their partners, the strongest path coefficient was associated with the effect of body image on sexual function, and in those infertile women who had not the supports of their partners; the strongest path coefficient belonged to the effect of sexual function on marital adjustment.
    Conclusion
    Based on our results, it seems that using structural equation modeling in evaluating and recognition of direct, indirect and total effects of the similar model is absolutely necessary and can be a good alternative method instead of regression.
    Keywords: body image, sexual function, marital adjustment, path analysis
  • Pages 33-44
    Background And Objective
    Incidence and prevalence of cancer is increasing worldwide, especially in the low and middle income countries, including I.R o Iran. Valid data is needed to measure burden of cancer and take appropriate decision towards cancer control. Due to limitation of cancer registrations it is hard to make an inference about cancer in Iran. It is important to measure how complete and valid is the report of cancer incidence and mortality.
    Material &
    Method
    We prepared mortality registry (source 1) and cancer registry (source 2) data from the health deputy in Fars province. In addition, we collected cancer cases from different hospitals (source3) between 2000 and 2005. We followed the cancer patients from the date of diagnosis up to the date of death.. We selected 10 most common cancer types in this study. If any of the patients died during 2003-2005 enter to this study. We compared mortality data from the three sources using capture recapture method using log linear modeling.
    Result
    We collected 44863 data in which 9401was evaluated and finally 2232 enter to the study. Sensitivity of the mortality registry was 58% and based on the best model estimated number of cases was 3309 instead of the observed number.
    Conclusion
    Coverage of the mortality registry for cancer death was weak leading to an underestimation in the mortality rate of the Fars Province. Improvement of the mortality registry is needed before making any firm decision about burden of cancer.
    Keywords: capture recapture, Fars, mortality
  • Pages 45-52
    Background and Objectives
    Cox proportional hazard regression model is the most common and standard method to study the effect of potential covariates on the survival times. However, under certain conditions such as availability of a good information about the system under study, parametric models are known to be more efficient than the Cox models. In this study, we aim to evaluate the efficiency of the semi-parametric Cox models and alternative parametric models and nonparametric Kaplan-Meier estimates in analyzing the survival times of patients suffering from acute myocardial infraction
    Material &
    Methods
    This study is a prospective-cohort research with the total number of 650 participant's experienced acute myocardial infarction. The patients followed up for one year in order to analyze their survival times. Three approaches; non-parametric, semi-parametric and parametric models, were used to model the survival times. To evaluate the relative goodness of fit of each procedures, Akaike information criterion (AIC) was used.
    Results
    During one year of the following up, the total number of 67 deaths were reported. Out of 460 initial patients, 48% were smoking, 33.4% suffered from hypertension, 17.7% diabetes, 15.3 Hyperlipidemia, 30% airtime, and 10.3% had block. A broad agreement was observed between parametric and Cox models. Both models associated similar covariates as significant factors. However, the non-parametric model suggested high age , non used streptokinase and block significantly increased the risk of death.
    Conclusion
    However, the hazard ratio in Cox model and parametric models were similar and results of nonparametric Kaplan Meier approach were largely similar but, The AIC suggested the parametric Weibull model as the most appropriate model for modeling the survival times of patients with acute myocardial infarction.
    Keywords: Survival, Cox model, Parametric Model, Kaplan Meier, AIC
  • Pages 53-64
    Background and Objectives
    In the common Cox proportional hazards model one of the basic assumptions is independence between censoring time and event time. In clinical studies, when censoring is caused by competing risks or patient withdrawal, there is always a concern about the validity of treatment effect estimates that are obtained under the assumption of independent censoring. Introduction a solution for checking the assumption of independent and extending the Cox model for dependent censoring is useful.
    Material &
    Methods
    To achieve this goal, we use copula function and extend the Cox model. This model can also perform a sensitivity analysis for checking the assumption of independent. We generalize the likelihood function in R software and estimate the parameters by using a iteration algorithm. We apply the proposed method to the data of breast cancer patients at Ghaem and Omid hospitals and check the independence assumption.
    Results
    We show by Simulation that this algorithm works well and show the effect of dependent censoring on estimated parameters. We apply the proposed method to the data of breast cancer patients at Ghaem and Omid hospitals and show that the independence assumption is true.
    Conclusion
    Not assumption of independence causes bias in estimation in Cox model and the bias is dependent on the degree of association between event and censoring times. In dataset of breast cancer patients the primary diagnosis is an important role in Success in the treatment.
    Keywords: Cox proportional hazards model, sensitivity analysis, copula function, competing risks, breast cancer
  • Pages 67-79
    Background
    The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientific community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using "classic" clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context.
    Method and Material: We present CCK index for assessing clustering result of gene expression data. This index was made by combining two arbitrary classification and clustering algorithms result and finally. the first large-scale analysis of nine different clustering methods, Hierarchical clustering with Single, Average, Complete and Ward linkages, UPGMA, Diana, K-means, PAM and CLARA methods for the analysis of 5 cancer gene expression data sets. Afterward we use Margin Trees method for assessing quality of result of clustering methods. Ultimately we calculate quality of result of clustering methods via Kappa coefficient between result of clustering methods and result of Margin Tree method for each clustering methods.
    Results
    Our results reveal that the PAM, followed closely by CLARA, exhibited the best performance in terms of recovering the true structure of the data sets. Also we found that Partitioning clustering methods (PAM, CLARA and K-means) have better performance than Hierarchical clustering methods (Hierarchical clustering with Single, Average, Complete and Ward linkages, UPGMA and Diana).
    Conclusion
    The validation technique was used in this paper (Margin Trees) can aid in the selection of an optimal algorithm, for a given data set, from a collection of available clustering algorithms.
    Keywords: Clustering, Microarray, Bootstrap, Indicators to
  • Pages 81-91
    Background and Objectives
    Numbers of older people rapidly increase. Therefore it is important to the health of the elderly. Social capital by providing emotional and mental supports plays an effective role in promoting mental health in older people. So this study examines the factors affecting mental health and its relationship with social capital in the older people of Tehran 9 district.
    Materials And Methods
    This study is a cross-sectional study that was conducted in Tehran 9 district on the older people over 60 years in 2011. 320 participants in this study were selected by multistage random sampling. To assess mental, health General Health Questionnaire (GHQ-28) and to assess social capital, Urban HEART Questionnaire were used. To determine components of social capital, used from exploratory factor analysis.
    Results
    factor analysis determined three factors include individual trust, social cohesion–support and social cohesion-support. That these three components, explained 68.1 percent of the total variance of social capital. There was relationship between mental health and individual trust and social cohesion and support. But there was not relationship between mental health and social trust and collective relations.
    Conclusion
    Whatever the social capital is more, mental health is also better. On the other hand individuals with better mental health, qualified to social responsibility and role in society. This shows that there is a mutual relationship between mental health and social capital. So the promotion each of them can effect on other.
    Keywords: Mental health, Older people, Social capital, Factor analysis
  • Pages 93-102
    Background And Objectives
    Technology advances in this century, especially, in molecular generics yields high volume, high dimensional data. This creates many unprecedented challenges for statisticians who are responsible for analysis of such data. Although logistic regression method is quite popular in association analysis in medical researches but it has some serious limitations in handling high dimensional data. In present study, our goal is introduce a modern model-free statistical method called random forest that we believe is able to overcome difficulties of the classical statistical methods in finding association between predictors and a trait.
    Material and
    Methods
    In this study, the nonparametric random forest technique was employed to determine the important factors associated with ankylosing spondylitis (AS) disease. Genetic materials including information on HLA-B27 status (positive/negative) and 12 polymorphisms of the ERAP-1 gene were collected on 401 patients and 316 healthy controls. The data were analyzed both with the logistic regression method and random forests technique and the results were compared.
    Results
    Based on a stepwise logistic regression, HLA-B27 and rs28096 polymorphism were significantly associated with the disease. However, using the random forests technique, we found that HLA-B27 and rs1065407 were the main factors associated with diseases and in fact rs28096 polymorphism becomes the third in importance ranking.
    Conclusion
    The results from our study indicate some discrepancies between logistic regression and random forest analyses of high-dimensional data such as the genetic data that we are dealing here. Although logistic regression is quite popular, easy to employ, and is a predominant statistical method among researchers, but it has some serious limitations. On the other hand, more modern statistical such random forest enjoy a more methodological sophistication and yield more accurate and reliable results. Therefore, researchers should be aware of such alternatives and should use these alternatives accordingly and as situation arise in screening tests especially in genetic data analyses.
    Keywords: random forests, High, dimensional data, interaction, logistic regression, CART
  • Pages 103-114
    Background And Objectives
    Multilevel (hierarchical) modeling is effective method for analyzing social data that set in more than one level. Multilevel Modeling is generalization of linear modeling in which regression coefficients are themselves given a model, whose parameters are also estimated from data. In this paper we want to illustrate about theoretical aspects and estimating method in three level modeling and application of this method in longitudinal Blood Pressure (BP) data.
    Material and
    Methods
    Data of this longitudinal study were extracted from annual observations of the male workers of Isfahan’s Mobarakeh Steel Company (IMSC), collected in the Health and Safety Executive office of the company between 2003 and 2009. In this research, we assessed the effect of Shift Work (SW) on Diastolic BP (DPB) with controlling BMI and age. In this paper, MLwiN and SPSS software were used to apply a Multilevel Modeling.
    Results
    This study consist of 6713 workers (45.2% regular day worker, 5.8% weekly rotating shift worker, and 49% routine rotating shift worker). In this study, after controlling confounding factor, SW not showed a significant association with DBP.
    Conclusion
    High speed and high ability to fit models with high sample size are benefits of Iterative method rather likelihood method. And also suitable model of IMSC can be used to control the effect on BP on SW.
    Keywords: Blood pressure, Multilevel modeling, Longitudinal, study, Shift work
  • Pages 115-125
    Background and Objectives
    In vitro fertilization techniques are used for many years. In such methods, if feasible, it is always better to transform a high quality embryo into uterus to enhance the chance of the success. Therefore, a comprehensive research was conducted to identify important factors related to the embryo quality. We considered potential correlation between embryos derived from an infertile couple in our statistical analyses. In addition, possible nonlinear relationships between the factors and the embryo quality were investigated.
    Materials And Methods
    In this study, after collecting the necessary information, the statistical method of generalized additive models (GAM) has been employed to determine any nonlinear relationship between quantitative exploratory variables and the response. Then, the results were used to analyze the data using the Generalized Estimating Equation (GEE) technique. Such model can handle correlation which may present among infertile couple embryos. Finally, important factors related to the embryo quality of in-vitro fertilization by intra-cytoplasmic sperm injection methods were identified.
    Result
    Based on results of the GEE, linear relationships of drugs, type of infertility, and polycystic ovary syndrome was statistically significant on embryo quality. Interestingly, after examining the nonlinear relationships with GAM, in addition to the above variables, smoking status, sperm motility, and uterine factor were also shown to be significant.
    Conclusion
    Since observations on a single subject in fertilization techniques are correlated and the relationship between factors and outcomes of fertilization may not be linear, the usual methods of GAM should incorporate the potential intra-cluster correlation using models such as the GEE. Our results suggest significant effects of tobacco use, drugs, polycystic ovarian syndrome, type of infertility, and sperm motility on the embryo quality. Sperm motility has non-linear effect on embryo quality resulting from in vitro fertilization and improved the overall model fit.
    Keywords: Generalized Additive Models (GAM), Generalized Estimating Equations (GEE), Intra Cytoplasmic Sperm Injection, In Vitro Fertilization
  • Pages 127-139
    Background and Objectives
    Logistic Regression is a general model for medical and epidemiological data analysis. Recently few researchers have directed their studies to analysis of Logistic Regression with missing value at covariate variable. While the missing is a major threat in results authenticity of data set, in many studies the researchers face data with missing value and it is difficult to avoid such a case in studies.
    Material &
    Methods
    Satten and Carroll, in the case of completely observed value of covariate variable and some covariate variable with missing at random mechanism (MAR), introduced a special likelihood function for parameters estimation of Logistic Regression model. In this research the above- mentioned likelihood function has been used in Bayesian analysis for parameters estimation of Logistic Regression model and the conclusions are compared with the Multiple Imputation method and Complete Case method.
    Results
    The above-mentioned methods were applied on both simulation data and dentistry data and concluded that The parameters estimation from SCMCMC method had less variance in comparison with parameters estimation from Multiple Imputation and Complete Case methods.
    Conclusion
    After comparison of the three mentioned methods results it had been concluded that if the mechanism is of missing at random the application of Bayesian analysis with MCMC causes to more accurate estimation and shorter Confidence Intervals than the Multiple Imputation method and Complete Case.
    Keywords: Logistic Regression, Missing at Random (MAR), Bayesian Analysis, Markov Chain Monte Carlo, Multiple Imputation, DMFT
  • Pages 141-149
    Background and Objective
    These days, in many societies, fair and equality are the most significant concepts among the governments and peoples. The concept of fairness in the health systems, describes equal expenses of households in this area. The aim of this paper is to investigate the health expense inequality of households in the Iran provinces, with Gini index of inequality measurement and statistical methods.
    Materials and Methods
    In this paper we use the 2008 health expense data from statistical center of Iran. The process of preparing data and estimating the statistical indexes, (like mean and coefficient of variation, Lorenz curve and evaluating the Gini index) and making plots have been done with the use of S-PLUS software. For making the index comparing maps we have used Arcgis 9.2 software.
    Results
    By estimating the Gini index, plots and maps we found out that there is a remarkable inequality of health expenses in the provinces such as the Khorasan Razavi and Hormozgan by 0.71 and 0.92 who had the least and the most expenses between the provinces. On the other hand the mean of these expenses varies from 90000 to 630000 Rials and the poor provinces that are in the east borders of Iran have the least mean of this expense.
    Conclusions
    The mean expenses of health in households decreases between states by going from east to the west of country. The household expenses of poor states have the least incomes and, the least facilities in health. On the other hand inequality in this expenses distribution is noticeable. Governments should decrease the inequality by increasing health facilities and financial aids in poor areas and in different ways such as different types of health insurance.
    Keywords: Health expenses, Map, Gini coefficient, Lorenz curve
  • Pages 151-159
    In medical researchers, there are lots of correlated data which cannot be analyzed using the usual classical statistical methods because the assumption of independency between observations is not met. Data from cluster sampling, longitudinal studies, observations on paired organs and matched studies are examples of such data. Two statistical methods that can be used to correctly handle these kinds of data are marginal and mixed models. These models are different in considering correlation between subjects and Interpretation of the regression coefficients. The regression coefficients in marginal models with non-identity link functions show the change in population whereas in mixed models they represent changes within a subject or a cluster. In result, in nonlinear models, application of these two kinds of models depends on the areas of their usage. While the marginal models are more attractive to the Health policy makers who are considering the potential effects of a variable on the population as a whole, the mixed model will be of most interest to a physician in a physician/patients context
  • Pages 161-169
    Background and Objective
    In most countries, heart diseases are known as first cause of death among non-contagious diseases and in Iran it is one of the most important causes of death. Therefore assessing risk factors associated with survival of these patients is necessary. In this study, effect of some risk factors on hazard of death of subjects with acute myocardial infarction (AMI) is investigated.
    Materials and Methods
    In this historical cohort study, 197 patients that experience AMI for the first time was studied which were admitted in Bushehr hospitals during 1997-2001. Aalen’s additive hazard model used in this study to assess the relation of death hazard rate after first AMI and risk factors like age at time of infarction, patient’s sex, systolic and diastolic blood pressure, serum total cholesterol, LDL and HDL.
    Results
    Average survival time of patients in the present study was more than 4 years. The result showed that there is no significant relation between sex and survival time of patient (p>0.05) however age at time of infarction has a significant relation with survival of patient (p
    Conclusion
    According to Aalen’s additive hazard model as age at time of infarction increases, survival risk of AMI patients increases.
    Keywords: Acute myocardial infarction, Aalen's additive model, survival
  • Pages 171-180
    Background And Objectives
    The analysis of age and survival probabilities, today, is several decades old. The calculation of age average in different groups of human society and analysis of factors which are effective on it to access methods for increase of individual’s health and age is one the daily concerns of scientists in different branches of biology and medicine. The objectives of this study were to assess the effects of prognostic factors on survival of patients with breast cancer using the Aalen additive hazards model, and to illustrate the advantage of Aalen’s plot.
    Materials And Methods
    during 2005-2007, 133 women with breast cancer were treated in Fayazbakhsh hospital, Tehran. All patients followed until 2011 April. To analysis data, Aalen's additive hazard model used. The graph of estimated cumulative regression function (Aalen s graph) was draw to analyze the effect of independent variable during time.
    Results
    Significant factors in univariate analysis was entered into multivariable analysis of Allen`s additive hazard model. HER2, third tumor malignancy grade and the number of positive lymph nodes more than 10 were recognized as significant factors in patient`s survival in multivariable model.
    Conclusion
    Additive hazard model is used as a suitable substitution for Cox model. In which standard deviation of
    Keywords: breast cancer, survival, Aalen's additive hazard model
  • Pages 181-189
    Background and Objectives
    The increase of mortality rate of gastric cancer in Iran and World in recent years, reveal necessity of studies on this disease. In this study, Hazard Function for gastric cancer patients was estimated using Wavelet and Kernel methods to compare, and some related factors with the Hazard Function were assessed.
    Material &
    Methods
    Ninety-five gastric cancer patients in Fayazbakhsh Hospital between 1996 and 2003 were studied. The effects of age of patients, gender, stage of disease and treatment method on patients’ lifetime were assessed. For data analyses, survival analyses using Wavelet method and Log-rank test in R software were used.
    Results
    Nearly 25.3% of patients were female and the rest were male. Fourteen percent had surgery treatment and the rest had treatment without surgery. Three forth of patients died and the rest were censored. Almost 9.5% of patients were in early stage of disease, 53.7% in Locally Advance stage and 36.8% in Metastatic stage. The Hazard Function estimation in Wavelet method showed significant difference for stage of disease (P
    Conclusion
    Only stage of disease had effect on hazard and most of patients diagnosed in the late stages of disease, which is possibly one of the most reasons for high hazard rate and low survival of these patients. Therefore, it seems to be necessary a public education about symptoms of disease by media and regular tests and screening for early diagnosis of this disease.
    Keywords: hazard, gastric cancer, wavelet, kernel
  • Pages 191-201
    Background And Objectives
    This study was performed to surveillance visible goiter. Iodine deficiency disorders (IDD) are among the most important health-nutrition problems. In the most area where exposed with iodine deficiency the only visible Complication is goiter.
    Material and
    Method
    This study was performed with the data of the national study of health survey (1999) in Iran. In this survey 53633 people were selected and examined thyroid gland. In order to study risk factors of visible goiter Chi-square test and multiple mixed logistic regression have been used.
    Result
    Based on this study it has been shown that 32.1 percent of people have a kind of goiter. And 4.5 percent of people had visible goiter. Frequency of goiter was significantly different in the age categories, different sex and in rural and urban (p-value
    Conclusion
    Consider the result of this study, there should be more consideration on the nutrition of 13 to 18 age category, female and rural to prevent the goiter
    Keywords: Goiter, Iran, Logistic Regression, Health