روی آوردهای نوین در روان سنجی

قسمت سوم، مدله ای نظریه سوال - پاسخ، مدله ای راش
نویسنده:
چکیده:
در هفتاد سال گذشته نظریه پردازان متعددی تلاش کرده اند تا نشان دهند که چگونه می توان از اندازه ها و فراوانی های عینی1، اندازه های انتزاعی2 به دست آورد. یکی از عملی ترین و رایج ترین روی‎آوردهایی که برای این منظور به کار می رود، مدل راش3 است. جورج راش، ریاضیدان دانمارکی، این روی‎آورد را در سال 1953 و به منظور تحلیل پاسخهای یک رشته از آزمونهای خواندن به وجود آورد. با آنکه وی را پدر تحلیل راش می دانند، اما بنجامین رایت4 را باید قیم قانونی آن دانست. رایت و همکارانش در دانشگاه شیکاگو روش های پیشرفته و ابزارهای تحلیل راش را توسعه، و کاربرد آن را در حوزه های مختلف علمی ارتقا بخشیدند (ماسوف و فیشر، 2002).
مدلهای راش در واقع روی‎آوردی ریاضی برای آزمون این فرضیه است که اندازه های مربوط به معنا5 و واحد یک سازه را می توان از ابزاری که برای آن خصیصه تهیه شده است به دست آورد. وقتی داده ها با این مدلها برازش پیدا می کنند به معنای آن است که ابزار اندازه گیری و اندازه ها در یک واحد فاصله ای مشترک مقیاس بندی شده‎اند و می توانند در انواع یا شکلهای مختلف آن ابزار و نیز در بین نمونه های مختلف یک جامعه ثابت باقی بمانند (رایت و استون، 1979).
مدلهای راش، در واقع نوعی آزمون همسانی درونی6 در نظریه سوال پاسخ اند که برای داده های دوارزشی و چند ارزشی به کار می روند. در این مدلها نیز مانند مقیاسهای گاتمن7، فرض براین است که همه سوالها و مواد یک آزمون که یک سازه را اندازه گیری می کنند، یک نوع رابطه مرتب شده8 را تشکیل می دهند. یک آزمون ممکن است دارای همسانی درونی مرتب شده ای باشد، حتی اگر مجموعه سوالهای آن همبستگی بالایی با هم نداشته باشند (همسانی درونی جمع پذیر9، مانند آنچه از طریق آلفای کرونباخ10 یا تحلیل عاملی11 آزمون می شود). همسانی درونی مرتب شده بیانگر وجود عامد دشواری است. بدین ترتیب، یک سوال دشوار می تواند پاسخ به سوالهای با دشواری کمتر را پیش بینی کند اما عکس آن امکان پذیر نیست (رایت، 1996).
وقتی پژوهشگران برای رواسازی یک مجموعه از متغیرهای نشانگر در یک مقیاس از تحلیل عاملی استفاده می کنند، فرض را بر این قرار می دهند که با یک مدل خطی و جمع پذیر رو به رو هستند. خطی بودن بخشی از همبستگی و مبنایی برای خوشه بندی12 متغیرهای نشانگر در یک عامل است. در جمع پذیری نیز فرض بر این است فقط زمانی معنای همه سوالها دارای همسانی درونی است، که همبستگی بالایی با یکدیگر داشته باشند. با وجود این، ممکن است که سوالها فاقد همبستگی درونی بالا، اما دارای رابطه مرتب شده نیرومندی باشند (رایت، 1985). به همین دلیل بسیاری از پژوهشگران ترجیح می دهند برای ساخت و توسعه مقیاسها به جای مدلهای جمع پذیر مانند آلفای کرونباخ و تحلیل عاملی، از مدلهای راش استفاده کنند. زیرا این مدلها نه تنها روابط جمع پذیر بین متغیرهای نشانگر، بلکه رابطه ترتیبی سوالها (مانند ترتیب دشواری) را نیز به حساب می آورند (تنورگرت، گیلپسی و کینگما، 1993). نظریه زیربنایی مدلهای راش در بسیاری جنبه ها شبیه به نظریه سوال پاسخ است. به بیان دیگر، مدل راش برای داده های دو ارزشی اغلب به عنوان مدل تک پارامتری نظریه سوال پاسخ در نظر گرفته می شود. اما هواداران این مدل، آن را دارای ویژگی خاصی می دانند که از مدلهای IRT متمایز است. به گونه اختصاصی، ویژگی معرف مدلهای راش صورتبندی انتزاعی1 و ریاضی مقایسه نامتغیر است که می تواند برای اندازه گیری موفقیت آمیز سازه ها یک ملاک معتبر فراهم کند (سادوس، گارمندی، کیوز و الیوت، 2004). این ویژگی انتزاعی، مدلهای راش را از سایر مدلهایی که برای پاسخ به سوالها یا مواد آزمون به کار می روند متمایز و آن را به عنوان مدلهای ایده آل یا استاندارد مطرح می سازد.
بنا بر نظر آندریش (2004) دیدگاه2 یا پارادایم3 مدلهای راش به گونه بارزی با سایر مدلهای اندازه گیری تفاوت دارد. در اغلب مدلها هدف اصلی توصیف مجموعه ای از داده هاست. به همین منظور پارامترها تعدیل می شوند و برپایه اینکه چگونه با داده ها برازش می یابند، رد یا پذیرفته می شوند. اما هدف از به کار بردن مدل راش به دست آوردن داده هایی است که با مدل برازش داشته باشد. منطق زیربنایی این دیدگاه آن است که مدلهای راش مستلزم شرایطی هستند که برای اندازه گیری باید برآورده شوند. درست همانگونه که عموما در اندازه گیری های علم فیزیک وجود دارد.
برای درک این منطق زیربنایی بیان مثالی در اندازه گیری وزن می تواند مفید باشد. فرض کنید وزن شئA در یک موقعیت به گونه قابل ملاحظه ای بیشتر از وزن شئ B اندازه گیری شده است. سپس بلافاصله در یک موقعیت دیگر، این وزن شئ B است که بیشتر از وزنA به دست می آید. در اینجا شرط اساسی اندازه گیری، یعنی یکسان و نامتغیربودن نتایج حاصل از مقایسه دو اندازه گیری، صرف نظر از سایر عوامل، برآورده نشده است. این شرط اساسی در ساختار انتزاعی مدل راش است. بنابراین، مدلهای راش برای تناسب و برازش یافتن با داده ها، تغییر و تعدیل نمی شوند. بلکه روش اندازه گیری باید تغییر یابد تا این شرط را برآورده سازد. درست همانگونه که در مثال بالا مقیاس وزن باید تغییر کند. زیرا بین دو شئ در دو اندازه گیری جداگانه نتایج متفاوتی به دست داده است. علاوه‎ بر این، در پارادایم مدلهای راش تاکید بر مطالعه و تعیین بی نظمی4 در داده هاست که از طریق این مدل آشکار می شود (رایت، 1996).
خانواده مدلهای راشلاینرس (2006) مدلهای راش را در دو طبقه کلی دو ارزشی و چند ارزشی به شرح زیر تقسیم بندی می کند:مدل دو ارزشی: این مدل که در آن پاسخها به دو طبقه (بلی خیر، درست نادرست) تقسیم می شوند، شناخته شده ترین و رایج ترین مدل راش و دارای تابع ساده منطقی است. برای داده های دو ارزشی جایگاه یک سوال در یک مقیاس، متناظر با جایگاه آزمودنی در نقطه ای است که احتمال موفقیت برابر با 5/0 است. به گونه کلی، احتمال پاسخ درست آزمودنی به یک سوال با درجه دشواری کمتر از جایگاه آزمودنی، بیشتر از 5/0 و احتمال پاسخ درست آزمودنی به یک سوال با درجه دشواری بالاتر از جایگاه آزمودنی، کمتر از 5/0است. وقتی پاسخ فرد بر پایه دشواری سوال از کمترین تا بیشترین فهرست شود، بیشترین شباهت را به الگوی گاتمن دارد. با این فرمول: Loge (Pni1 / Pni0) = Bn - Diکه در آن:Pni= احتمال آنکه آزمودنی n که با سوال i رو به رو می شود در طبقه j اندازه گیری شود.
Bn = توانایی فرد nDij = دشواری سوال i. نقطه ای که در آن بالاترین و پایین ترین طبقه های سوال احتمال برابر دارند.
Fij = اندازه مدرج کردن طبقه. j-1 نقطه ای که در آن طبقه های j-1 و j نسبت به اندازه سوال احتمال برابر دارند.
مدلهای چندارزشی: مدلهای چندارزشی راش نخستین بار توسط آندریش (1978، 2004) و به منظور کاربرد مدل راش برای داده های حاصل از مقیاس لیکرت ارائه شد. این مدلها در واقع تعمیم مدلهای دوارزشی و نوعی مدل اندازه گیری است که در زمینه هایی به کار می رود که هدف از آن اندازه گیری صفت یا توانایی از طریق فرایندی است که در آن پاسخ به سوالها با اعداد صحیح متوالی نمره گذاری شود این مدل را می توان در مقیاسهای لیکرت، درجه بندی و نیز سوالهای مربوط به اندازه گیری های ترتیبی که در آنها نمره های متوالی بالاتر بیانگر سطح فزاینده پیشرفت و توانمندی است به کار برد.
از سوی دیگر، مدلهای چند ارزشی یک اندازه گیری احتمالی کلی و دارای این ویژگی متمایز است که برای کاربرد نمره های عددی متوالی یک بنیان نظری محکم فراهم آورده است. افزون براین ویژگی، مدلهای چند ارزشی امکان آزمون جدی این فرضیه را فراهم می‎آورد که طبقه های پاسخ، معرف سطح افزایشی یک خصیصه یا صفت مکنون است. از این رو داده ها، مرتب شده به حساب می آیند. در این مدل، نمره یک سوال معین در واقع فراوانی تعداد جایگاه آستانه1 در صفت مکنونی است که آزمودنی از آن بالاتر قرار دارد. جایگاه آستانه بر روی پیوستار مکنون معمولا از ماتریس سوال پاسخ و از طریق فرایند برآورد بیشینه احتمال شرطی2 استنباط می شود.
به گونه کلی، شاخص اصلی فرایند اندازه گیری در این مدل آن است که آزمودنی ها در یک مجموعه طبقه های مرتب شده مجاور3 گروه بندی شوند. شکل بندی پاسخهایی که در یک زمینه آزمایشی معین به کار می روند، می تواند از طریق روش های مختلفی به این شاخص دست یابد. برای نمونه، ممکن است آزمودنی طبقه ای را انتخاب کند که به نظر وی به بهترین صورت سطح حمایت وی را از سوال یا عبارت نشان می دهد. افزون بر این، امکان دارد داوران آزمودنی ها را بر پایه ملاکهایی که به خوبی تعریف شده‎اند در طبقه های مختلف قرار دهند، و سرانجام ممکن است آزمودنی یک محرک فیزیکی را بر پایه شباهتی که به مجموعه محرکهای مرجع دارد، طبقه بندی کند. وقتی پاسخها فقط در دو طبقه قرار داشته باشند، مدل چند ارزشی راش به مدلی برای داده های دوارزشی تبدیل می شود. در این مدل خاص، دشواری سوال و آستانه (منفرد) یکسان خواهد بود. انواع مدلهای چندارزشی به قرار زیرند:1) مدل مقیاس درجه بندی4: این مدل زمانی به کار می رود که تعداد آستانه سوالها یکسان و تفاوت بین جایگاه هر آستانه معین با میانگین جایگاه آستانه ها برابر یا بین همه سوالها یکسان باشد. فرمول این مدل به قرار زیر است:Log (Pnij / Pni (j-1)) = Bn - Di – Fj2) مدل امتیاز جزئی5: از این مدل اختصاصا در زمینه های آموزشی و تربیتی استفاده می شود (مسترز، 1982). هر چند ساختار ریاضی این مدل با مدل مقیاس درجه بندی یکسان است، اما امکان محاسبه آستانه های مختلف را برای سوالهای مختلف فراهم می آورد. فرمول این مدل عبارت است از:Log (Pnij/ Pni (j-1)) = Bn - Di - Fij = Bn – Dij3) مدل ساختار پاسخ گروه بندی شده6: این مدل با فرمول زیر وقتی به کار می رود که سوالها بر اساس سهمی که در ساختار پاسخ دارند، یا به زیرمقیاسهای یک یا چند سوال که در یک ساختار پاسخ سهیم هستند گروه بندی شوند.
Log (Pnij/ Pni(j-1)) = Bn - Dig - Fgjبه گونه کلی، مدلهای اندازه گیری راش به پژوهشگران امکان می دهد تا مشکلات زیربنایی اندازه گیری های مدل کلاسیک و مقیاسهای خودسنجی، خودارزیابی و خود درجه بندی را حل کنند. این مدلها نمونه کاملی از اندازه گیری جمع پذیر زوجی است که دو شرط لازم برای تبدیل خصیصه به کمیت، یعنی جمع پذیر بودن و ترتیب را برآورده می سازد. مدل راش جمع پذیر است زیرا تفاوت بین سطح مشاهده شده و سطح مکنون، مستلزم اندازه گیری جمع پذیر دو متغیر مکنون متفاوت یعنی متغیرهای آزمودنی و سوال است. افزون‎ براین، مدل راش دارای ترتیب است زیرا بر پایه آن می توان متغیرهای آزمودنی و سوال را در سطح مکنون و از طریق بالاتر یا پایین تر بودن نسبت به هم با یکدیگر مقایسه کرد (اکتون، 2003). برخی از مزایای کاربرد مدلهای اندازه گیری عبارتند:1) از پاسخهایی که در قالب مقیاس طبقه ای مرتب یا ترتیبی ارائه شوند، می توان یک اندازه فاصله ای حقیقی تولید کرد (رایت و لایرنس، 1989؛ مربیتز، موریس و گریپ، 1989).
2) مشخص می شود هر سوال تا چه حد می تواند سازه مورد نظر را اندازه گیری کند. به بیان دیگر، این مدل نشان می دهد که آیا سوالهای مقیاس، یک سازه زیربنایی یا یک بعد واحد را تشکیل می دهند. این فرایند در واقع تک بعدی بودن مقیاس را آزمون می کند (رایت و استون، 1996).
3) می توان نشان داد که هر سوال چه جایگاهی در پیوستار اندازه گیری دارد. تعیین ترتیب سوالها در پیوستار اندازه گیری از اهمیت زیادی در ارزیابی روایی مقیاس برخوردار است. زیرا توزیع سوالها در طول پیوستار باید معنادار باشد تا نشان دهد سازه مورد نظر به خوبی اندازه گیری شده است. افزون‎ بر این، شواهد مربوط به همسانی نسبی این توزیع در طول زمان یا در بین نمونه های مختلف، نشان می دهد که سازه مورد اندازه گیری پایایی دارد (اسمیت، 2001).
4) می توان تعیین کرد که مقیاس تا چه اندازه توانسته است آزمودنی ها را اندازه گیری کند. مدل راش افزون‎ بر اینکه نشان می دهد آیا مقیاس برای اندازه گیری آزمودنی ها به گونه مناسب تهیه شده، مشخص می کند که آیا هر آزمودنی نیز به گونه معتبری اندازه گیری شده است (آیا نمره افراد مطابق با الگوی مورد انتظار است). به بیان دیگر، روش های راش نه تنها برای بررسی ویژگی های آزمون مفیدند بلکه می توانند راهنمای مناسبی برای توسعه مقیاس نیز باشند.
زبان:
فارسی
در صفحه:
80
لینک کوتاه:
magiran.com/p489149 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!