فهرست مطالب

اندازه گیری تربیتی - پیاپی 9 (پاییز 1391)

فصلنامه اندازه گیری تربیتی
پیاپی 9 (پاییز 1391)

  • تاریخ انتشار: 1391/10/04
  • تعداد عناوین: 7
|
  • مهدی عرب زاده، پروین کدیور صفحه 1
    زمینه
    تاخیر در رضامندی تحصیلی، پیش بینی کننده عملکرد تحصیلی، انگیزش، خودگردانی و خودکارآمدی دانش آموزان است؛ بنابراین با توجه به اهمیت به تعویق انداختن رضامندی تحصیلی در فرایند یاددهی- یادگیری، نیاز مبرم به وجود ابزار ویژه آن متناسب با فرهنگ ایرانی می باشد.
    هدف
    پژوهش حاضر با هدف بررسی ویژگی های روان سنجی فرم فارسی مقیاس تاخیر رضامندی تحصیلی، شامل پایایی، روایی وتحلیل عاملی مقیاس، به منظورآماده سازی جهت کاربرد در پژوهشهای تربیتی انجام شده است.
    روش
    حجم نمونه این پژوهش600 دانش آموز (274 دختر و 326 پسر) بود که با روش نمونه گیری خوشه ایچند مرحله ای از بین دبیرستان های دولتی سطح شهر کرج، انتخاب شدند و با مقیاس تاخیر رضامندی تحصیلی وپرسش نامه انگیزشی راهبردهای یادگیری مورد آزمون قرار گرفتند.
    یافته ها
    پایایی بازآزمایی مقیاس تاخیر رضامندی تحصیلی بر اساس نتایج دو بار اجرای آزمون و همسانی درونی آن برحسب ضرایب آلفای کرونباخ در موردگروه نمونه محاسبه و تایید شد. به منظور بررسی روایی همزمان، از اجرای همزمان مقیاس انگیزشی راهبردهای یادگیری استفاده شد که حاکی از روایی همزمان مطلوب می باشد. همچنین برای تعیین روایی عاملی از تحلیل عاملی تاییدی استفاده شد، که نتایج تحلیل عاملی تاییدی موید این است که ساختار مقیاس برازش قابل قبولی با داده ها به طور کلی و به طور مجزا برای پسران و دختران دارد و کلیه شاخص های نیکویی برازش، مدل ها را تایید می کنند.
    بحث و نتیجه-گیری: یافته های تحلیل عاملی، مشابه تحقیقات انجام گرفته در فرهنگ اصلی وضرایب پایایی و روایی نیز به نتایج تحقیقات پیشین نزدیک بود. بنابراین با توجه به خصوصیات روان سنجی مطلوب، این مقیاس ابزار مناسبی برای تعیین تاخیر رضامندی تحصیلی دانش آموزان می باشد.
    کلیدواژگان: تاخیر رضامندی تحصیلی، پایایی، روایی، تحلیل عاملی
  • ناصر یوسفی، ناصر شیربگی، صالح صالحی صفحه 19
    هدف
    ف ه پژوهش تحلیل عاملی تاییدی«نگرش به پژوهش» و رابطه آن با خود ناتوان سازی و خوداثربخشی سازی در میان دانشجویان کارشناسی ارشد ترم آخر داه کردستان بود.
    روش
    طرح پژوهش از نوع پژوهش همبستگی است (تحلیل عاملی به شیوه چرخش متمایل از نوع ابلیمین مستقیم و تحلیل عامل تائیدی برای اعتبار ابزار و همبستگی برای رابطه بین متغیرها بود). حجم نمونه برای تحلیل عاملی و تاییدی و برای بررسی رابطه «نگرش به پژوهش» و با خود ناتوان سازی و خوداثربخشی سازی 400 نفر بود که از بین یه دان کارشناسی ارشد که در سال 90-1389 مشغول به تحصیل در داه کردستان بودند، رت د ده اب و مقیاس های نگرش به پژوهش، پرسش نامه ملاک خوداثربخشی و مقیاس الگوهای یادگیری سازگار(برای ناتوان سازی) در پژوهش را دو داده ها به روش به شیوه ی متمایل از نوع آبلیمین مستقیم و تحلیل عامل تائیدی و ضریب همبستگی رگرسیون تجزیه و تحلیل شد.
    نتایج
    د آه از روش به شیوه چرخش متمایل از نوع ابلیمین مستقیم، پنج ل نگرش به پژوهش را ن داد و با تحلیل عامل تائیدی آن ها برازش شدند. ا درو از آیوخ و تصنیف ای 30 ده و پنج (به ترتیب با مقدار 89/0 و 87/0) ر د. ، ضرایب پرسش نامه نگرش به پژوهش با پرسش نامه خوداثربخشی و خود ناتوان سازی در پژوهش به ترتیب (51/0 و 43/0-) بدست آمده است که در سطح (001/0>p) معنادار است. وه، تی تست ن داد دان دو وت ود ارد.
    نتیجه گیری
    نتایج د آه از ت او روا و شنامه نگرش به پژوهش از آن ان در ی و و دانشگاهی اده دو با تاکید بر نگرش مثبت به تحقیق از خودناتوان سازی در انجام کارهای پژوهشی کاست و بر میزان خود اثربخشی تحقیق افزود.
    کلیدواژگان: اعتباریابی شنامه نگرش به پژوهش، خودناتوان سازی، خود، اثربخشی
  • راضیه اهرمی، سالار فرامرزی، مژگان شوشتری، احمد عابدی صفحه 43
    هدف
    هدف پژوهش حاضر بررسی رابطه ی نیمرخ دانش آموزان در هوش آزمای وکسلر کودکان فرم 4 (Wisc_IV) و هوش های چندگانه (MI) مبتنی بر نظریه گاردنر، در دانش آموزان پایه ی پنجم ابتدایی شهر اصفهان بود.
    روش
    روش پژوهش توصیفی و از نوع همبستگی بود. نمونه شامل 30 نفر از دانش آموزان بوده است، که به روش نمونه گیری چند مرحله ای از بین جامعه ی مورد نظر انتخاب شدند. ابزار اندازه گیری عبارت بود از: پرسش نامه هوش چندگانه ی گاردنر و آزمون هوش وکسلر فرم 4. برای تجزیه و تحلیل داده ها از روش آماری ضریب همبستگی استفاده شد.
    یافته ها
    نتایج پژوهش نشان داد که بین عملکرد دانش آموزان در خرده مقیاس های هوش کلامی- زبانی گاردنر و مفاهیم تصویری وکسلر و نیز بین هوش فضایی-دیداری گاردنر با خرده مقیاس های رمز نویسی و سرعت پردازش وکسلر و نیز بین هوش بین فردی گاردنر با خرده مقیاس های فراخنای ارقام و مفاهیم تصویری وکسلر و نیز بین هوش درون فردی گاردنر و فراخنای ارقام وکسلر رابطه معناداری وجود دارد (05/0P<)، ولی بین سایر خرده آزمون ها رابطه معناداری مشاهده نشده است
    نتیجه گیری
    می توان نتیجه گرفت که در استفاده از پرسش نامه های هوش چندگانه مبتنی بر نظریه گاردنر، به عنوان یک آزمون تشخیصی هوش در مفهوم سنتی آن می بایست احتیاط نمود
    کلیدواژگان: هوش، هوش چندگانه، گاردنر، وکسلر، عملکرد تحصیلی
  • کریم سواری صفحه 65
    زمینه
    کودکان از لحاظ فعالیت های حرکتی با یکدیگرتفاوت داشته و به نظر می رسد که بعضی از آنان بیش فعال باشند بطوری که هرگز از حرکات زائد و غیر هدفمند باز نمی ایستند لذا نیاز به ابزار مناسب و دقیق تشخیص دارند.
    هدف
    هدف این تحقیق ساخت و اعتباریابی پرسش نامه تشخیص اختلال بیش فعالی همراه با نقص توجه بود.
    روش
    مربیان کودکان آموزش و پرورش استثنایی و والدین دارای کودک بیش فعال شهر اهوازجامعه آماری تحقیق جاری را تشکیل داده اندکه از بین آنان100 نفر (54 والد و46 مربی) به شکل تصادفی چند مرحله ای انتخاب شدند. داده ها از طریق پرسش نامه محقق ساخته (تحلیل عاملی اکتشافی) بدست آمد.
    یافته ها
    تحلیل عوامل اکتشافی نشان دادکه پرسش نامه تشخیص اختلال بیش فعالی همراه با نقص توجه از35 ماده و پنج عامل با عنوان نقص حافظه و توجه (9 ماده)، مسئولیت پذیری و سازماندهی (9 ماده)،حرکات غیرهدفمند (8 ماده)، همکاری با دیگران (5 ماده) وتکانشوری(4 ماده) تشکیل شده است. پرسش نامه فوق الذکر از پایایی نسبتا خوبی (آلفای کرونباخ برای کل پرسش نامه 70/.، عامل اول 85/.، عامل دوم72/.، عامل سوم 81/.، عامل چهارم 68/. و عامل پنجم 65/.) برخوردار است. برای تعیین روایی آزمون از چک لیست رفتار بزرگسال بارکلی و مورفی (1998) استفاده شد و مقدار ضریب همبستگی آن 295/. برآورد گردید که در سطح 003/. p< معنی دار است که این نشان از روایی نسبتا خوب پرسش نامه تحلیل عاملی شده است.
    بحث و نتیجه گیری
    این پرسش نامه توانایی تشخیص اختلال بیش فعالی همراه با نقص توجه را داشته و از پایایی و روایی مناسبی برخوردار است
    کلیدواژگان: ساخت و اعتبار یابی، اختلال بیش فعالی همراه نقص توجه
  • مجتبی حبیبی، بلال ایزانلو، ابراهیم خدایی صفحه 81
    زمینه
    از نظر کرلینجر (1986) تحلیل عاملی یک روش آماری در جهت اصل ایجاز علمی است. این تکنیک می تواند به کاهش چندگانگی، تلخیص روابط بین متغیرها، ایجاز و سادگی هرچه بیشتر بینجامد، وابستگی بین متغیرها را تعیین کرده و تفسیر علمی را تسریع نماید.
    هدف
    هدف مقاله حاضر، کاربرد تحلیل عاملی برای وزن دهی به گویه های موجود در مقیاس های روان شناختی و تربیتی است. یعنی کشف مناسب ترین سوال ها با بیشترین وزن و اهمیت برای قضاوت در مورد افراد گروه نمونه با استفاده از تحلیل عاملی است.
    روش
    در پژوهش توصیفی حاضر، از داده های مربوط به خرده آزمون علایم روان شناختی و فیزیولوژیکی مقیاس میزان، منابع و علائم استرس معلمان که بر روی 430 نفر از دبیران (105 نفر در رشته تربیت بدنی و 298 نفر در رشته های غیر تربیت بدنی) آموزش و پرورش استان آذربایجان غربی اجرا شده بود، استفاده گردید. در پژوهش حاضر با استفاده از تحلیل عاملی وزن 15 گویه مربوط به این خرده مقیاس تعیین شد. در مرحله بعد، وزن هر گویه بر اساس وزن همان گویه در عامل مورد نظر به جای استفاده از وزن ثابت معادل یک برای ایجاد نمره نهایی آزمودنی ها، مورد استفاده قرار گرفته است.
    یافته ها
    نتایج پژوهش نشان داد که بین دو روش با استفاده از آزمون فریدمن در رتبه بندی گویه ها تفاوت معنی داری به لحاظ آماری وجود دارد.
    بحث و نتیجه گیری
    با توجه به نتایج می توان گفت که کارایی روش تحلیل عاملی نسبت به روش وزندهی با مقادیر ثابت برای همه گویه ها و وزن دهی در رتبه بندی شاخص ها در سطح بهینه ای قرار دارد.
    کلیدواژگان: تحلیل عامل، وزن دهی به گویه ها، علائم روان شناختی و فیزیولوژیکی استرس
  • مسعود گرامی پور، محمدرضا فلسفی نژاد، علی دلاور، نورعلی فرخی صفحه 105
    زمینه
    اگر چه روش های متعددی جهت شناسایی سوالات سودار معرفی شده است، اما تحقیقات اندکی به صورت تجربی قدرت و کارایی هر یک این روش ها را مورد بررسی قرار داده است.
    هدف
    هدف از تحقیق حاضر مقایسه آزمون نسبت درستنمایی مبتنی بر مدل پرسش-پاسخ (IRT) و روش تحلیل عاملی تاییدی(CFA) در شناسایی کنش افتراقی سوالات آزمون های سرنوشت ساز بود.
    روش
    برای پاسخگویی به سوالات تحقیق از روش مطالعات شبیه سازی مونت کارلو استفاده شد. داده های مورد نیاز با استفاده از نرم افزار وین جن2 در قالب 100 آزمون 30 سوالی که با مدل دو پارامتری برازش داشتند، شبیه سازی شد. توزیع دشواری و قدرت تمیز سوالات همه آزمون ها، نرمال بود. اما آزمون ها از حیث نوع DIF، میزان DIF و همچنین پارامترهای سوال با هم متفاوت بودند.همچنین برای هر آزمون، پاسخهای 1000 آزمودنی با توزیع توانایی(θ) نرمال شبیه سازی شد. از روش های برآورد بیشینه درستنمایی حاشیه ای و روش برآورد حداقل مربعات وزنی برای تعیین نوع و میزان DIF استفاده شد.
    یافته ها
    تجزیه و تحلیل داده ها در تکرارهای متوالی نشان داد که روش های مبتنی بر IRT در شناسایی DIF نسبت به روش های CFA برتری دارند. این برتری در تمامی شرایط DIF (کم، متوسط و زیاد) مشاهده شد. با این همه، تفاوت دو روش در حجمهای نمونه 1000 نفری، جزئی و قابل اغماض است. همچنین میان دو روش از نظر شناسایی نوع DIF تفاوتی دیده نشد.
    بحث و نتیجه گیری
    نتایج پژوهش حاضر با نتایج مید و لوتنچلاجر(2006 و 2004) همخوانی دارد، اما برخلاف نتایج فلاورز و همکاران(2002) است. سرانجام در صورت محدودیت در استفاده از یک روش تشخیص DIF، آزمون نسبت درستنمایی مبتنی بر مدل پرسش- پاسخ توصیه شود.
    کلیدواژگان: کنش افتراقی سوال، آزمون نسبت درستنمایی، تحلیل عاملی تاییدی، آزمون های سرنوشت ساز
  • ملیحه سادات کاظمی، شعله امیری، مختار ملک پور، حسین مولوی صفحه 123
    زمینه
    مقیاس خزانه لغات تصویری بریتانیا (بی پی وی اس-2) یکی از پرکاربردترین و رایج ترین مقیاس های اندازه گیری توانایی های زبانی کودکان در دنیا می باشد. این مقیاس برای کاربردهای آموزشی، بالینی و پژوهشی مفید است.
    هدف
    در این پژوهش نسخه فارسی و بومی شده این مقیاس تهیه شده و ویژگی های روان سنجی آن مورد بررسی قرار گرفته است.
    روش
    این پژوهش بر روی 180 نفر از کودکان 5، 7، 9 و 11 ساله شهر اصفهان در سال 1389، که به طور تصادفی انتخاب شدند، اجرا گردید. به منظور بررسی روایی همزمان نسخه فارسی مقیاس خزانه لغات تصویری بریتانیا، از آزمون هوش وکسلر استفاده شده است.
    نتایج
    نتایج حاکی از پایایی، روایی همزمان و روایی تشخیصی مناسب نسخه فارسی مقیاس خزانه لغات تصویری بریتانیا_ویرایش دوم، می باشد. نتایج هنجاریابی نشان داده است که نمره 100، رتبه 50% توزیع را تشکیل داده است. بررسی روایی همزمان این مقیاس با مقیاس هوش وکسلر حاکی از وجود همبستگی برابر با 48/0 بین نمره هوش کلامی و نمره خزانه لغات بود. همچنین بررسی روایی تشخیصی نشان داد که بین نمره خزانه لغات کودکان 5، 7، 9 و 11 سال تفاوت معنادار وجود داشت. به منظور بررسی پایایی از آلفای کرونباخ استفاده شد. ضریب آلفای کرونباخ برای 168 ماده از نسخه فارسی مقیاس خزانه لغات تصویری بریتانیا، 84/0 محاسبه گردید.
    بحث و نتیجه گیری
    بر اساس این یافته ها می توان نتیجه گیری نمود که مقیاس خزانه لغات ویژگی های روان سنجی مناسبی برای اجرا بر روی افراد و کودکان فارسی زبان دارد. همچنین وجود پراکندگی بیشتر در توزیع نمرات کودکان در نمونه این پژوهش با نمونه های هنجاریابی شده در خارج از کشور، احتمالا نشان دهنده وجود تفاوت های طبقاتی بیشتر در جامعه این پژوهش می باشد.
    کلیدواژگان: مقیاس خزانه لغات تصویری بریتانیا، هنجاریابی، پایایی، روایی
|
  • Mahdi Arabzadeh, Parvin Kadivar Page 1
    Academic delay of gratification predicts academic performance, motivation, self-regulation and self-efficacy in students. Due to the importance of academic delay of gratification in teaching-learning processes, there is a need for special tools proportional to the Iranian culture. The objective of this study was to examine the psychometric properties of Persian form academic delay of gratification scale, including reliability, validity, and factor analysis. The population consisted of Iranian high school students from Karaj (N = 600, 326 boys and 274 girls) who were selected based on multistage cluster sampling. They were tested by academic delay of gratification scale and motivated strategies for learning questionnaire. Test-retest reliability academic delay of gratification scale based on the results of two performance tests and its internal consistency by Cronbach's alpha coefficients were calculated and confirmed. To analyze the concurrent validity and to determine the validity factor motivation strategy-learning questionnaire was used, which indicated that concurrent validity is adequate. In addition, results indicated that the separate confirmatory factor analysis (CFA) for the male and female samples showed a goodness of fit with the data. The findings of factor analysis as well as the reliability and validity coefficients were similar to the previous studies conducted in the original culture. Regarding its good psychometric properties, the scale is an appropriate instrument to measure student's academic delay of gratification.
    Keywords: Academic Delay of Gratification, Reliability, Validity, Factor Analysis
  • Nasser Yousefi, Nasser Shirbagi, Saleh Salehi Page 19
    The present paper mainly aims to do confirmatory factor analysis of the attitude towards research and its relationship with self–handicapping and self-efficacy among the last semester master students of Kurdistan University.The study adopted a correlative design (factor analysis via oblique rotation with direct OBLIMIN and confirmatory factor analysis were used for testing the validity of instruments and correlation was used for testing the relationship between variables). To do confirmatory factor analysis and to examine the relationship between attitude towards research and self–handicapping and self-efficacy, 400 subjects were randomly selected from among master students of the educational year 2010-2011. The participants completed the Attitude toward Research (ATR), criterion of self-efficacy and self–handicapping and pattern of adaptive learning scales questionnaires. Then the data was analyzed using factor analysis via oblique rotation with direct OBLIMIN, confirmatory factor analysis and regression correlation coefficient. The results of factor analysis via oblique rotation with direct OBLIMIN were indicative of five factors being influential in attitude towards research and then these factors were analyzed using confirmatory factor analysis. Internal consistency reliability coefficients including Cronbach’s alpha and split-half coefficients were of a satisfactory value (respectively 89% and 87%) for 30 items and 5 factors. Correlation coefficients for ATR questionnaires and self–handicapping and self-efficacy questionnaires were respectively 0.51 and -0.43 which are significant at (P<0001) level. Moreover, the T-test showed that there was no significant difference between male and female students.The results of factor analysis are consistent with prior findings. Considering high validity and reliability value of ATR questionnaires, they can be used in research and academic settings. We can also reduce self–handicapping rate in doing research tasks and increase self-efficacy rate of researches through emphasis on positive attitude towards research.
    Keywords: Validation of Attitude toward Research Questionnaire, Self–handicapping, Self, Efficacy
  • Raziyeh Ahromi, Salar Faramarzi, Mozhgan Shoushtari, Ahmad Abedi Page 43
    The present study aims to examine the relationship between students’ psychological profile in Wechsler intelligence test for children –fourth edition– (WISC_IV) and multiple intelligence (MI) based on Gardner’s theory among students of fifth grade elementary school in Isfahan city. The study was descriptive and correlative. Sample population consisted of 30 students who were selected using multistage sampling. The measuring instruments used were Gardner’s multiple intelligence questionnaires and Wechsler intelligence scale for children -fourth edition- (Wisc_IV). The data was analyzed using correlation coefficient. The results of this study showed that there are significant relationships between Gardner’s verbal-linguistic intelligence subscales and Wechsler’s visual concepts, between Gardner’s visual-spatial intelligence and Wechsler’s encoding and speed, between Gardner’s interpersonal intelligence and Wechsler’s digit span and visual concepts subscales, and finally between Gardner’s intrapersonal intelligence and Wechsler’s digit span (p<0/05). However, there was no significant relationship between other subscales. It can be concluded that Gardner’s multiple intelligence questionnaires should be used circumspectly as a diagnostic test for measuring intelligence in traditional sense.
    Keywords: Intelligence, Multiple Intelligence, Gardner, Wechsler, Educational Performance
  • Karim Sevari Page 65
    Children are different regarding the type of activities. Some of them are hyperactive characterized with unwanted, non-purposeful movements. Diagnosis of this disorder needs appropriate and precise methods.The purpose of this study is to analyze the structure and validity of questionnaires used for the diagnosis of attention deficit hyperactivity disorder.Research population consisted of teachers of exceptional children and parents of hyperactive children. One hundred people (54 parents and 46 teachers) were selected using multistage and random sampling. Data were collected through questionnaires (exploratory factor analysis).Exploratory factor analysis indicated that the questionnaires used for the diagnosis of attention deficit/hyperactivity disorder consist of 35 items and 5 factors, including memory and attention deficit (9 items), responsibility and organization (9 items), non-purposeful movements (8 items), cooperating with others (5 items), and impulsivity (4 items). The questionnaire has an adequate reliability (Cronbach's alpha for the entire questionnaire = 0.70, first factor = 0.85, second factor = 0.72, third factor = 0.81, fourth factor = 0.68, and fifth factor = 0.65). To determine the validity of the text, Adult Behavior Checklist (Barkley and Murphy, 1998) was used. Correlation coefficient was estimated as 0.295, which is significant at p<0.003. This is indicative of the adequate validity of the questionnaire.This study suggests that the questionnaire used for the diagnosis of attention deficit/hyperactivity disorder is effective and has adequate reliability and validity.
    Keywords: Construction, Validation, Attention Deficit, Hyperactivity Disorder
  • Mojtaba Habibi, Bilal Izanloo, Ebrahim Khodaie Page 81
    According to Kerlinger (1986), factor analysis is a statistical method serving “scientific parsimony principle”. This technique can be used to reduce multiplicity between variables, purify the relationships among variables, and maximize simplification. In fact, this technique determines the dependency among measures and variables and facilitates scientific interpretation. The purpose of the present study is to introduce the application of factor analysis for assigning weight to the variables, exploring the simplest and the most feasible indices with highest weight and significance of evaluation of the sample group, and determining the factor loading for each of the scale items on every one of the explored factors. In the present descriptive study, the data related to the psychological and physiological symptoms of stress among 430 high school teachers of West Azerbaijan Province (105 teachers of physical education and 298 teachers of other fields) were utilized. In the analysis of the data using method of factor analysis, weight was assigned to items and in the next stage, the weight of each item based on the weight of that indicator in the related factor would be used instead of constant weight equal one, in order to come up with final scores of subjects. Results show that there is a significant difference between the two methods in determining the weight of the items by Friedman. Referring to the results, it could be concluded that efficacy of factor analysis in comparing with other ranking methods of indicators was in optimum level.
    Keywords: Factor Analysis, Weight Assigning to Items, Psychological, Physiological Symptoms of Stress
  • Masoud Geramipour, Mohammad Reza Falsafinezhad, Ali Delavar, Noorali Faroukhi Page 105
    Although numerous methods have been proposed for detecting biased items, but a few researches have empirically investigated the power and efficiency of these methods. The main goal of this research was to apply IRT-based likelihood ratio test and confirmatory factor analysis in detecting differential item functioning (DIF) in high stakes tests. Monte Carlo simulated methods were used to answer the research questions. Required data were simulated through WINGEN2 in the form of 100 tests with 30 items that were fitted to 2PL model. Distributions of item difficulties and discrimination powers of all the tests were normal. Responses of 1000 examinees were also simulated with normal ability distribution for each test. Estimation methods of marginal maximum likelihood and weighted least squares were used to detect type and magnitudes of DIF. Data analysis in consecutive replications showed that IRT based methods were superior to CFA methods in detecting DIF. This superiority was observed in all DIF conditions (low, moderate and high). After all, differences between two methods were small at 1000 sample sizes. No differences were observed between two methods in detecting different types of DIF. Results of this study confirm the results of Meade and Lautenschlager (2004; 2006), but is in contrast with the results of Flowers et al (2002). Finally, Likelihood Ratio test is recommended if there is any limitation in applying methods of detecting DIF.
    Keywords: Differential Item Functioning, Likelihood Ratio Test, Confirmatory Factor Analysis, High Stakes Tests
  • Maliheh Sadat Kazemi, Sholeh Amiri, Mokhtar Malekpour, Hossein Molavi Page 123
    The British Picture Vocabulary Scale (BPVS_II) is one of the most applicable and common scales for measuring children’s language abilities. This scale is useful for educational, clinical and research uses.In this research the Persian and localized version of this scale is developed and corresponding standardized, reliability and validity tests are done. 180 subjects were selected randomly from among 5, 7, 9 and 11 years old children. Wechsler intelligence scale was used for measuring concurrent validity of the Persian version of British Picture Vocabulary Scale. The results are indicative of proper reliability, concurrent validity and diagnostic validity of the Persian version of British Picture Vocabulary Scale. Standardization results showed that the score distribution of 100 is at percentile rank of 50%. Examination of concurrent validity using Wechsler’s intelligence scale indicated the correlation 0.48 between verbal intelligence and vocabulary score. Also, examination of diagnostic validity indicated a significant difference between vocabulary scores of 5, 7, 9 and 11 years old children. Cronbach alpha was used for testing reliability. Cronbach alpha coefficient for 168 items of the Persian Version of British Picture Vocabulary Scale was calculated as 0.84. Based on these findings we can conclude that this vocabulary scale has proper psychometric characteristics for being applied by Persian-speaking children and individuals. Moreover, the larger variance seen in distribution of scores in this research in comparison to standardized samples studied in other countries probably indicates more class differences in the society considered in this research.
    Keywords: British Picture Vocabulary Scale, Standardization, Reliability, Validity