سرپرستی مدارس جمهوری اسلامی ایران در شبه قاره هند
ارزشيابي آموزشي به تصميمگيري براي منظورهاي مختلف كمك ميكند. اين تصميمگيريها در رابطه با هدفها ، راهبردها، روشها، ابزارهاي اندازهگيري و موارد ديگري نظير اينها است. گي (1991) اينگونه تصميمگيريهاي مختلف را در سه دستهي زير قرار داده است:
1- مرحلهي طراحي (چه كاري انجام خواهيم داد؟)
2- مرحلهي فرايندي (چگونه آن را انجام ميدهيم؟)
3- مرحلهي فرآوردهاي (چگونه آن را انجام دادهايم؟)
جدول زير، تصميمها و فعاليتهاي سه مرحلهي اصلي ارزشيابي را بهطور خلاصه ارايه ميدهد.
|
مرحلهي ارزشيابي |
زمان اجرا |
نوع تصميمها |
فعاليتهاي ويژه |
|
مرحلهي طرحريزي |
پيشاز اجراي آموزش برنامه، پروژه و غيره |
1- نتايجي كه قرار است به دست آيد 2- اعمالي كه بايد انجام شود |
1- تحليل موقعيت 2- تعيين و توصيف هدفها 3- توصيف پيشنيازها 4- انتخاب يا تهيهي وسايل اندازهگيري 5- توصيف استراتژيها 6- انتخاب طرح پژوهشي 7- تدارك برنامهي زمانبندي |
|
مرحلهي فرايندي |
ضمن اجراي آموزش برنامه، پروژه و غيره |
1- به چه ميزاني مراحل طرحريزي شده به اجرا درميآيد؟ 2- چه تغييراتي بايد داده شود تا پيشرفت لازم بهدست آيد؟ |
1- اجراي پيشآزمون 2- اجراي آزمون آمادگي 3- سنجش مناسب بودن هدفها 4- جمعآوري دادهها بهطور دورهاي، مثل اجراي آزمون 5- تحليل اثربخشي استراتژيها |
|
مرحلهي فرآوردهاي |
پساز اجراي آموزش برنامه، پروژه و غيره |
1- اثربخشي كلي آموزش، پروژه، برنامه و غيره 2- اقدامات آتي |
1- جمعآوري دادههاي مربوط به هدفها، مثلاً اجراي پسآزمون 2- جمعآوري دادههاي مربوط به بازدههاي پيشبيني نشده 3- تحليل و تفسير دادهها 4- تهيهي گزارش |
پيشتر، اصطلاح ارزشيابي را به اين صورت تعريف كرديم: ارزشيابي به يك فرايند نظامدار براي جمعآوري، تحليل و تفسير اطلاعات گفته ميشود، به اين منظور كه تعيين شود آيا هدفهاي مورد نظر تحقق يافتهاند يا در حال تحقق يافتن هستند و به چه ميزاني. ارزشيابي پيشرفت تحصيلي را ميتوان به صورت زير نیز، تعريف كرد:
سنجش عملكرد يادگيرندگان و مقايسهي نتايج حاصل با هدفهاي آموزشي از پيش تعيين شده، بهمنظور تصميمگيري در اين باره كه آيا فعاليتهاي آموزشي معلم و كوششهاي يادگيري دانشآموزان به نتايج مطلوب انجاميدهاند و به چه ميزاني.
بنابراين، در ارزشيابي پيشرفت تحصيلي دو اقدام اساسي ضروري است:
1- تعيين هدفهاي آموزشي؛
2- سنجش يا اندازهگيري عملكرد يادگيرندگان.
طبقهبندي هدفهاي آموزشي به وسيلهي گروهي از متخصصان آموزش و ارزشيابي پيشرفت تحصيلي تهيه شده و به نام بنجامين اس. بلوم[1] كه سرپرستي اين گروه را به عهده داشته، معروف گشته است. در اين طبقهبندي، هدفهاي آموزشي ابتدا به سه طبقهي كلي با نامهاي حوزهي شناختي[2]، حوزهي عاطفي[3] و حوزهي رواني- حركتي[4] تقسيم شدهاند.
هدفهاي حوزهي شناختي به جريانهايي كه با فعاليتهاي ذهني و فكري آدمي سر و كار دارند، مربوط ميشود. از این لحاظ، اين حوزه مهمترين حوزهي يادگيري به شمار ميآيد. اين حوزه به شش طبقه تقسيم ميشود كه به طور سلسله مراتبي، از عيني و ساده به انتزاعي و پيچيده مرتب شده است:
دانش[5]: شامل يادآوري (بازخواني و بازشناسي[6]) امور است. درواقع دانش عبارت است از تكرار پاسخهايي كه قبلاً در موقعيت يادگيري تمرين و آموخته شدهاند.
فهميدن[7]: توانايي درك منظور يا مقصود يك مطلب. فهميدن، به پاسخهايي بيشتر از آنچه قبلاً تمرين و آموخته شدهاند، نياز دارد.
كاربستن[8]: توانايي استفاده از امور انتزاعي، قواعد و قوانين، اصول، انديشهها و روشها در موقعيتهاي عيني و عملي.
تحليل[9]: توانايي شكستن يك مطلب يا موضوع به اجزا يا عناصر تشكيلدهندهي آن.
تركيب[10]: توانايي پهلوي هم قرار دادن عناصر و اجزا براي ايجاد يك الگو يا ساختار نو. تركيب نامي است كه بلوم و همكاران او براي آفرينندگي و خلاقيت[11] بهكار بردهاند.
ارزشيابي[12]: توانايي قضاوت يا داوري كمّي و كيفي دربارهي امور، با توجه به ملاكهاي معين.
به تازگي چند نفر از صاحبنظران آموزشي (اندرسون، كراتول و همكاران، 2001) طبقهبندي تازهاي از حوزهي شناختي ارايه كردهاند. در اين طبقهبندي، حوزهي شناختي به دو بُعد دانش و فرايندشناختي تقسيم ميشود. بُعد دانش شامل دانش امور واقعي، دانش مفهومي، دانش روندي و دانش فراشناختي است. بُعد فرايندشناختي دربرگيرندهي به ياد آوردن، فهميدن، بهكار بستن، تحليل، ارزيابي كردن و آفريدن است.
حوزهي عاطفي شامل هدفهايي است كه تغييرات حاصل در علاقهها، نگرشها و ارزشها و نيز رشد ارجشناسي و سازگاري را نشان ميدهد. اين حوزه به طبقات ذيل تقسيم ميشود:
دريافت كردن (توجه كردن)[13]: حساسيت نسبت به وجود بعضي پديدهها و محركهاي محيطي و ميل به دريافت كردن آنها با توجه كردن به آنها.
پاسخ دادن[14]: توجه فعالانه به پديدهها و انجام كارهايي دربارهي آنها، يا فعاليت حاكي از پذيرش يك عقيده يا خط مشي.
ارزش گذاردن[15]: احساس يا باور پايدار حاكي از ارزشمند بودن يك چيز، يك انديشه، يك شخص، يا يك گروه، يا ابراز عقيده يا نگرش دربارهي ارزش يك چيز.
سازمان دادن به ارزشها[16]: دستهبندي و نظامدار كردن ارزشها به گونهاي كه بعضي از آنها مهمتر از بعضي ديگر جلوه كنند.
شخصيت پذيرفتن[17]: تبديل نظام ارزشي به صورت يك سبك زندگي يا يك ديدگاه فلسفي. اين كار از درهم آميزي صِرف ارزشها و تعيين روابط بين آنها فراتر ميرود و نوعي فلسفهي پايدار زندگي را شامل ميشود.
حوزهي رواني- حركتي به زمينهي مهارتهاي حركتي يا حركات بدني مربوط است. به سخن ديگر، هر فعاليتي كه علاوه بر جنبهي رواني، داراي جنبهي جسماني نيز باشد، در اين حوزه جاي دارد. اين حوزه به طبقات ذيل تقسيم ميشود:
ادراك (حسي)[18]: استفاده از حواس براي هدايت كنشهاي حركتي.
آمادگي يا امايه[19]: آماده بودن براي انجام يك عمل يا يك رشته اعمال معين.
پاسخ هدايت شده[20]: عمل كردن به كمك هدايت يك الگو، يا اعمالي كه در مراحل اوليهي يادگيري انجام ميشود.
مكانيسم[21] يا عادات: انجام اعمالي كه نسبتاً مشخص و عادتي و خودكار هستند.
پاسخ پيچيدهي آشكار[22]: انجام رشته اعمالي كه تا حدودي بهصورت خودكار يا عادتي درآمدهاند يا تركيب تعدادي از عادتها.
انطباق[23]: استفاده از مهارتهاي قبلاً آموخته شده براي انجام تكاليف تازه اما مربوط به تكاليف گذشته.
ابتكار[24]: خلق الگوهاي تازهي حركتي براي حل مسايل غيرمعمول يا برخورد با موقعيتهاي جديد.
جدول مشخصات
از آنجا كه يكي از وسايل مهم اندازهگيريِ پيشرفت تحصيلي، آزمونهاي پيشرفت تحصيلي بهحساب ميآيد، لازم است روش تهيهي آزمون پيشرفت تحصيلي را بياموزيم. مهمترين گام در تهيهي آزمونهاي پيشرفت تحصيلي، تهيهي جدول مشخصات[25] براي موضوعي است كه قرار است آزمون آن تهيه شود.
جدول مشخصات يك جدول دوبعدي است با تعدادي رديف و ستون، متناسب با محتوا و هدفهاي آموزشي درس. در رديف بالاي جدول كه بُعدِ محتوا نام دارد، اجزاي مطالب درسي نوشته ميشوند و در ستون كنار آن كه بُعدِ هدف ناميده ميشود، فهرست هدفهاي آموزشي قرار ميگيرد. جدول صفحهي بعد، يك جدول مشخصات كلي را نشان ميدهد كه در آن تمامي محتواي يك درس و همهي هدفهاي يادگيري سه حوزهي شناختي، عاطفي و رواني – حركتي پيشبيني شده است.
|
|
يك آزمون خوب پيشرفت تحصيلي آزموني است كه به بهترين شكل منعكس كنندهي تمامي هدفهاي آموزشي و همهي محتواي برنامهي درسي باشد. از لحاظ نظري، بهترين آزمون براي يك درس يا يك موضوع آزموني است كه تمام مطالب و كليهي هدفهاي آموزشي آن درس را شامل شود. اما اگر درس يا موضوع، مفصل باشد، تهيهي چنين آزموني غيرعملي است. بنابراين، بهجاي گنجانيدن همهي سؤالهاي ممكن تمامي محتوا و هدفها در آزمون، تهيه كنندهي آزمون به انتخاب تعدادي سؤال نمونه كه معرف هدفها و محتواي درس باشد، اقدام ميكند. درصورتي چنين آزموني يك آزمون خوب يا به اصطلاح يك آزمون داراي روايي[26] خواهد بود كه سؤالهاي آن حاوي نمونهي درستي از هدفها و محتواي درس باشد.
بنا به آنچه در استانداردهاي آزمودن رواني و تربيتي (انجمن پژوهش آموزشي آمريكا، انجمن روانشناسي آمريكا و شوراي ملي اندازهگيري در آموزش و پرورش، 1999) آمده است:
وقتي كه از يك آزمون بهعنوان شاخص پيشرفت در يك حيطهي آموزشي استفاده ميشود، لازم است شواهد مربوط به اينكه آن آزمون، نمونهاي از مجموع دانشهاي مورد نظر فراهم ميآورد و فرايندهاي موجود در بعد هدفها را فرا ميخواند، ارايه شود. چنين تحليلي بايد آن جنبههايي را كه آزمون معرف آنها است و آنهايي را كه نميتواند معرف باشد، آشكار سازد... جدول مشخصات آزمون به ايجاد تعادل بين آموزش و سنجش كمك ميكند. (به نقلِ پين، 2003، ص 106)
بعداز تكميل بُعد محتوا و بُعد هدف جدول مشخصات، آزمونساز بايد تعيين كند كه سؤالهاي آزمون خود را به چه صورتي در ميان هدفها و عنوانهاي درس توزيع نمايد؛ يعني تعداد سؤالهايي را كه به هر يك از موضوعهاي درسي و هدفهاي آموزشي اختصاص خواهند داشت، تعيين نمايد و اين تعداد را يا به صورت تعداد واقعي سؤالها يا به صورت درصد، در خانههاي جدول مشخصات وارد كند. براي تعيين درصد سؤالهايي كه به بخشهاي مختلف محتوا و هدفها تعلق ميگيرند، جواب سؤالهاي زير را بايد تعيين كرد:
1- كدام بخش از محتوا و كدام دسته از هدفها داراي حجم بيشتري است و وقت بيشتري صرف آموزش آنها شده است؟
2- كدام هدفها از لحاظ نگهداري در حافظه و كاربرد در آينده، ارزش بيشتري دارند؟
3- كدام قسمت يا قسمتهاي درس يا موضوع درسي از اهميت بيشتري برخوردارند؟
نحوهي توزيع سؤالهاي آزمون در ميان بخشها و هدفهاي مختلف بايد متناسب با جواب اين سؤالها باشد. براي روشن شدن مطلب، جدول مشخصات كتاب علوم پنجم دبستان (اقتباس از مؤسسهي تحقيقات و برنامهريزي علمي و آموزشي وزارت آموزش و پرورش، 1353) را ميآوريم:
|
عنوان بخش |
ساعتهاي تدريس هر بخش |
نسبت ساعتهاي تدريس |
تعداد سؤالها |
|
1- طبقهبندي موجودات |
13 |
19/0 |
12 |
|
2- مواد از چه تشكيل شدهاند |
8 |
12/0 |
8 |
|
3- هوا در اطراف ما |
6 |
08/0 |
5 |
|
4- پيشبيني وضع هوا |
8 |
12/0 |
8 |
|
5- آتش چيست؟ |
5 |
07/0 |
5 |
|
6- بدن شما چهگونه كار ميكند؟ |
10 |
15/0 |
9 |
|
7- ستارگان |
7 |
10/0 |
6 |
|
8- پرواز در هوا |
7 |
10/0 |
6 |
|
9- اكتشافات فضايي |
5 |
07/0 |
5 |
|
جمع |
69 |
1 |
64 |
از آنجا كه يك آزمون تكويني دربرگيرندهي محتوا و هدفهاي يك جلسه درس است، جدول مشخصات آن به تفصيلِ جدول مشخصات آزمون تراكمي نيست. معمولاً در بُعد محتواي جدول مشخصات آزمونهاي تكويني تنها يك موضوع واحد و در بُعد هدف آنها فقط چند هدف نوشته ميشود.
نمونهاي از جدول مشخصات يك آزمون تكويني 10 سؤالي، با 5 هدف آموزشي
|
بعد هدف |
بُعد محتوا |
آزمون جور كردني | ||
|
سطوح يادگيري
دانش دانش دانش فهميدن
كاربستن |
هدفهاي يادگيري از دانشآموز انتظار ميرود پساز مطالعه و يادگيري مطالب اين درس، بتواند: 1- آزمون جوركردني را تعريف كند. 2- انواع آزمونهاي جوركردني را توضيح دهد. 3- محاسن و معايب آزمونهاي جوركردني را شرح دهد. 4- با مقايسهي آزمونهاي جوركردني و آزمونهاي چندگزينهاي، تفاوتها و شباهتهاي آنها را از لحاظ كاربردي توضيح دهد. 5- براي سنجش ميزان آموختههاي دانشآموزان يك درس يك آزمون جور كردني تهيه كند. |
تعداد سؤالها 1 2 2 2
3 | ||
|
|
جمع: |
15 | ||
[1] Benjamin S. Bloom
[2] cognitive domain
[3] affective domain
[4] psychomotor domain
[5] knowledge
[6] recall and recognition
[7] comprehension
[8] application
[9] analysis
[10] synthesis
[11] creativity
[12] evaluation
[13] receiving or attending
[14] responding
[15] valuing
[16] organization of values
[17] characterization
[18] perception
[19] set
[20] guided response
[21] mechanism
[22] complex overt response
[23] adaptation
[24] origination
[25] table of specifications
[26] validity
|
مقدمه در موقعیتهای مطلوبِ یادگیری، فرايندهاي ارزشیابی و آموزش بهنحو جدايیناپذیری با هم مرتبط هستند. اهمیت ارزشیابی در اندازهگیری میزان یادگیری خلاصه نمیشود. موضوع مورد ارزشیابی، طرق انجام آن و چگونگی بیان نتایج، همگی حامل پیامی روشن و آشکار است. این پیام حاوی نکات ارزشمندی در زمینهی آنچه باید فرا گرفته شود، چگونگی فراگیری مطالب، عناصر کیفی حایز اهمیت و سطح انتظارات از عملکردها است.
همچنین، وجود ارزشیابی با کیفیت بالا برای درک نیازهای فردی و گروهی و تناسب اهداف با محتوای برنامههای آموزشی و آگاهی از نیازهای دانشآموزان و چگونگی کیفیت آموزش، امري ضروری است.
ارزشیابیهای رسمی و یا غیر رسمی کلاسی، مدرسهای و منطقهای، آموزش و یادگیری را بههم پیوند میدهد و معلمان و مسؤولان آموزشی را قادر میسازد که بر کارآیی خود و پیشرفت تحصیلی دانشآموزان نظارت داشته باشند. ارزشیابی دقیق و صحیح، همچنین موجبات ترغیب و سازماندهی یادگیری و تدریس را فراهم میآورد و اطلاعات حاصل از آن، دانشآموزان را در جهت بهبود عملکرد خود رهنمون میشود. آزمونهای سنجش و ارزشیابی پیشرفت تحصیلی باید به عنوان ابزاری برای پیشبرد امر آموزش، ایجاد انگیزه برای فراگیری و همچنین ارزشیابی عملکردها، طراحی شوند.
در استفاده از آزمونهای مؤسسات مختلف، مدیران، دبیران و اولیا اغلب از خود میپرسند که «از چه آزمونهایی باید استفاده کرد؟»، «سؤالات آزمون چه ويژگيهايي باید داشته باشد؟»، «گزارشهای ارایه شده پساز برگزاری آزمون حاوی چه مطالبی باید باشد؟».
یافتن پاسخی مناسب به پرسشهایی از این قبیل، نیازمند صرف وقت و وسواس بسیاری است. نباید فراموش کرد که برخی از آزمونها نقش تعیین کنندهای در آیندهی دانشآموزان ایفا میکند. بنابراین باید نهایت دقت را در انتخاب درست آزمونها بهكار بست.
این دفترچه با هدف آشنایی مدارس با اهمیت نقش آزمون در فرآیند آموزش و چگونگی طراحی و اجرای آزمونهای مؤثر تهیه شده است.
اندازهگيري عبارت است از فرايندي دقيق و نظامدار كه تعيين ميكند يك شخص يا يك شيء چه مقدار از يك ويژگي برخوردار است. فرايند اندازهگيري نياز به وسيلهاي دارد كه به آن وسيلهي اندازهگيري ميگويند. وسايل اندازهگيري به دو دستهي مستقيم و غير مستقيم تقسيم ميشود. ويژگيهاي فيزيكي و رفتارهاي آشكار، مثل طول و وزن اشيا يا قد و وزن افراد، به طور مستقيم و ويژگيها و صفات رواني مانند هوش، خلاقيت، انگيزش، نگرش، يادگيري و مانند اينها به طور غيرمستقيم اندازهگيري ميشود. معمولترين وسيلهي اندازهگيري غير مستقيم، آزمون است. اما سنجش، از آزمون و اندازهگيري مفهوم گستردهتري دارد. بنا به گفتهي نيتكو، «سنجش يك اصطلاح كلي است و به صورت فرايندي تعريف ميشود كه براي گردآوري اطلاعات مورد نياز تصميمگيري دربارهي دانشآموزان، برنامههاي درسي و سياستهاي آموزشي مورد استفاده قرار ميگيرد. سالويا[1] و يسل دايك[2] ميگويند سنجش تنها به جمعآوري دادهها يا اطلاعات خلاصه نميشود، بلكه به جمعآوري دادهها همراه با قصد يا منظور گفته ميشود. داوري ارزشي بر روي اطلاعات جمعآوري شده، ارزشيابي نام دارد. ارزشيابي به يك فرايند نظامدار براي جمعآوري، تحليل و تفسير اطلاعات گفته ميشود، به اين منظور كه تعيين شود آيا هدفهاي مورد نظر تحقق يافتهاند يا در حال تحقق يافتن هستند و به چه ميزاني. دستهبندی آزمونها با توجه به چگونگی تهیهی آنها
آزمونها به دو دستهی عمدهی «آزمونهای استاندارد شده» و «آزمونهای معلمساخته» تقسیم میشوند. آزمونهای استاندارد شده، آزمونهایی هستند که با استفاده از نمونههای بزرگِ آزمونشوندگان و غالباً به وسیلهی مؤسسهها یا بنگاههای آزمونسازیِ دولتی یا خصوصی و یا مراکز آموزشی و علمی، برای اندازهگیری پیشرفت تحصیلی با مقاصد ارزشیابی از دورههای تحصیلی، تهیه و توزیع میشوند. در این نوع آزمونها، ملاکِ نسبی اندازهگیری مورد استفاده قرار میگیرد. آزمونهای معلمساخته آزمونهایی هستند که معلمان برای سنجش پیشرفت تحصیلی دانشآموزان خود تهیه میکنند و در طول دورهی آموزش و یا در پایان دوره به اجرا درمیآورند. در این آزمونها، ملاکِ مطلق اندازهگیری مورد استفاده قرار میگیرد. آزمونهای استاندارد شده و معلمساختهی پیشرفت تحصیلی را میتوان برای تصمیمگیریهای زیر مورد استفاده قرار داد: 1- تصمیمات آموزشیِ مربوط به کم و کیف جریان آموزش را باید برمبنای آزمونهای معلمساخته گرفت. 2- تصمیمات مربوط به ارتقای دانشآموزان را نیز، باید بر مبنای آزمونهای معلمساخته، که دربرگیرندهی موضوعات مشخص درسی و هدفهای دقیق آموزشی است، گرفت. 3- تصمیمات تشخیصی مربوط به مشکلات یادگیرندگان و تصمیمات مربوط به رفع نواقصِ یادگیری و آموزش را میتوان برمبنای هر دو نوع آزمون اتخاذ کرد. 4- تصمیمات مربوط به جایابی یا پایهگزینی افراد به اندازهگیریِ وسیعتری نیازمند است؛ بنابراین بهتر است در این مورد از آزمونهای استاندارد شده استفاده کرد. 5- تصمیمات مربوط به راهنمایی و مشاورهی دانشآموزان معمولاً به مقایسههای هنجاری نیازمند است؛ بنابراین بهتر است برای این منظور، از آزمونهای استاندارد شده استفاده کرد. 6- از آنجایی که تصمیمات مربوط به انتخاب برمبنای مقایسهی افراد و گروهها گرفته میشود؛ بنابراین در این مورد نیز بهتر است از آزمونهای استاندارد شده استفاده شود. 7- تصمیمات مربوط به برنامهریزی درسی نیز، که به انتخاب یک برنامه از میانِ برنامههای مختلف منجر میشود، به مقایسهی وسیع نیازمند است، که آن هم از عهدهی آزمونهای استاندارد شده برمیآید. 8- تصمیمات مربوط به ارزشیابی از میزان موفقيت مدارس مختلف، مستلزم کسب نظری جامع و مقایسهای در این باره است، که یک مدرسه در مقایسه با مدارس دیگر تا چه حد موفقیت کسب کرده است. برای این منظور نیز، آزمونهای استاندارد شده مفیدتر هستند. دستهبندي ارزشيابيهاي آموزشي با توجه به موضوع ارزشيابي
ارزشيابي به اين منظور بهكار ميرود كه تعيين شود آيا هدفهاي مورد نظر تحقق يافتهاند يا نه. بنابراين، يكي از راههاي تقسيمبندي انواع ارزشيابيها با توجه به هدف يا موضوع ارزشيابي است. از اين لحاظ، ارزشيابيهاي مختلف آموزشي را ميتوان در گروههاي زير قرار داد:
ارزشيابي از دانشآموزانمنظور از ارزشيابي از دانشآموزان[3] عمدتاً ارزشيابي از پيشرفت تحصيلي[4] يا ارزشيابي از ميزان يادگيري[5] آنان است. استفاده از نتايج ارزشيابي دانشآموزي بهويژه نتايج ارزشيابي پيشرفت تحصيلي، نهتنها براي قضاوت دربارهي عملكرد يادگيرندگان، بلكه براي داوري دربارهي اثربخشي كيفيت آموزش و روشها و مواد آموزشي نيز مفيد است. ارزشيابي پيشرفت تحصيلي كه مهمترين نوع ارزشيابي آموزشي است، تعيين مينمايد كه دانشآموزان تا چه ميزاني به هدفهاي آموزشي از پيش تعيين شده رسيدهاند.
ارزشيابي از برنامههاي درسي و مواد آموزشيارزشيابي آموزشي، گاهي به منظور تعيين اثربخشي برنامهي درسي[6] يا مواد آموزشي[7] انجام ميشود و شامل ارزشيابي از عواملي چون روشهاي آموزشي، كتابهاي درسي، ابزارهاي ديداري- شنيداري و تداركات فيزيكي و سازماني است. در ارزشيابي از برنامههاي درسي و مواد آموزشي نيز عمدهترين ملاك، پيشرفت تحصيلي يا ميزان يادگيري دانشآموزان است.
ارزشيابي از پروژهها و برنامههاي آموزشيعلاوه بر برنامههاي درسي و مواد آموزشي، برنامهها و پروژههاي[8] آموزشي ويژه نيز مورد ارزشيابي واقع ميشوند. منظور از پروژهها و برنامههاي آموزشي ويژه، كوششهايي است موقعيتي كه بهعنوان بخشي از برنامههاي معمول مدرسهها بهحساب نميآيند. اين برنامهها نوعاً ماهيت نوآورانه دارند و طول مدت حضورشان به موفقيتشان وابسته است.
ارزشيابي از مدرسهمنظور از ارزشيابي از مدرسه[9] اين است كه تعيين شود هدفهاي پيشبيني شده براي مدرسه به چه ميزاني تحقق يافتهاند و نقاط قوت و ضعف كداماند. يكي از جنبههاي مهم ارزشيابي از مدرسه، برنامهي آزمون مدرسه است. هرچه اين برنامه جامعتر و كاملتر باشد، اطلاعات به دست آمده نيز به همان نسبت، قابل اعتمادتر و باارزشتر خواهد بود. مانند ساير ارزشيابيهاي آموزشي، در ارزشيابي از مدرسه نيز پيشرفت تحصيلي دانشآموزان مهمترين بخش برنامهي آزمون و منبع كسب اطلاعات است.
ارزشيابي از كاركنان مدرسهمقصود از ارزشيابي از كاركنان مدرسه، ارزشيابي از همهي كساني است كه بهطور مستقيم يا غير مستقيم مسؤول بازدههاي آموزشي مدرسه هستند. در سالهاي اخير بر ارزشيابي از اثربخشي معلمان سطوح مختلف تحصيلي تأكيد زيادي شده است. شايد پيچيدهترين نوع ارزشيابي، همين ارزشيابي از كار معلمان باشد. علت پيچيدگي اين روش ارزشيابي، كماعتباري و بيدقتي وسايل و روشهاي اندازهگيري و سنجش مورد استفاده در اين نوع ارزشيابي است، زيرا هيچيك از منابع اطلاعاتي پيش گفته اطلاعات دقيق و بيغرضانهاي را كه براي يك ارزشيابي سالم، ضروري است، به دست نميدهد. بنابراين، متخصصان ارزشيابي معلم پيشنهاد ميكنند براي اينكه ارزشيابي سالمتري از معلمان بهعمل آيد، بايد از همهي منابع اطلاعاتي موجود دادههاي لازم را به دست آورد و قضاوت نهايي را بر اساس تركيبي از آنها انجام داد. ارزشيابي از كار معلمان دست كم براي دو منظور به كار ميرود: 1- کمک به معلم در جهت اصلاح و بهبود روشها و فعالیتهای آموزشی 2- تصميمگيريهاي شغلي، اعم از استخدام، ترفیع یا ارتقاي معلم
ارزشيابي معلم عبارت است از تعيين ميزان موفقيت معلمان در رسيدن به هدفهاي آموزشي خود. در ارزشيابي معلم، دو دسته اطلاعات ضروري است: 1- ملاكها يا معيارهاي موفقيت آموزشي 2- شاخصي از ميزان موفقيت معلمان در رسيدن به اين ملاكها.
روشهاي ارزشيابي معلم به دستههاي زير قابل تقسيم است: 1- مصاحبه بهعنوان وسيلهاي براي گزينش و نگهداري معلمان 2- مشاهده از كلاس درس 3- استفاده از نظر دانشآموزان 4- استفاده از يادگيري دانشآموزان 5- خودسنجي يا ارزشيابي از خود 6- ارزشيابي بهوسيلهي همكاران 7- بررسي آثار علمي معلم
دستهبندي ارزشيابيهاي آموزشي با توجه به زمان و هدف استفاده
ارزشيابيهاي آموزشي و آزمونهاي مورد استفادهي آنها را به چهار دستهي ارزشيابيهاي آغازين، تكويني، تشخيصي و تراكمي تقسيم ميكنند:
ارزشيابي آغازين يا سنجش آغازيننخستين ارزشيابي كه پيش از انجام فعاليتهاي آموزشي به اجرا درميآيد، ارزشيابي آغازين يا سنجش آغازين[10] ناميده ميشود. اين نوع ارزشيابي به دو منظور مورد استفاده قرار ميگيرد: 1- آيا يادگيرندگان بر دانشها و مهارتهاي پيشنياز درسِ تازه از قبل مسلطاند؟ 2- يادگيرندگان چه مقدار از هدفها و محتواي درس تازه را قبلاً ياد گرفتهاند؟ در مورد سؤال اول، سنجش آغازين به منظور اندازهگيري مهارتها و دانشهاي پيشنياز يادگيريِ درس تازه بهكار ميرود. در مورد سؤال دوم، بهجاي آزمون آمادگی، از آزمون جايابي يا آزمون پايهگزيني[11] استفاده ميشود. هدف از آزمون جايابي يا پايهگزيني كه به آن پيشآزمون[12] نيز گفته ميشود، تعيين ميزان اطلاعات يادگيرندگان از مطالبي است كه قرار است به آنان آموزش داده شود.
ارزشيابي تكوينيآنچه عمدتاً بهمنظور كمك به اصلاح موضوع مورد ارزشيابي، يعني برنامه يا روش آموزشي مورد استفاده قرار ميگيرد، ارزشيابي تكويني[13] نام دارد. هدف از اجراي اين ارزشيابي، آگاه ساختن توليد كنندگان برنامه از نواقص برنامهي خود و كمك به اصلاح آنها است. هدف از كاربرد ارزشيابي تكويني در رابطه با پيشرفت تحصيلي دانشآموزان، آگاهي يافتن از ميزان و نحوهي يادگيري آنان براي تعيين نقاط قوت و ضعف يادگيري و نيز، تشخيص مشكلات روش آموزش معلم در رابطه با هدفهاي آموزشي است. در ارزشيابي تكويني، در پايان هر واحد درسي، يك آزمون دقيق و مختصر كه حاوي هدفهاي آموزشي آن واحد است، اجرا ميشود و بر اساس نتايج حاصل، ميزان دستيابي به هدفهاي آموزشي مشخص ميگردد.
ارزشيابي تشخيصينوع ديگر ارزشيابي كه آن نيز در جريان آموزش انجام ميگيرد، ارزشيابي تشخيصي[14] نام دارد. علت اين نامگذاري آن است كه اين ارزشيابي با هدف تشخيص مشكلات يادگيري دانشآموزان بهكار ميرود. اين آزمونها معمولاً به صورت انفرادي اجرا ميشوند و در قياس با آزمونهاي پيشرفت تحصيلي، سؤالهاي بيشتري را در بر ميگيرند. این ارزشیابی زمانی مورد استفاده قرار میگیرد که معلم با مشکلات مبرم و مکرری در یک یا چند دانشآموز روبهرو میشود، که با روشهای اصلاحیِ معمولِ ارزشیابی تکوینی قابل رفع نیست.
ارزشيابي تراكميدر ارزشيابي تراكمي[15] تمام آموختههاي دانشآموزان در طول يك دورهي آموزشي تعيين ميشوند و هدف آن، نمره دادن به دانشآموزان و قضاوت دربارهي اثربخشي كار معلم و برنامهي درسي يا مقايسهي برنامههاي مختلف درسي با يكديگر است. هدف ارزشيابي تراكمي هم نمره دادن و اتخاذ تصميمهاي مختلف و هم تعيين اثربخشي طرح آموزشي و هدفهاي معلم و ميزان موفقيت او در پياده كردن مراحل مختلف طرح آموزشي است.
ويژگيهاي مختلف ارزشيابيهاي پيشاز آموزش، ضمن آموزش و پساز آموزش
دستهبندي ارزشيابيهاي آموزشي با توجه به ارزشياباندو نوع ارزشيابي آموزشي ديگر كه با ارزشيابي تكويني و تراكمي رابطهي نزديكي دارند، ارزشيابي دروني[16] و ارزشيابي بيروني[17] است. منظور از ارزشيابي دروني، اين است كه ارزشيابي توسط كاركنان و دستاندركاران تهيه و اجراي برنامه، يعني افراد درون برنامه انجام ميشود و منظور از ارزشيابي بيروني، ارزشيابي توسط افراد يا گروههايي خارج از برنامه صورت گيرد. ارزشيابي دروني بيشتر مناسب ارزشيابي تكويني و ارزشيابي بيروني مناسب ارزشيابي تراكمي است. [1] Salvia [2] Yeseldyke [3] student evaluation [4] academic achievement [5] learning [6] curriculum [7] instructional materials [8] programs and projects [9] school evaluation [10] preassessment [11] placement test [12] pretest [13] formative evaluation [14] diagnostic evaluation [15] summative evaluation [16] internal evaluation [17] external evaluation http://www.meraat.ir/P_Ewh.aspx | |||||||||||||||||||||||||||||||||||||||||||||||||||
مهمترين وسيلهي اندازهگيري پيشرفت تحصيلي آزمون است. در اينجا به دستهبندي انواع آزمونهاي پيشرفت تحصيلي كتبي يا «مداد و كاغذي»[1] ميپردازيم.
آزمونهاي پيشرفت تحصيلي كتبي را ميتوان ابتدا به دو دستهي عيني و غيرعيني (ذهني) تقسيم كرد و سپس اين دو دستهي كلي را نيز تقسيم نمود. آزمونهاي عيني[2] آزمونهايي هستند كه هم سؤالها و هم جواب سؤالها را در اختيار آزمونشوندگان قرار ميدهند و آزمونشوندگان دربارهي جوابهاي داده شده اعمالي انجام ميدهند يا تصميمهايي اتخاذ ميكنند. به همين سبب، اين آزمونها را آزمونهاي بسته پاسخ نيز مينامند. آزمونهاي عيني يا بستهپاسخ بهطور عمده از سه نوع اصلي صحيح- غلط، جوركردني و چند گزينهاي تشكيل ميشود. آزمون شونده در جواب دادن به سؤالهاي صحيح- غلط، درست يا نادرست بودن سؤالها را تعيين ميكند؛ در سؤالهاي جور كردني، تعدادي پرسش را با تعدادي پاسخ جور ميكند؛ و در سؤالهاي چند گزينهاي، پاسخ صحيح را از ميان تعدادي پاسخ پيشنهادي برميگزيند.
در تصحيح برگههاي آزمونهاي عيني نظر شخصي مصحح هيچگونه دخالتي ندارد و از اين رو به اين آزمونها آزمونهاي عيني ميگويند.
دستهي كلي ديگر وسايل سنجش يادگيري، روشهاي «ساختن پاسخ»[3] نام دارد. در اين روشها، دانشآموز، خودش پاسخ خواسته شده را ميسازد يا توليد ميكند. اين روشها بسيار گوناگوناند و از جمله آزمونهاي تشريحي، آزمونهاي كوتهپاسخ، امتحانات شفاهي انفرادي، توليد آثار هنري (شعر، موسيقي، نقاشي)، انجام پروژههاي تحقيقي، ساختن وسايل و ابزارهاي مختلف را شامل ميشوند. اين آزمونها (آزمونهاي ذهني[4]) به آزمونهاي تشريحي يا انشايي[5] معروفاند. اين نوع آزمونها را نيز ميتوان به دو دستهي آزمونهاي گسترده پاسخ و آزمونهاي محدودپاسخ تقسيم كرد. در آزمونهاي گسترده پاسخ، براي پاسخ آزمون شونده هيچ محدوديتي وجود ندارد و او آزاد است تا هرگونه كه مايل باشد پاسخ خود را بپروراند و سازمان دهد. اما در آزمونهاي محدودپاسخ، آزمونشونده در دادن پاسخ به سؤالها آزادي كامل ندارد.
نوع ديگري از آزمون پيشرفت تحصيلي بازپاسخ موجود است كه در وسط دو نوع آزمون عيني و ذهني قرار دارد. در اين آزمون كه به آزمون كوته پاسخ[6] شهرت دارد، سؤالها بسيار شبيه به سؤالهاي آزمونهاي تشريحي است، با اين تفاوت كه بسيار دقيق و مشخص است، به نحوي كه در تصحيح جوابهاي آنها نظر شخصي مصحح دخالت چنداني نميكند. جواب اين سؤالها معمولاً به يك يا چند كلمه (حداكثر يك جمله) يا يك عدد و يا يك علامت خلاصه ميشود.
شكل زير انواع آزمونهاي پيشرفت تحصيلي كتبي را نشان ميدهد:
|
انواع آزمونهاي پيشرفت تحصيلي |
|
بازپاسخ (توليد پاسخ) |
تشريحي |
گسترده پاسخ | ||||
|
|
محدودپاسخ | |||||||
|
كوته پاسخ |
| |||||||
|
|
|
| ||||||
|
بسته پاسخ يا عيني(گزينش پاسخ) |
|
صحيح- غلط
جوركردني
چندگزينهاي | ||||||
محاسن آزمونهای تشریحی عبارتند از:
1- تهيهي آزمونهاي تشريحي از تهيهي آزمونهاي عيني آسانتر است.
2- اين نوع آزمون تنها وسيلهي موجود سنجش توانايي آزمونشونده در پروراندن جواب سؤالها و بيان آنها است.
3- اين آزمونها توانايي پاسخ دادن به سؤالها را ميسنجند نه توانايي انتخاب پاسخها را.
4- آنها موقعيتهاي واقعيتري را از آزمونهاي عيني به آزمونشوندگان عرضه ميكنند.
5- آنها بر روش مطالعهي يادگيرندگان تأثير مثبت بهجاي ميگذارند. اگر دانشآموزان از پيش بدانند كه با استفاده از آزمونهاي تشريحي يادگيري آنان سنجش خواهد شد، با احتمال بيشتري به دنبال روابط در ميان مطالب به جستجو خواهند پرداخت و اطلاعات را به راههاي معنيدار سازمان خواهند داد.
معایب این آزمونها را نیز میتوان به صورت زیر دستهبندی کرد:
1- اين آزمونها نمونهي كوچكي از محتواي درس و هدفهاي آموزشي را اندازه ميگيرند.
2- تصحيح برگههاي امتحاني اينگونه آزمونها نميتواند با دقت و بهطور عيني انجام گيرد.
3- تصحيح برگههاي امتحاني اين آزمونها بسيار وقتگير است.
به نمونهاي از يك پژوهش كه در آن مشكل ارزشيابي آزمونهاي تشريحي به خوبي نشان داده شده است، توجه كنيد:
در سال 1982 يكي از پژوهشگران به نام فالز نسخهي انشايي را كه يك دانشآموز سال آخر دبيرستان به زبان انگليسي نوشته بود، در اختيار صد نفر معلم زبان انگليسي قرار داد تا تصحيح كنند. از معلمان خواسته شد تا هم به برگهي امتحاني نمره بدهند و هم تعيين كنند كه نويسندهي انشا به چه كلاسي متعلق است. نمرههاي اين معلمان از 60 تا 98 پراكنده بود. جالبتر اينكه كلاسهايي كه اين صد نفر معلم، نويسندهي انشا را به آن مربوط كردند، از كلاس پنجم ابتدايي تا سال دوم دانشگاه را شامل ميشد!
آزمونهاي كوته پاسخ براي اندازهگيري هدفهاي شناختي سطوح پايين، بهويژه دانش يا معلومات، مفيد هستند. البته در پارهاي از اوقات از اين نوع سؤالها براي اندازهگيري هدفهاي سطح بالاتر نيز ميتوان استفاده كرد.
يكي از محاسن آزمونهاي كوتهپاسخ، سهولت تهيهي سؤالها و تصحيح پاسخهاي آنها است. علاوه بر اين، در مقايسه با آزمونهاي عيني، نظير آزمونهاي صحيح- غلط يا چندگزينهاي داراي مزاياي ديگري به شرح زير هستند:
1- اجراي آنها آسان است.
2- امكان تقلب را كاهش ميدهند.
3- نسبت به آزمونهاي عيني چندگزينهاي، صحيح- غلط و جور كردني اطلاعات تشخيصي بيشتري را در اختيار معلمان ميگذارند.
امتياز ديگر آزمونهاي كوته پاسخ اين است كه در آنها حدس كوركورانه كه از معايب عمدهي آزمونهاي عيني است، وجود ندارد.
از معايب اين آزمونها كاربرد محدود آنها است. از آنجا كه پاسخ سؤالهاي اين نوع آزمونها بسيار مختصر است، نميتوان از آنها براي سنجش هدفهاي سطح بالاي يادگيري استفاده كرد و كاربرد آنها به اندازهگيري هدفهاي سطح دانش و حداكثر فهميدن و كاربستن (آن هم در موارد بسيار نادر) محدود ميشود. مشكل ديگر اين است كه كاربرد زياد اين آزمونها سبب تشويق يادگيرندگان به حفظ كردن اطلاعات جزيي و بياهميت خواهد شد، زيرا در اين نوع آزمونها بيشتر اينگونه اطلاعات سنجيده ميشود.
همچنين آزمونشوندگان در پاسخ دادن به سؤالهاي اين آزمونها ممكن است يكنواخت عمل نكنند و در جواب سؤالها پاسخهاي مختلفي بدهند. درنتيجه مصحح بايد تصميم بگيرد كه جوابها درست، غلط، يا نيمه درستاند. اين امر ممكن است به عدم دقت در تصحيح اوراق امتحاني و كاستن از ميزان روايي و پايايي آزمون منجر شود.
بهطور كلي ميتوان محاسن اين آزمونها را به شرح زير فهرست كرد:
1- بيان موضوعهاي درسي در قالب عبارتهاي ساده؛
2- سادگي تهيه؛
3- عيني بودن تصحيح جوابها؛
4- قابليت پاسخگويي آزمونشونده به تعداد زيادي سؤال در هر جلسهي امتحان.
بهرغم محاسن بالا، آزمونهاي صحيح- غلط را از جهاتي مورد انتقاد قرار دادهاند و ايرادهايي به آنها وارد كردهاند. ايرادهاي وارده به اين آزمونها را ميتوان به شرح زير برشمرد:
1- اين آزمونها اغلب براي سنجش اطلاعات جزيي و كماهميت بهكار ميروند.
2- حدس زدن كوركورانه در آنها خيلي زياد دخالت دارد.
3- كاربرد زياد آنها سبب تأكيد بيمورد بر حفظ طوطيوار اطلاعات كماهميت ميشود.
4- آنها بيشتر براي سنجش هدفهاي سطح پايين مفيداند و تواناييهاي پيچيدهي سطح بالا را اندازه نميگيرند.
آزمونهاي جور كردني از تعدادي سؤال تشكيل ميشوند كه هريك از آنها شامل دو ستون است. يك ستون، معرف پرسشها و ستون ديگر نشاندهندهي پاسخها است. وظيفهي آزمون شونده آن است كه پاسخها را با پرسشهاي مربوط جور كند. فايدهها و كاربردهاي سؤالهاي جور كردني را به نحو زير ميتوان خلاصه كرد:
1- از آنجا كه پاسخ دادن به اين سؤالها زمان زيادي لازم ندارد، تعداد زيادي از آنها را ميتوان در يك زمان معين مورد استفاده قرار داد. بنابراين، استفاده از اين نوع سؤالها مانند سؤالهاي عيني ديگر نمونهي نسبتاً بزرگي از محتواي درسي و هدفهاي آموزشي را فراهم ميآورد.
2- تصحيح سؤالهاي جوركردني به سرعت و سهولت امكانپذير است و نيازي به مصحح متخصص ندارد. علاوه بر اين، تصحيح اين سؤالها بهطور كاملاً عيني امكانپذير است.
آنجا كه بازده يادگيري بر توانايي تشخيص روابط بين امور تأكيد دارد و ميتوان تعدادي پرسش و پاسخ متجانس يافت، سؤالهاي جوركردني مهمترين نوع سؤالها هستند.
معايب اين آزمونها را به صورت زير ميتوان خلاصه كرد:
1- از آنجا كه در يادگيري تداعي بين امور، حفظ طوطيوار دخالت زيادي دارد و معلمان غالباً در تهيهي اين نوع سؤالها بر روابط حفظي بين امور تأكيد ميكنند، اين آزمونها اگر به دقت تهيه نشود، ممكن است دانشآموزان را به يادگيري مطالب سطحي و غيرعمقي سوق دهد.
2- گاهي اوقات پيدا كردن مجموعهاي از پرسشها كه به اندازهي كافي شبيه به هم باشد تا بتوان براي آنها پاسخهاي همگوني پيدا كرد، كار دشواري است.
علاوه بر اين موارد، بعضي از سؤالهاي جوركردني معمولي داراي معايب زير هستند:
- ابهام در راهنماييها،
- طولاني بودن پرسشها و پاسخها،
- ناهمگون يا مبهم بودن پاسخها،
- مبهم بودن پرسشها.
آزمون چند گزينهاي[7] شامل تعدادي سؤال است كه هريك از آنها از يك قسمت اصلي و تعدادي گزينه (پاسخ) تشكيل ميشود و آزمونشونده از ميان گزينههاي پيشنهادي، گزينهي صحيح را انتخاب ميكند.
1- قسمت اصلي يا تنهي سؤال[8]. اين بخش، متن اصلي سؤال را تشكيل ميدهد و دربرگيرندهي مسأله يا موضوعي است كه سؤال بايد آن را اندازهگيري كند.
2- گزينهي درست يا پاسخ سؤال. يكي از گزينههاي پيشنهادي پاسخ درست سؤال است كه آزمون شونده بايد آن را برگزيند. به اين گزينه، گزينهي كليد[9] گفته ميشود.
3- گزينههاي انحرافي[10]. بهغيراز گزينهي درست سؤال، تعدادي گزينهي ديگر نيز براي هر سؤال تهيه ميشود كه به آن گزينههاي انحرافي ميگويند. نقش اين گزينهها منحرف كردن آزمونشوندگاني است كه پاسخ درست سؤال را نميدانند.
تعداد گزينههاي سؤالهاي چندگزينهاي (گزينهي درست و گزينههاي انحرافي) از 2 تا 5 متغير است. از لحاظ نظري، هرچه تعداد گزينهها بيشتر باشد، امكان حدس زدن كمتر است. اما به سبب اينكه پيدا كردن بيشاز سه پاسخ انحرافي كار دشواري است، آزمونهاي چند گزينهاي كه در آنها امكان حدس زدن جواب درست يك در چهار است، شهرت بيشتري كسب كرده است.
سؤالهاي چند گزينهاي به سه دستهي زير تقسيم ميشود:
1- نوع تنها گزينهي درست. اين نوع سؤال سادهترين نوع سؤالهاي چندگزينهاي است. در اين نوع سؤال تنها يكي از گزينهها درست است و بقيهي گزينهها كاملاً غلط هستند.
2- نوع بهترين گزينه. در اين نوع، همهي گزينهها درست است، اما يكي از آنها از همه درستتر يا بهتر است.
3- نوع منفي. در اين نوع سؤال، تنهي سؤال به صورت منفي بيان ميشود و همهي گزينهها بهجز يكي از آنها درست است.
آزمونهاي چندگزينهاي تمام محاسن آزمونهاي صحيح- غلط و جوركردني را دارند. علاوه بر آن، اين آزمونها قادر به اندازهگيري غالب بازدههاي يادگيري از دانش گرفته تا فهميدن، قضاوت كردن، حل مسأله، ارايهي پيشنهادهاي عملي و پيشبيني امور هستند. تقريباً هرگونه درك و فهم يا توانايي را كه بتوان با آزمونهاي ديگر – كوتهپاسخ، كامل كردني، صحيح غلط، جوركردني يا تشريحي – اندازه گرفت، ميتوان با آزمونهاي چندگزينهاي سنجش كرد.
بهطور كلي محاسن آزمونهاي چندگزينهاي را ميتوان به شرح زير بيان كرد:
1- اين آزمونها از ساير آزمونهاي عيني، انعطافپذيرترند. آنها علاوه بر دانش، توانايي استدلال، قضاوت و بسياري بازدههاي مهم ديگر يادگيري را ميسنجند.
2- با استفاده از سؤالهاي چندگزينهاي ميتوان در يك زمان محدود تعداد زيادي از هدفهاي آموزشي و بخش مهمي از محتواي درس را اندازهگيري كرد.
3- آزمونهاي چندگزينهاي نسبت به آزمونهاي صحيح- غلط كمتر امكان حدس زدن كوركورانه را به آزمونشوندگان ميدهند.
4- پاسخهاي اين سؤالها به سادگي و با عينيت كامل قابل تصحيح هستند.
5- دانشآموزان و معلمان اين نوع آزمونها را به ساير آزمونهاي عيني ترجيح ميدهند.
6- اگر گزينههاي انحرافي اين آزمونها با توجه به اشتباهات و كجفهميهاي متداول دانشآموزان تهيه شوند، منبع بسيار مناسبي براي تشخيص مشكلات دانشآموزان خواهند بود.
آزمونهاي چندگزينهاي از چند نظر مورد انتقاد قرار گرفتهاند. ما در اينجا اين انتقادها را بهعنوان معايب آزمونهاي چندگزينهاي ذكر ميكنيم.
1- ساختن اين آزمونها بسيار دشوار است. معلمان غالباً نميتوانند تعدادي گزينهي انحرافي خوب براي سؤالهاي چندگزينهاي انتخاب كنند.
2- معلمان اغلب سؤالهاي چندگزينهاي را در حد سنجش اطلاعات جزيي و كماهميت مينويسند. البته اين ايرادي است كه به همهي آزمونهاي عيني از جمله آزمونهاي چندگزينهاي ميگيرند.
3- در مقايسه با آزمونهاي صحيح- غلط، خواندن اين آزمونها و پيدا كردن گزينهي درست مستلزم صرف وقت زيادتري است.
4- زماني كه به پاسخهاي غلط نمرهي منفي داده ميشود، دانشآموزاني كه خطر ميكنند، از ساير دانشآموزان نمرههاي بهتري ميگيرند. همچنين دانشآموزاني كه در پاسخ دادن به اينگونه سؤالها باتجربه هستند، از ديگر دانشآموزان نمرههاي بهتري كسب ميكنند.
5- دانشآموزان قوي بيشاز دانشآموزان معمولي قادر به پيدا كردن اشكالات، پيچيدگيها و نظرگاههاي واگرا (غيرمعمولي) در سؤالها هستند. اما از آنجا كه تنها يك پاسخ صحيح در سؤال وجود دارد، بابت اين تيزبينيهاي خود نهتنها تشويق نميشوند، بلكه با دادن جوابي كه مورد نظر طراح سؤال نيست، ممكن است تنبيه هم بشوند.
در اينجا خلاصهاي از قواعد تهيهي اين آزمونها را در قالب 21 پرسش ذكر ميكنيم:
1- هر سؤال به روشني موضوع مورد نظر را بيان ميكند؟
2- موضوع اصلي سؤال در تنهي سؤال قرار گرفته است؟
3- مطالب تكراري گزينهها در تنهي سؤال قرار داده شده است؟
4- هر سؤال يك موضوع مهم را اندازه ميگيرد؟
5- گزينههاي يك سؤال با هم تجانس دارند؟
6- در هر سؤال تنها يك گزينه كه از همهي گزينهها بهتر است، وجود دارد؟
7- در سؤالهايي كه براي سنجش فرايندهاي پيچيدهي ذهني نوشته شده، موقعيتهاي جديد مطرح گردیده است؟
8- گزينههاي انحرافي آزمون شوندگان بياطلاع از موضوع را به خود جلب ميكنند؟
9- گزينههاي هر سؤال از نظر دستوري و جملهبندي با تنهي سؤال مطابقت دارند؟
10- از كاربرد اشارههاي نامربوط خودداري شده است؟
11- در سؤالهاي منفي زير عبارت منفي خط كشيده شده است؟
12- از كاربرد منفي مضاعف در نوشتن سؤالها خودداري شده است؟
13- از كاربرد عباراتي نظير «همهي آنها» و «همهي آنچه در بالا گفته شد» خودداري شده است؟
14- سؤالها مستقل از يكديگر هستند؟
15- از طرح سؤالهاي گمراه كننده اجتناب گردیده است؟
16- از كاربرد دو گزينهي متضاد كه يكي از آنها درست است، خودداري شده است؟
17- طول گزينهي درست در سؤالهاي مختلف متغير است؟
18- محل گزينهي درست در ميان گزينههاي انحرافي بهطور تصادفي انتخاب شده است؟
19- سؤالها در حد درك و فهم آزمونشوندگان هستند؟
20- گزينهي «هيچکدام» حتيالمقدور كم مورد استفاده قرار گرفته است؟
21- جاي خالي در انتهاي تنهي سؤال قرار گرفته است؟
گام نخست در اجراي آزمونهاي پيشرفت تحصيلي، آماده سازي و فراهم آوردن شرايط مناسب براي اجراي آنهاست. تهيهي دفترچه آزمون و پاسخنامه، ترتيب پشت سر هم قرار دادن سؤالهاي مختلف و درنظر گرفتن زمان و مكان مناسب براي اجراي آزمون نياز به دقت فراوان دارند. مجموعهي اين عوامل بايد بهگونهاي فراهم شوند كه براي هريك از آزمونشوندگان حداكثر امكانات را جهت نشان دادن بهترين عملكرد فراهم آورند. نكاتي كه در زير توضيح ميدهيم، ناظر بر اين هدف است.
گرلاند و لين (1990) در رابطه با قرار دادن سؤالهاي آزمون بهدنبال يكديگر چند پيشنهاد زير را ارايه دادهاند:
1- سؤالها را با توجه به نوع آنها دستهبندي كنيد و پشت سر هم قرار دهيد.
2- سؤالها را از ساده به دشوار مرتب كنيد.
3- سؤالها را به ترتيب ساختارِ اصليِ مطالب بهدنبال هم مرتب كنيد.
راهنماي آزمون بايد مختصر و مفيد باشد و بهطور آشكار به آزمون شونده بگويد كه چه كاري را انجام دهد. مهرنز و لهمان (1984) گفتهاند كه راهنماي آزمون بايد اطلاعات زير را در اختيار آزمون شوندگان قرار دهد:
1- زمان لازم براي هر قسمت
2- ارزش هر سؤال
3- مجاز يا غيرمجاز بودن حدس زدن
همچنين، افزون بر يك راهنمايي كلي، نوشتن يك راهنمايي جداگانه براي هر بخش نيز مؤثر است.
شرايط اجراي آزمونهاي پيشرفت تحصيلي بايد بهگونهاي باشد كه از هر لحاظ آسايش جسمي و فكري آزمونشوندگان را تأمين نمايد. علاوه بر شرايط فيزيكي، شرايط رواني آزمونشوندگان نيز بر عملكرد آنان تأثير دارد. مهمترين اين عوامل، اضطراب زياد است. پژوهشهاي انجام شده نشان داده كه اندكي اضطراب سبب افزايش دقت و كوشش آزمون شوندگان ميشود، اما اضطراب زياد بر عملكرد آنان تأثير منفي دارد. بنابراين بايد سعي شود در جلسهي امتحان از عوامل تنشزا و اضطراببرانگيز جلوگيري بهعمل آورد.
پساز تهيه و اجراي آزمونهاي پيشرفت تحصيلي، نوبت به تصحيح برگهها و نمرهگذاري آنها ميرسد. در نمرهگذاري آزمونهاي عيني دو روش عمده وجود دارد:
1- محاسبهي كليهي پاسخهاي درست بدون كسر نمره براي حدس زدن
2- كسر مقداري از نمره براي جبران حدس زدن. براي تعيين نمره در اين روش، از فرمول زير استفاده ميشود:
= درصد عملكرد
در اين فرمول:
تعداد پاسخهاي درست : R
تعداد پاسخهاي غلط : W
تعداد گزینههای هر سؤال : N
تعداد کل سؤالها : T
هدف از تحليل سؤالهاي آزمون، وارسي تك تك سؤالها و تعيين ميزان دقت و نارساييهاي آنهاست. در تحليل سؤالهاي آزمون، نقاط قوت و ضعف يك آزمون و كيفيت همهي سؤالهاي آن تعيين ميشود.
براي تهيهي يك آزمون خوب، علاوه بر رعايت پيشنهادهايي كه پيشتر ارايه شد، تحليل پاسخهاي آزمون شوندگان و بررسي تجربي آنها ضروري است. تحليل پاسخهاي آزمون شوندگان، همچنين، اطلاعات تشخيصي لازم را براي بررسي كيفيت يادگيري دانشآموزان و مشكلات آموزشي معلمان فراهم ميآورد.
براي تحليل سؤالهاي يك آزمون، لازم است ضرايب دشواري و تمييز هر سؤال را تعيين كرد و به تحليل گزينههاي انحرافي سؤالها پرداخت.
درصد كل آزمونشوندگاني كه به يك سؤال جواب درست ميدهند، ضريب دشواري آن سؤال است.
|
تعداد كساني كه به سؤال پاسخ درست دادهاند R |
= P ضريب دشواري |
|
تعداد كل آزمونشوندگان T |
سؤالات خيلي آسان 1 < P < 0 سؤالات خيلي دشوار
در مواردي كه تعداد آزمونشوندگان زياد است و اطلاعات ما بهنحوهي پاسخدهي افراد گروه بالا و گروه پايين محدود ميشود، لازم است از فرمول زير استفاده كنيم:
|
انتخابهاي درست گروه پايين + انتخابهاي درست گروه بالا |
= P |
|
تعداد افراد گروه بالا + تعداد افراد گروه پايين |
بهطور كلي، ضريبهاي دشواري بين 3/0 تا 7/0 حداكثر اطلاع را دربارهي تفاوت بين آزمونشوندگان بهدست ميدهند.
برخلاف ضريب دشواري كه ميزان آسان يا دشوار بودن يك سؤال را نشان ميدهد، ضريب تمييز، كه با d نشان داده ميشود، قدرت سؤال را در تمايزگذاري يا تشخيص بين گروه قوي و گروه ضعيف آزمونشوندگان را مشخص ميكند. براي محاسبهي ضريب تمييز يك سؤال از فرمول زير استفاده ميشود:
|
انتخابهاي درست گروه پايين – انتخابهاي درست گروه بالا |
= d ضريب تمييز سؤال |
|
تعداد افراد يك گروه (بالا يا پايين) |
هرقدر ضريب تمييز بزرگتر باشد، قوهي تمييز آن سؤال بيشتر و هر قدر اين ضريب كوچكتر باشد، قوهي تمييز آن كمتر است. مثلاً اگر قوهي تمييز سؤالي 90/0 باشد، آن سؤال آزمونشوندگان قوي و ضعيف را خيلي خوب از هم جدا خواهد كرد، اما اگر ضريب تمييز سؤالي 10/0 باشد، آن سؤال از عهدهي جداسازي دانشآموزان ضعيف و قوي بهخوبي برنخواهد آمد. ضمير تمييز صفر حاكي از اين است كه آن سؤال بههيچ وجه نتوانسته بين گروه قوي و ضعيف تمايز قائل شود.
نمرات معيار، عملكرد هر دانشآموز را در يك آزمون، بنا بر اختلاف عملكرد او از ميانگين گروه، برحسب واحد انحراف معيار نشان ميدهد.
آن دسته از نمرات معيار كه داراي توزيعي با ميانگين صفر و انحراف معيار واحد هستند، به نمرات Z شهرت دارند.
و
نمرهي خام: X
ميانگين نمرات:
انحراف معيار نمرات: SD
تعداد نمرات: N
مقياس نمرات T با ضرب نمرات Z در عدد ثابت a و جمع كردن نمرات حاصل با عدد ثابت b بهدست ميآيد. بنابراين، آن دسته از نمرات معيار كه داراي توزيعي با ميانگين b و انحراف معيار a است، توزيع نمرات T نام دارد.

در محاسبهي نمرهي تراز كنكور سراسري، ميانگين را 5000 و انحراف معيار را 2000 تعيين ميكنند. درنتيجه:

البته ميتوان Z را از روي نمودار نرمال بهدست آورد.
مقايسهي درصدها و نمرات معيار در توزيع نرمال:
1- دو قسمت منحني نرمال نسبت به خط وسط آن قرينه هستند.
2- در توزيعي كه اين منحني مُعرف آن است، اكثر نمرهها در وسط توزيع انباشته شدهاند.
3- هرچه از وسط منحني به دوطرف آن پيش برويم، از ارتفاع منحني (حجم نمرات) كاسته ميشود و در انتهاي منحني دنبالههاي طويلي بهوجود ميآيند.
4- دو امتداد منحني در بينهايت محور افقي را قطع ميكنند، زيرا تعداد مواردي كه لازم است تا يك منحني نرمال واقعي درست شود، از لحاظ نظري بينهايت است.
5- در منحني نرمال، ميانگين، ميانه و نما بر روي هم قرار دارند.
6- در روي اين منحني دو نقطه وجود دارد كه در آنها جهت منحني تغيير ميكند. اين دو نقطه در فواصل 1
انحراف معيار از ميانگين قرار دارند.
7- در منحني نرمال، بين انحراف معيارها و نسبت افراد يك رابطهي دقيق رياضي وجود دارد و در هر واحد انحراف معيار هميشه يك نسبت ثابت از افراد موجود است. اگر تمام سطح منحني نرمال را برابر يك واحد فرض كنيم، بين ميانگين 1+ و 1- انحراف معيار 13/34% از كل مساحت منحني قرار دارد. همچنين 26/68% = 13/34´2 از كل سطح منحني بين 1+ و 1- انحراف معيار واقع است. ضمناً در حدود 44/95% مساحت زير منحني بين 2+ و 2- انحراف معيار قرار دارد و در حدود 74/99% اين مساحت نيز در فاصلهي 3+ و 3- انحراف معيار واقع است. بنابراين، تقريباً تمام سطح زير منحني نرمال در اين فاصلهي انحراف معيار قرار دارد. بههمين سبب است كه محققان و آمارگران، سطح منحني نرمال را عملاً بين 3+ و 3- انحراف معيار فرض ميكنند.
روايي[1] اصطلاحي است كه به هدفي كه آزمون براي تحقق بخشيدن به آن درست شده است، اشاره ميكند. لين و گرانلاند (2000) روايي را به صورت يك ارزشيابي از كفايت و مناسبت تفسيرها و استفادههاي نتايج سنجش تعريف كردهاند. كاپلان و ساكوزو (2001) گفتهاند: روايي را ميتوان به صورت توافق بين نمرهي آزمون و كيفيتي كه قرار است اندازه بگيرد، تعريف كرد.
بنابر آنچه گفته شد، آزموني داراي روايي است كه براي اندازهگيري آنچه مورد نظر است، كافي و مناسب باشد. براي مثال، يك آزمون پيشرفت تحصيلي رياضي كلاس پنجم دبستان، درصورتي يك آزمون روا[2] است كه محتوا و هدفهاي آن درس را بهخوبي اندازهگيري كند و بهجز يادگيري دانشآموزان از آن درس، چيز ديگري را شامل نباشد.
آزمونهاي مورد استفاده در آموزش و پرورش و روانشناسي داراي سه هدف عمده هستند كه به سه پرسش زير پاسخ ميدهند:
1- آيا سؤالهاي آزمون از محتواي درس يا موضوع مورد نظر يك نمونهي خوب ارايه ميدهند؟
2- آيا نمرات آزمون عملكرد فعلي يا آتي دانشآموزان را پيشبيني ميكنند؟
3- آيا نمرات آزمون به مفاهيم نظري يا سازههايي كه آزمون براي سنجش آنها درست شده، مربوط است؟
سه مورد بالا به ترتيب سه نوع روايي محتوايي، ملاكي و سازه را نشان ميدهد. در جدول زير به معرفي و مقايسهي انواع روايي ميپردازيم:
|
نوع روايي |
قصد و منظور |
چگونگي تعيين روايي يا روايييابي | |
|
محتوايي |
|
تعيين اينكه تا چه حد سؤالهاي يك آزمون معرف محتوايي كه براي سنجش آن تهيه شده، هستند. |
از راه تعيين ميزان مطابقت بين سؤالهاي آزمون و محتواي مورد نظر. |
|
ملاكي |
پيشبيني |
تعيين اين موضوع كه نمرات يك آزمون تا چه اندازه نمرات آزمون ديگري را كه آزمون ملاك نام دارد، پيشبيني ميكنند. |
ضريب همبستگي بين نمرات آزموني كه تعيين روايي آن مورد نظر است و نمرات ملاك كه بعداز گذشت مدتي از اجراي آزمون پيشبين به دست ميآيند. |
|
همزمان |
تعيين اين موضوع كه يك آزمون يا وسيلهي اندازهگيري جانشين مناسبي براي آزمون يا وسيلهي اندازهگيري ديگري هست يا نه. |
ضريب همبستگي بين نمرات آزموني كه تعيين روايي آن مورد نظر است و نمرات ملاك كه همزمان بهدست ميآيند. | |
|
سازه |
|
تعيين تعداد و ماهيت ويژگيها يا سازههايي كه زيربناي مجموعهاي نمرهي آزمون يا خردهآزمون را تشكيل ميدهند. |
1- تعيين همبستگي آزمون با ساير آزمونهاي روا 2- تمايز سني 3- تحليل عوامل 4- همساني دروني |
نخستين عاملي كه ميتواند بر روايي آزمون تأثير بگذارد، دستورالعمل يا راهنماي آزمون است. راهنماهايي كه دقيقاً به آزمونشوندگان نميگويند چگونه به سؤالها پاسخ دهند و چگونه پاسخ خود را ثبت نمايند، سطح روايي آزمون را كاهش ميدهند.
عامل ديگر، كيفيت سؤالهاي آزمون است. سؤالهايي كه طبق قواعد درست سؤال نويسي تهيه شده باشند، به روايي آزمون ميافزايند. علاوه بر اين، هر سؤالي كه از هدف اصلي آزمون جدا ميافتد و چيزي جدا از آن را شامل ميشود نيز، به سهم خود از روايي كل آزمون ميكاهد. همچنين، واژگان و جملهبندي پيچيده كه از حد درك آزمونشوندگان فراتر باشد، روايي آزمون را كاهش ميدهد. ترتيب قرار گرفتن سؤالهاي آزمون، تنوع درجهي دشواري و بالا بردن تعداد سؤالات آزمون نيز، بر افزايش روايي آزمون مؤثر است.
اجراي نامناسب آزمون، كمبود زمان، فضاي نامناسب، مكان نامناسب و مانند اينها از عوامل اجرايي هستند كه بر عملكرد آزمونشوندگان و درنتيجه بر روايي آزمون تأثير نامطلوبي دارند. علاوه بر اينها، اشكالات موجود در تصحيح پاسخهاي آزمونشوندگان و نمرهگذاري آنها، بهويژه در آزمونهاي تشريحي از روايي آزمون ميكاهد.
عامل ديگر، تركيب آزمونشوندگان از لحاظ توانايي مورد اندازهگيري است. هرچه اين تركيب، نامتجانستر باشد، روايي آزمون بيشتر خواهد بود. ويژگيهاي رواني آزمونشوندگان نيز ميتواند بر روايي نمرات حاصل از يك آزمون تأثير داشته باشد.
پاياييِ[3] يك وسيلهي اندازهگيري عمدتاً به دقت نتايج حاصل از آن اشاره ميكند. پايايي به دقت، اعتمادپذيري، ثبات يا تكرارپذيري نتايج آزمون اشاره ميكند. رابطهي بين روايي و پايايي از اين قرار است كه يك آزمون بايد پايا باشد تا بتواند روا باشد. اگر آزموني در هر بار اجرا بر تعدادي دانشآموز نتايج مختلفي بهدست دهد، پايا نخواهد بود و درواقع هيچ چيز را به درستي اندازه نخواهد گرفت. و اگر يك آزمون چيزي را به درستي اندازهگيري نكند، هيچ اطلاعات مفيدي به ما نخواهد داد. بهطور خلاصه، پايايي شرطِ روايي است، امايي روايي براي پايايي ضروري نيست.
منابع:
سيف، علياكبر – اندازهگيري، سنجش و ارزشيابي آموزشي – ويرايش سوم: زمستان 1382 – تهران، نشر دوران.
سيف، علياكبر- روانشناسي پرورشي: روانشناسي يادگيري و آموزش – ويرايش سوم: 1380 – تهران، انتشارات آگاه
Dick, Walter & Hagesty, N. (1971). Topics in measurement. New York: McGraw – Hill.
Payne, D.A. (1994). Designing educational projects and programs evaluation. Boston, MA: Kluuer.
Linn, R., & Gronlund, N. (2000). Measurement and assessment in teaching (8th ed.) Upper Saddle River, NJ: Merrill/Prentice-Hall.