أثر إحصائي المطابقة وأقصى معلومات والخطأ المعياري في تقدير الصعوبة على الأداء التفاضلي للفقرة باستخدام النموذج الثلاثي المعلم 3PLM
https://doi.org/10.53285/artsep.v6i4.2267الكلمات المفتاحية:
النموذج الثلاثي المعلم ((3PLM، الأداء التفاضلي للفقرة، إحصائي المطابقة، أقصى معلومات، الخطأ المعياري في تقدير صعوبة الفقرةالملخص
هدفت الدراسة إلى تقصي أثر إحصائي المطابقة وأقصى معلومات والخطأ المعياري في تقدير الصعوبة باستخدام النموذج الثلاثي المعلم ((3PLM على الأداء التفاضلي للفقرة، باستخدام طريقة نسبة الأَرْجَحِية (Likelihood-Ratio)في نظرية الاستجابة للفقرة، باستخدام المنهج الوصفي التحليلي الارتباطي، على عينة تكونت من (2245) طالباً وطالبةً بالمرحلة الثانوية في محافظة ذمار، تم اختيارهم بالطريقة الطبقية العشوائية، على اختبار كاتل للذكاء "المقياس الثالث الصورة (أ)"، تم التحقق من افتراضات نظرية الاستجابة للفقرة، وتم استخراج معالم الفقرات بالنموذج الثلاثي ((3PLM لمتغيرات الدراسة المقاسة ببرنامج Xcalibre، وإحصائي الأداء التفاضلي (DIF Statistic) بطريقة نسبة الأَرْجَحِية (Likelihood-Ratio) باستخدام برنامج IRTLRDIF))، وتم استخدام معامل ارتباط إيتا(Eta) ، والانحدار اللوجستي الثنائي (Binary Logistic) ، باستخدام برنامج (SPSS.V24)، وقد توصلت الدراسة إلى أنه توجد علاقة دالة إِحْصَائِيَاً عند مستوى (.01&.05) بين ظهور مؤشر الأداء التفاضلي للفقرة ومتغيرات الدراسة باستخدام النموذج الثلاثي المعلم ((3PLM، إذ بلغت (.316 - .351 - .201) بالترتيب، وهي معاملات ارتباط طردية ضعيفة ومتوسطة، توجد قدرة تنبؤية لمتغير أقصى معلومات للفقرة، فيما لا توجد قدرة تنبؤية لمتغيري إحصائي المطابقة والخطأ المعياري في تقدير صعوبة الفقرة، بالأداء التفاضلي للفقرة بطريقة نسبة الأَرْجَحِية Likelihood-Ratio)) في نظرية الاستجابة للفقرة.
أولاً: المراجع العربية:
بني عطا، زايد صالح إبراهيم (2018). أثر القيم المتطرفة على الأداء التفاضلي لفقرات اختبار الرياضيات في الدراسة الدولية تيمس تبعاً لمتغير الجنس، العلوم التربوية، 45، 157-176.
بيكر، فرانك (2010). أسس نظرية الاستجابة للفقرة. (الطريري، عبد الرحمن؛ أبو هاشم، السيد؛ شلبي، سوسن، مترجمون) دار جامعة الملك سعود للنشر (الكتاب الأصلي منشور Baker, B 2001).
تيغزة، أمحمد بوزيان (2009). نظرية الصدق الحديثة ومتضمناتها التطويرية لواقع القياس، ندوة علم النفس والتنمية الفردية والمجتمعية، جامعة الملك سعود 1430ه.
أبو حطب، فؤاد عبد اللطيف؛ صادق، آمال مختار (2005). اختبار كاتل للعامل العام، مقياس الذكاء المتحرر من أثر الثقافة "المقياس الثالث الصورة (أ). مكتبة الأنجلو المصرية.
دي إيالا، أر جي (2017). النظرية والتطبيق في نظرية الاستجابة للفقرة. (الكيلاني، عبد الله؛ البرصان، إسماعيل، المترجمان). دار جامعة الملك سعود للنشر (الكتاب الأصلي منشور. Ayala, 2009) )
صالح، عامر مهدي. (2022). أثر حجم العينة في الأداء التفاضلي للمفردة على وفق أنموذج ثلاثي المعلم. مجلة الجامعة العراقية، 55 (3)، 564-580.
ضعضع، هبة عبد اللطيف. (2023). أثر اختلاف نموذج الاستجابة للفقرة (1PL,2PL,3PL) في الإداء التفاضلي للفقرة. مجلة الاستاذ للعلوم الانسانية والاجتماعية. 62(1)، 23-45.
العبد الله، زياد أحمد. (2022). أثر حجم العينة في الأداء التفاضلي للفقرة وفقا لنظرية الاستجابة للفقرة. مجلة البحوث التربوية والنفسية، 19(72)، 119-143.
عبد الوهاب، محمد محمود (2014). الكشف عن الأداء التفاضلي على فقرات مقياس أساليب المعاملة الوالدية بين الآباء والأمهات وبين الأبناء من الجنسين. دراسات عربية في التربية وعلم النفس، 45(4)، 155-178.
أبو علام، رجاء محمود. (2011). مناهج البحث في العلوم النفسية والتربوية، دار النشر للجامعات.
علي، سعدي أحمد وعيال، ياسين حميد. (2021). تأثير اختلاف مستوى القدرة في الأداء التفاضلي وفقاً للأنموذج ثنائي المعلم لنظرية الاستجابة للفقرة. مجلة الآداب،1(138)، 137-162.
قيلي ح. (2020). التنبؤ العلمي. مجلة الحكمة للدراسات الفلسفية، 8(2)، 70-87.
كروكر، والجينا (2017). مدخل إلى نظرية القياس التقليدية والمعاصرة (الحموري، هند؛ دعنا، زينات، المترجمتان). دار الفكر ناشرون وموزعون، ط1، (الكتاب الأصلي منشور (Crocker, L., & Algina, J, 1986) .
المحروقية، زينب بنت محمد بن حمود، عمارة، إيهاب محمد نجيب، وابن كاظم علي بن مهدي. (2024) الأداء التفاضلي لمفردات اختبار الرياضيات للصفين الرابع والثامن في الدراسة الدولية TIMSS 2019 تبعاً المتغير الجنس في سلطنة عمان (رسالة ماجستير غير منشورة). جامعة السلطان قابوس
مكتب التربية والتعليم بمحافظة ذمار (2019). إحصائيات طلبة المرحلة الثانوية، إدارة الإحصاء.
نتكو، أنثوني؛ بروكهارت، سوزان. (2018). التقويم التربوي للطلبة (ترجمة علي القرني وآخرين)، مكتب التربية العربي لدول الخليج (الكتاب الأصلي منشور (Anthony J.at all, 2007).
النفيعي، عبد الرحمن عبد الله (2008). مقارنة فاعلية عدد من الطرق الإحصائية للكشف عن الأداء
التفاضلي لفقرات الاختبارات وأثر ذلك على الخطأ المعياري من النوع الأول وقوة الاختبار. ] رسالة دكتوراه غير منشورة [. جامعة أم القرى.
ثانياً: المراجع الأجنبية:
American Educational Research Association, American Psychological Association & National Council on Measurement in Education. (2014). Standards for educational and psychological testing. American Psychological Association.
Cains, J.;Bridglall, B.;& Chatterji,M. (2014).Understanding validity and fairness issues in high-stakes individual testing situations. Quality Assurance in Education ,22(1),5-18.
Camili, G & Shepard, L.A.(1994). Methods for identifying biased test items. Thousand Oaks, CA: Sage Publication
Edward, H. (2010). Interpretation of the Three-Parameter Testlet Response Model and Information Function. Applied Psychological Measurement, 34 (7): pp467-482. https://doi.org/10.1177/0146621610364975
Ellis, B. B., & Raju, N. S. (2004). Test and item bias: what they are, what aren’t, and how to detect them: measuring up. In J. Wall and G. Walz (Eds.), Measuring Up: Assessment Issues for Teachers, Counselors, and Administrators (pp. 89-98). Greensboro: CAPS Press.
Greer, T. G. (2004). Detection of diff erential item functioning (DIF) on the SATV: Acomparison of four methods: Mantel-Haenszel, logistic regression, simultaneous item bias and likelihood ratio test. Unpublished doctoral dissertation, University of Houston.
Gruijter, D. and Kamp, L. (2005). Statistical Test Theory for Education and Psychology, Retrieved December 30, 2005.
Hambleton R., Jones, R. (1993), Comparison of classical test theory and item response theory and their applications to test development, NCME items: The Instructional topics in educational measurement series, Educational Measurement: Issues and Practice, Module 16.
Hambleton, R. & Murray. L. (1983). Some goodness of fit investigations for response models. In R.K. Hambleton (ED.), Applications of item response theory (PP. 71-94). Vancouver, British Columbia.
Hambleton, R., & Swaminathan, H. (1985). Item response theory, principles and applications. Kluwer -Nijhoff, USA.
Hambleton, R., Swaminathan, H. (2010). Item Response Theory. Principles and Application. Boston: Kluwer-Nigh off Publishing.
Hambleton, R., Swaminthan, H., & Rogers, J. (1991). Fundamentals of item response theory. Newbury park: Sage publications.
Karami, H. (2011). Detecting Gender Bias in A Language Proficiency Test. International Journal of Language Studies, 5:2,27-38.
Lai, H., & Krishnan, V. (2013). Applications of Differential Item Functioning (DIF) and Natural Language Processing (NLP) on Alberta’s Early Child Development Instrument (EDI) data, Early Childhood Mapping (ECMap) Project, Community-University Partnership (CUP), Faculty of Extension, University of Alberta, Edmonton, Alberta, Canada.
Lord, F. (1980). Application of Item Response Theory to Practical Testing Problems. NJ: Lawrence Erlbaum. Google Scholar
Maller, S. J. (2003). Best practices in detecting bias in nonverbal tests. In Handbook of nonverbal assessment (pp. 23-47). Boston, MA: Springer US.
McDonald, R. P. (1978). Generalizability in factorable domains: Domain validity and generalizability. Educational and Psychological Measurement, 38, 75–79.
McDonald, R. P. (1999). Test theory: A unified treatment. Mahwah, NJ: Lawrence Erlbaum.
Petersen,M.A Groenvold, M, Bjorner, J.B, Aaronson, N, Conroy, T, Cull, A, Fayers, P, Hjermstad, M, Sprangers, M and Sullivan, M, (2003). Use of differential item functioning analysis to assess the equivalence of translations of a questionnaire. Quality of Life Research 12: 373–385.
Raju, N. S. (1988). The area between two item characteristic curves. Psychometrika, 53(4), 495-502. https://doi.org/10.1007/BF02294403
Reise, S. P., & Waller (1990). Fitting the two-parameter model to personality data. Applied Psychological Measurement, 14, 45—58
Rose, B. Bjorner, J. Becker, F. Friesc, E. (2008). Evaluation of A Preliminary Physical Function Item Bank Supported the Expected Advantages of the Patient-Reported Outcomes Measurement Information System (Promise), Journal of clinical Epidemiology, 61, 17–33. https://doi.org/10.1016/j.jclinepi.2006.06.025
Roussos, L. A., & Stout, W. F. (1996). Simulation studies of the effects of small sample size and studied item parameters on SIBTEST and Mantel-Haenszel Type I error performance. Journal of Educational Measurement, 33(2), 215–230. https://doi.org/10.1111/j.1745-3984.1996.tb00490.x
Samejima, F. (1969). Estimation of ability using a response pattern of graded scores. Psychometrika Monograph, 17
Samejima, F. (1997). Graded response model. In W. J. van der Linden & R. K. Hambleton (Eds.), Handbook of modern item response theory. 85–100. New York: Springer.
Siang C. & Fritz D.(2006). How Big Is Big Enough? Sample Size Requirements for CAST Item Parameter Estimation, Applied Psychological Measurement, 19(3):pp 241- 255.
Sideridis, g and Tsaousis, I, (2013a). DIF Analysis for Item and Test on the NCA Tests The General Ability Test (GAT) Art Major. National Center for Assessment in Higher Education. TR035-2013.
Stevens, J.P. (2009). Applied multivariate statistics for the social sciences. New York: Taylor & Francis.
Thissen, D. (2001). IRTLRDIF v.2.0b: Software for the computation of the statistics involved in item response theory likelihood-ratio tests for differential item functioning. University of North Carolina at Chapel Hill.
Warm, A. (1978). A primer of Item Response Theory: US. Coast Guard Institute Oklahoma, 73/69.
Wiberg, M. (2007). Measuring and detecting differential item functioning in criterion-referenced licensing test: A theoretic comparison of methods. EM No 60. Retreived August 20, 2017. from.www.edusci.umuse/digitalAssets/159/59534-emno -60.
