Áp dụng lý thuyết ứng đáp câu hỏi đa chiều vào đo lường và đánh giá đề thi anh văn cuối kỳ

Các tác giả

  • Thị Hà Đỗ Trường Đại học Sư phạm Kỹ thuật TP.HCM, Việt Nam

Email tác giả liên hệ:

hadt@hcmute.edu.vn

Từ khóa:

Lý thuyết ứng đáp câu hỏi đa chiều, mô hình Rasch Testlet, phân tích nhân tố, phần mềm R

Tóm tắt

Bài báo nghiên cứu ứng dụng của lý thuyết ứng đáp câu hỏi đa chiều (MIRT) vào đo lường và đánh giá đề thi trắc nghiệm môn Tiếng Anh. Dữ liệu trong bài báo được thu thập từ bài thi cuối kỳ môn Anh Văn 2 dành cho sinh viên không chuyên tại trường Đại học Sư phạm Kỹ thuật Tp. HCM. Trước tiên, mô hình Rasch Testlet được dùng để kiểm tra tính đa chiều của đề thi. Tiếp theo, phân tích nhân tố (FA) được sử dụng để xác định số chiều cần đo. Độ khó và độ phân biệt của mỗi câu hỏi trong đề thi được ước lượng bằng mô hình MIRT 2 tham số. Việc xử lý dữ liệu được thực hiện bằng gói lệnh “mirt” của phần mềm R. Kết quả của bài báo cung cấp thông tin hữu ích cho giáo viên trong việc điều chỉnh phương pháp đánh giá.

Tải xuống: 0

Dữ liệu tải xuống chưa có sẵn.

Tài liệu tham khảo

Alderson, J. C., & Banerjee, E. (2002). Language testing and assessment. Language Testing, 35, 79-113.

Baker, F. (2001). The basic of item response theory. USA: ERIC Clearinghouse on Assessment and Evaluation.

Bechger, T.M., Maris, G., Verstralen, H.H.F.M., & Beguin, A.A. (2003). Using classical test theory in combination with item response theory. Applied Psychological Measurement, 27(5), 319-334.

Camilli, G., & Shepard, L.A. (1994). Methods for identifying biased test items (Vol. 4). Thousand Oaks, CA: Sage.

Embretson, S. E., &Reise, S. P. (2000). Item response theory for psychologists. Mahwah, NJ: Lawrence Erlbaum.

Guttman, L. (1954). Some necessary conditions for common-factor analysis. Psychometrika, 19, 149–161.

Hambleton, R. K., &Swaminathan, H. (1985). Item Response Theory: Principles and Applications. USA: Kluwer-Nijhoff Publishing.

Hasmy, A. (2014). Compare unidimensional & multidimensional Rasch model for test with multidimensional construct and items local dependence. Journal of Education and Learning, 8(3), 187-194.

Henning, G. (1987). A guide to language testing. Cambridge, Mass.: Newbury House.

Heydari, P., Bagheri, M. S., Zamanian, M., Sadighi, F., & Yarmohammadi, L. (2014). Investigating the construct validity of "Structure and Written Expression" section of TOLIMO through IRT. International Journal of Language Learning and Applied Linguistics World, 5(2), 105-123.

Kaiser, H. F. (1958). The Varimax criterion for analytic rotation in factor analysis. Psychometrika, 23(3), 187-200.

Kaiser, H. F. (1960). The application of electronic computers to factor analysis. Educational and Psychology Measurement, 34, 111–117.

Li, Y., Jiao, H., &Lissitz, R. W. (2012). Applying multidimensional item response theory models in validating test dimensionality: An example of K-12 large-scale science assessment. Journal of Applied Testing Technology, 13(2), 1-27.

McNamara, T. F. (1991). Test dimensionality: IRT analysis of an ESP listening test. Language Testing, 8(2), 139-159.

Reckase, M. D. (2009). Multidimensional item response theory. New York: Springer.

Schedl, M., Gordon, A., Carey, P. A., & Tang, K. L. (1996). An analysis of the dimensionality of TOEFL reading comprehension items (TOEFL Research Report No. 53). Princeton, NJ: ETS.

Wainer, H., Bradlow, E. T., & Wang, X. (2007). Testlet response theory and its applications. Cambridge: Cambridge University Press.

Wainer, H., & Wang, X. (2000). Using a new statistical model for testlets to score TOEFL. Journal of Educational Measurement, 37, 203–220.

Walt, J., &Steyn, F. (2008). The validation of language tests. Linguistics, 38, 191-204.

Wang, W. C., & Wilson, M. R. (2005). The RaschTestlet model. Applied Psychological Measurement, 29, 126–149.

Wilson, K. M. (2000). An exploratory dimensionality assessment of the TOEIC test (Research Report No. 14). Princeton, NJ: ETS.

Tải xuống

Đã Xuất bản

2016-06-28

Cách trích dẫn

[1]
T. H. Đỗ, “Áp dụng lý thuyết ứng đáp câu hỏi đa chiều vào đo lường và đánh giá đề thi anh văn cuối kỳ”, JTE, vol 11, số p.h 2, tr 103–110, tháng 6 2016.

Số

Chuyên mục

Bài báo khoa học

Categories