Trả lời PV Thanh Niên, PGS-TS Nguyễn Phương Nga (ảnh), Giám đốc Trung tâm kiểm định chất lượng giáo dục (thuộc Hiệp hội Các trường ĐH, CĐ VN), với mức độ ứng dụng khoa học đo lường giáo dục hiện đại để làm đề thi trắc nghiệm như hiện nay sẽ có sự tương đồng về độ khó giữa các đề thi.

Dam bao do kho cua moi de thi nhu nhau - Anh 1

Năm 2017, mỗi thí sinh trong phòng thi có đề thi riêng

Dam bao do kho cua moi de thi nhu nhau - Anh 2

Ảnh: Thùy Linh

PGS Nguyễn Phương Nga nói: Theo Bộ GD-ĐT, đề thi các môn trắc nghiệm kỳ thi THPT quốc gia 2017 sẽ khai thác có chọn lọc ngân hàng câu hỏi của ĐH Quốc gia Hà Nội và tiếp tục bổ sung để có số lượng câu hỏi đủ lớn, đáp ứng mục tiêu cá nhân hóa đề thi, nghĩa là mỗi thí sinh trong phòng thi có một đề thi riêng. Việc xây dựng câu hỏi sẽ theo hướng chuẩn hóa, giống như cách mà ĐH Quốc gia Hà Nội đã làm khi xây dựng ngân hàng câu hỏi thi kỳ thi đánh giá năng lực mà họ tổ chức các năm 2015, 2016.

Với trình độ ứng dụng khoa học đo lường giáo dục ở nước ta như hiện nay, tôi tin rằng Bộ GD-ĐT hoàn toàn có thể tổ chức một kỳ thi bằng phương thức trắc nghiệm mà đề thi đã được chuẩn hóa.

Có phần mềm đánh giá độ khó, dễ từng câu hỏi

Thưa bà, vậy quy trình làm một đề thi chuẩn hóa là như thế nào? Căn cứ vào đâu để giới chuyên môn có thể tin được rằng độ khó của các đề thi là thực sự tương đương chứ không phải vì đó chỉ là một mong muốn của Bộ?

Theo quy trình làm đề thi hiện đại, trước hết Bộ đã phải xây dựng ma trận đề thi chung, rồi mỗi môn học với mỗi kỳ thi sẽ lại có ma trận đề thi riêng. Khi xây dựng ma trận, nhóm chuyên gia sẽ xác định số lượng câu hỏi cho một đề thi, mức độ khó (dễ, hơi dễ, hơi khó, khó, rất khó) của đề. Người viết câu hỏi (là các thầy cô giáo hoặc các nhà chuyên môn) sẽ dựa vào ma trận để quyết định hỏi kiến thức gì, ở phần nào, bao nhiêu câu hỏi. Dựa vào từng mục của chương trình mà học sinh đã được học, họ sẽ soạn ra nhiều câu hỏi, thao tác này để đo cùng mảng kiến thức đó nhưng ở dưới hình thức nhiều câu hỏi khác nhau.

Sau khi đã soạn xong câu hỏi cho một chương (hoặc một phần, một môn), nhóm giáo viên làm đề thi của từng môn đó sẽ ngồi cùng nhau để phân tích từng câu hỏi và xem độ khó của chúng đã tương đương nhau chưa. Bước tiếp theo là họ đem câu hỏi để thử nghiệm trực tiếp với người học. Sau bước thử nghiệm, sẽ có một nhóm chuyên gia khác nhập câu hỏi vào phần mềm chuyên dụng để đánh giá độ khó dễ và độ tin cậy từng câu hỏi. Sau khi chạy phần mềm, các chuyên gia căn cứ vào các con số để “đọc” ra được những câu hỏi nào nên bỏ.

Căn cứ vào kết quả phân tích của phần mềm, người tạo đề thi lựa chọn các câu hỏi đo cùng độ khó dễ, cùng kiến thức kỹ năng cho vào một ô (tức là một cái kho). Sẽ có rất nhiều ô như thế. Mỗi ô sẽ chứa rất nhiều câu hỏi có cùng độ khó. Khi làm đề, phần mềm sẽ nhặt ra mỗi ô từ một đến một số câu hỏi theo phương pháp ngẫu nhiên. Từ đó máy sẽ chạy một lúc ra một loạt đề với độ khó tương đương nhau. Như vậy, độ khó của đề không phải được áp đặt bởi ý muốn chủ quan của con người mà đã được mô hình hóa bằng thuật toán.

Hai thành phần độc lập tham gia ra đề thi

Theo bà, lực lượng chuyên môn ở VN liệu có sử dụng thành thạo công cụ phân tích đánh giá câu hỏi trong quá trình chuẩn hóa các câu hỏi đó?

Lực lượng tham gia sẽ gồm 2 thành phần: người ra câu hỏi và đưa câu hỏi đi thử nghiệm, người phân tích đề thi. Thành phần thứ nhất là các thầy cô giáo bộ môn, những người có trình độ chuyên môn liên quan tới môn học được hỏi thi. Thành phần thứ hai là những người được đào tạo về khoa học đo lường giáo dục. Họ không xem nội dung đề thi mà chỉ nhập nó vào phần mềm chuyên dụng để phân tích. Họ sẽ làm việc căn cứ hoàn toàn vào các con số, kết quả cũng là các con số. Nhưng vì có chuyên môn về khoa học đo lường giáo dục mà họ “đọc” được ý nghĩa của các con số ấy, câu này câu kia bị lỗi gì, từ đó trao đổi lại với các thầy cô ra câu hỏi để họ chỉnh sửa. Câu nào tốt thì lấy.

Hiện nay, chúng ta có một đội ngũ làm khoa học đo lường giáo dục khá đông. Trong đó tiến sĩ được đào tạo ở nước ngoài là hơn chục người, thạc sĩ thì nhiều hơn. Ngay tại Cục Khảo thí và kiểm định chất lượng giáo dục, Bộ GD-ĐT cũng có nhiều người là chuyên gia khoa học đo lường giáo dục. Nếu Bộ biết sử dụng lực lượng này, tôi tin rằng việc xây dựng một ngân hàng câu hỏi chuẩn hóa phục vụ cho kỳ thi THPT quốc gia 2017, trong đó đề thi các môn trắc nghiệm được cá nhân hóa trong phạm vi phòng thi, mà các đề thi có độ khó tương đương, là một kế hoạch khả thi của Bộ GD-ĐT.

Quý Hiên
(thực hiện)