Đỗ Huyền My
(Sagittarius)
Điều hành viên
Tuyển sinh đại học 2002: Những con số biết nói
Bài viết của GS Phạm Duy Hiển
(Nguyên Viện phó Viện Năng lượng nguyên tử quốc gia, kiêm Viện trưởng Viện nghiên cứu hạt nhân Đà Lạt), email: [email protected])
Lần đầu tiên toàn bộ điểm thi tuyển sinh ĐH-CĐ đã được công bố trên các phương tiện thông tin đại chúng. Tôi không thấy bị sốc như một số hàng tít trên báo chí. Chuyện chất lượng học sinh ta quá thấp không cần phải đợi đến kết quả tuyển sinh vừa qua mới rõ. Nhưng tôi lại bị lôi cuốn bởi cái hình phân bố điểm tuyển sinh (các quả trám đỏ trên hình thứ nhất). Nó trơn tru như một đồ thị toán học. Một quy luật thống kê nào đó đằng sau lượng thông tin đồ sộ từ 824.413 thí sinh, lúc ẩn lúc hiện, như trêu chọc tính tò mò. Từ đây ta có thể nhận ra cái chân dung đích thực về chất lượng học sinh, thầy giáo, cách học, cách dạy, v.v... để làm xuất phát điểm cho một cuộc cải cách giáo dục nghiêm túc. Kể cũng oan khi ai đó đã trút hết bực bội lên những người thiết kế lần tuyển sinh này. Họ đã có công lần đầu tiên đưa ra một lượng thông tin đồ sộ và chân thật để từ đó chúng ta có thể tự nhận biết mình là ai.
Nhưng điểm tuyển sinh, cho dù đã được sơ bộ tập hợp lại thành một hình phân bố, vẫn chỉ là những thông tin hay dữ liệu thô. Chúng chưa được mô tả theo ngôn ngữ thống kê học, chưa chỉ ra những quy luật chi phối chất lượng học sinh trong toàn quốc. Thông tin chưa phải là tri thức mà chỉ nằm ở nấc thang dưới cùng của "tháp tri thức". Thông tin có thể lưu trữ và truyền tải từ máy tính này sang máy khác, nhưng không ai có thể nhét tất cả lượng thông tin từ hơn 800.000 thí sinh đó vào bộ óc của mình. Thế cho nên để nói lên tâm trạng nhức nhối về kết quả tuyển sinh báo chí đành phải theo phương pháp liệt kê, nào là có đến 275.987 thí sinh đạt từ 5 điểm trở xuống (41,2%), 21.479 thí sinh chỉ đạt trung bình mỗi môn nửa điểm, 125 thí sinh không đạt điểm nào chung cho cả ba môn v.v… Tuy những con số đó có gây ấn tượng, nhưng cứ liệt kê mãi như thế thì đến bao giờ mới mô tả hết các kết quả tuyển sinh? Vì thế để có một bức tranh tổng quát, rồi từ đó tiến lên hoạch định chính sách, trước hết phải xử lý thông tin, "tóm tắt" chúng lại thành một số quy luật, nhằm dễ dàng truyền tải vào bộ óc con người, mà vẫn phản ánh tương đối đầy đủ toàn bộ lượng thông tin đồ sộ đó. Thí dụ để mô tả kết quả tuyển sinh ta chỉ cần tìm một hàm phân bố điểm thi P(x, a, b), trong đó x là điểm thi, a và b là hai thông số diễn tả dáng dấp của hàm phân bố đó. Như vậy điểm thi của 824.413 thí sinh được thu gọn lại thành ba thông tin "bậc cao hơn": P là hàm gì, a và b bằng bao nhiêu?
Trong phiếu đăng ký tuyển sinh chắc chắn còn có nhiều thông tin khác, nhờ đó người ta có thể giải đoán liệu điểm thi cao hay thấp có liên quan gì đến các đặc điểm của thí sinh như địa phương, nghề nghiệp, thu nhập của bố mẹ, tình trạng sức khoẻ, nam hay nữ, nguyện vọng ngành học v.v... Một số kỹ thuật thống kê học sẽ giúp ta làm việc đó. Nếu năm nào các kết quả tuyển sinh cũng đều được tập hợp và xử lý theo một quy trình nhất quán như thế ta sẽ dễ dàng theo dõi quá trình phát triển của giáo dục, đề xuất các chủ trương chính sách thích hợp và đánh giá tác động của chúng.
Lấy mẫu đại diện (sampling) cho cả cộng đồng (population) để đưa ra các dữ liệu thô, mô tả chúng và tìm ra các quy luật chi phối cộng đồng là nhiệm vụ của thống kê học, một khoa học chưa được phát triển mấy ở nứơc ta và đôi khi được hiểu đồng nghĩa với công tác thống kê, nghĩa là ghi lại thành bảng số liệu và thực hiện một vài phép tính đơn giản trên các số liệu ấy. Thật ra, thống kê học được dịch ra từ chữ statistics, bắt nguồn từ chữ state là quốc gia, nên ngay từ đầu nó đồng nghĩa với khoa học quản lý nhà nước. Trong nền kinh tế thị trường tự do yếu tố ngẫu nhiên cá thể chi phối các hoạt động kinh doanh tiêu thụ và hành vi con người khiến cho các quy luật kinh tế xã hội mang tính xác suất thống kê. Các quy luật đó không chính xác tuyệt đối như diện tích hình chữ nhật bằng tích số của hai cạnh, mà chỉ có độ tin cậy nhất định, tuy nhiên cũng đủ tin cậy để từ đó có thể cân nhắc ra quyết định. Đặc điểm này khác hẳn với nền kinh tế tập trung bao cấp ở các nước xã hội chủ nghĩa trước đây, nơi mà khoa học thống kê hầu như không có đất dụng võ, nhất là trong các lãnh vực kinh tế và xã hội nhân văn. Do vậy mới có những quyết định duy ý chí.
Khoa học thống kê ngày nay cũng được áp dụng rộng rãi trong hầu hết các ngành khoa học tự nhiên với sự phổ cập của máy tính có khả năng lưu trữ và xử lý những lượng thông tin lớn. Thế kỷ 20 đã chứng kiến một tiến trình thay đổi rất thú vị trong phương pháp nghiên cứu khoa học. Ngay đầu thế kỷ một số học thuyết lớn về cấu trúc vật chất ra đời bằng những công thức rất tổng quát nhưng lại cực kỳ đơn giản và chính xác, như công thức nổi tiếng của Einstein liên hệ năng lượng (E), khối lượng (m) và vận tốc ánh sáng, E = mc2. Nhưng đã lâu rồi các công thức như thế hoàn toàn vắng bóng. Càng về cuối thế kỷ các công thức giải tích trong vật lý học càng có xu hướng phức tạp hơn, nhưng lại kém tổng quát và chính xác hơn. Có những công thức đăng trên tạp chí khoa học dài đến nửa trang nhưng chỉ gần đúng. Trong khi đó các kỹ thuật mô hình mô phỏng trên máy tính và phương pháp thống kê học ngày càng chiếm ưu thế trong việc cung cấp những tri thức mới.
Trở lại bài toán điểm tuyển sinh để minh hoạ phần nào những ý trên. Được biết các đề thi năm nay có dụng ý nhắm vào đối tượng trung bình, theo sát sách giáo khoa. Do đó, chúng ta ắt phải chờ đợi một hình phân bố có dáng dấp như đường cong chính giữa ở hình thứ hai: số đông thí sinh sẽ tập trung quanh điểm 14-16, ít thí sinh có điểm quá thấp hoặc gần điểm tối đa (30). Nếu đề thi quá dễ (như một số người nhận xét), chắc hẳn hình phân bố phải giống đường cong bên phải: điểm của đa số thí sinh sẽ xô về phía tay phải và trải dài về phía tay trái, số đông thí sinh đạt được điểm cao hơn 15. Trên thực tế, cả hai trường hợp trên đã không xảy ra. Kết quả tuyển sinh giống như đường cong "quá khó": tuyệt đại đa số thí sinh có điểm thi thấp hơn 15, đường phân bố xô về phía tay trái và trải dài về phía tay phải.
Tôi đã thử tìm cách làm khớp (fitting) kết quả tuyển sinh với một số hàm phân bố thống kê phổ dụng dùng phần mềm SPSS thì thấy có bốn phương án hay nhất theo thứ tự tăng dần như sau 1) làm khớp bằng một hàm lognormal, 2) bằng hai hàm lognormal theo tỷ lệ 56% và 44%, 3) bằng một hàm Weibull, 4) bằng hai hàm Weibull theo tỷ lệ 45% và 55%. Phương án cuối cùng chẳng những tốt nhất mà còn tốt hơn hẳn ba phương án kia. Nếu lấy tổng bình phương các sai lệch giữa điểm thi với công thức toán học để làm căn cứ đánh giá kết quả làm khớp thì phương án thứ tư tốt hơn phương án thứ ba 30 lần, phương án thứ hai 40 lần và phương án thứ nhất 700 lần. Cộng hai hàm ấy lại theo tỷ lệ 45%-55% ta có đường làm khớp (đậm nét) nằm khít với các kết quả tuyển sinh, đặc biệt là ở vùng đuôi từ 6 điểm trở lên. E rằng có thể làm phiền một số độc giả nên tôi không viết tường minh các biểu thức toán học ra đây. Chỉ muốn giới thiệu Weibull là nhà vật lý Thuỵ điển, ông tìm ra công thức này để mô tả phân bố thống kê ứng lực đứt gãy trong các phép thử vật liệu. Sau này người ta còn dùng hàm Weibull để mô tả phân bố thời gian sống sót của các bênh nhân ung thư, phân bố hàm lượng các chất gây ô nhiễm khí quyển v.v... Ưu điểm của hàm Weibull là nó uyển chuyển, có thể mô tả các phân bố có dạng rất khác nhau.
Máy tính đã giúp tôi tin rằng chúng ta có hai tốp thí sinh, trình độ nói chung khác hẳn nhau: tốp thứ nhất chiếm 45,5% (375108) với điểm trung bình là 4,9/30 điểm. Tốp thứ hai chiếm 54,5% (449305), nói chung là khá hơn, nhưng cũng chỉ với điểm trung bình là 11,3/30 điểm, vẫn còn thấp hơn so với dự kiến của những người ra đề. Vậy hai tốp đó là những ai? Thành thị và Nông thôn chăng, hay là Nam và Nữ, miền Nam và miền Bắc, khoa học Tự nhiên và Xã hội, nguyện vọng ưu tiên thi vào các trường khó và trường dễ v.v... Trong phiếu tuyển sinh ắt hẳn phải có các đặc điểm đó. Và máy tính lại giúp chúng ta tiếp tục giải mã. Nếu các phương án trên không thấy ứng nghiệm thì có khi điểm thấp hơn chính là thuộc tốp các cô cậu quen lối học tủ. Hoặc một cách lý giải nào khác nữa.
Trên đây chỉ là một trong rất nhiều thí dụ ứng dụng kỹ thuật thống kê. Được biết kỳ tuyển sinh này chẳng những đã tiết kiệm rất nhiều tiền của mà còn mang lại hiệu quả lớn nhờ ứng dụng thành công công nghệ thông tin. Mong sao lượng thông tin đồ sộ đó được khai thác triệt để để ngành giáo dục sớm có biện pháp nâng cao chất lượng giáo dục còn quá thấp kém hiện nay.
Bộ Giáo dục và Đào tạo
Bài viết của GS Phạm Duy Hiển
(Nguyên Viện phó Viện Năng lượng nguyên tử quốc gia, kiêm Viện trưởng Viện nghiên cứu hạt nhân Đà Lạt), email: [email protected])
Lần đầu tiên toàn bộ điểm thi tuyển sinh ĐH-CĐ đã được công bố trên các phương tiện thông tin đại chúng. Tôi không thấy bị sốc như một số hàng tít trên báo chí. Chuyện chất lượng học sinh ta quá thấp không cần phải đợi đến kết quả tuyển sinh vừa qua mới rõ. Nhưng tôi lại bị lôi cuốn bởi cái hình phân bố điểm tuyển sinh (các quả trám đỏ trên hình thứ nhất). Nó trơn tru như một đồ thị toán học. Một quy luật thống kê nào đó đằng sau lượng thông tin đồ sộ từ 824.413 thí sinh, lúc ẩn lúc hiện, như trêu chọc tính tò mò. Từ đây ta có thể nhận ra cái chân dung đích thực về chất lượng học sinh, thầy giáo, cách học, cách dạy, v.v... để làm xuất phát điểm cho một cuộc cải cách giáo dục nghiêm túc. Kể cũng oan khi ai đó đã trút hết bực bội lên những người thiết kế lần tuyển sinh này. Họ đã có công lần đầu tiên đưa ra một lượng thông tin đồ sộ và chân thật để từ đó chúng ta có thể tự nhận biết mình là ai.
Nhưng điểm tuyển sinh, cho dù đã được sơ bộ tập hợp lại thành một hình phân bố, vẫn chỉ là những thông tin hay dữ liệu thô. Chúng chưa được mô tả theo ngôn ngữ thống kê học, chưa chỉ ra những quy luật chi phối chất lượng học sinh trong toàn quốc. Thông tin chưa phải là tri thức mà chỉ nằm ở nấc thang dưới cùng của "tháp tri thức". Thông tin có thể lưu trữ và truyền tải từ máy tính này sang máy khác, nhưng không ai có thể nhét tất cả lượng thông tin từ hơn 800.000 thí sinh đó vào bộ óc của mình. Thế cho nên để nói lên tâm trạng nhức nhối về kết quả tuyển sinh báo chí đành phải theo phương pháp liệt kê, nào là có đến 275.987 thí sinh đạt từ 5 điểm trở xuống (41,2%), 21.479 thí sinh chỉ đạt trung bình mỗi môn nửa điểm, 125 thí sinh không đạt điểm nào chung cho cả ba môn v.v… Tuy những con số đó có gây ấn tượng, nhưng cứ liệt kê mãi như thế thì đến bao giờ mới mô tả hết các kết quả tuyển sinh? Vì thế để có một bức tranh tổng quát, rồi từ đó tiến lên hoạch định chính sách, trước hết phải xử lý thông tin, "tóm tắt" chúng lại thành một số quy luật, nhằm dễ dàng truyền tải vào bộ óc con người, mà vẫn phản ánh tương đối đầy đủ toàn bộ lượng thông tin đồ sộ đó. Thí dụ để mô tả kết quả tuyển sinh ta chỉ cần tìm một hàm phân bố điểm thi P(x, a, b), trong đó x là điểm thi, a và b là hai thông số diễn tả dáng dấp của hàm phân bố đó. Như vậy điểm thi của 824.413 thí sinh được thu gọn lại thành ba thông tin "bậc cao hơn": P là hàm gì, a và b bằng bao nhiêu?
Trong phiếu đăng ký tuyển sinh chắc chắn còn có nhiều thông tin khác, nhờ đó người ta có thể giải đoán liệu điểm thi cao hay thấp có liên quan gì đến các đặc điểm của thí sinh như địa phương, nghề nghiệp, thu nhập của bố mẹ, tình trạng sức khoẻ, nam hay nữ, nguyện vọng ngành học v.v... Một số kỹ thuật thống kê học sẽ giúp ta làm việc đó. Nếu năm nào các kết quả tuyển sinh cũng đều được tập hợp và xử lý theo một quy trình nhất quán như thế ta sẽ dễ dàng theo dõi quá trình phát triển của giáo dục, đề xuất các chủ trương chính sách thích hợp và đánh giá tác động của chúng.
Lấy mẫu đại diện (sampling) cho cả cộng đồng (population) để đưa ra các dữ liệu thô, mô tả chúng và tìm ra các quy luật chi phối cộng đồng là nhiệm vụ của thống kê học, một khoa học chưa được phát triển mấy ở nứơc ta và đôi khi được hiểu đồng nghĩa với công tác thống kê, nghĩa là ghi lại thành bảng số liệu và thực hiện một vài phép tính đơn giản trên các số liệu ấy. Thật ra, thống kê học được dịch ra từ chữ statistics, bắt nguồn từ chữ state là quốc gia, nên ngay từ đầu nó đồng nghĩa với khoa học quản lý nhà nước. Trong nền kinh tế thị trường tự do yếu tố ngẫu nhiên cá thể chi phối các hoạt động kinh doanh tiêu thụ và hành vi con người khiến cho các quy luật kinh tế xã hội mang tính xác suất thống kê. Các quy luật đó không chính xác tuyệt đối như diện tích hình chữ nhật bằng tích số của hai cạnh, mà chỉ có độ tin cậy nhất định, tuy nhiên cũng đủ tin cậy để từ đó có thể cân nhắc ra quyết định. Đặc điểm này khác hẳn với nền kinh tế tập trung bao cấp ở các nước xã hội chủ nghĩa trước đây, nơi mà khoa học thống kê hầu như không có đất dụng võ, nhất là trong các lãnh vực kinh tế và xã hội nhân văn. Do vậy mới có những quyết định duy ý chí.
Khoa học thống kê ngày nay cũng được áp dụng rộng rãi trong hầu hết các ngành khoa học tự nhiên với sự phổ cập của máy tính có khả năng lưu trữ và xử lý những lượng thông tin lớn. Thế kỷ 20 đã chứng kiến một tiến trình thay đổi rất thú vị trong phương pháp nghiên cứu khoa học. Ngay đầu thế kỷ một số học thuyết lớn về cấu trúc vật chất ra đời bằng những công thức rất tổng quát nhưng lại cực kỳ đơn giản và chính xác, như công thức nổi tiếng của Einstein liên hệ năng lượng (E), khối lượng (m) và vận tốc ánh sáng, E = mc2. Nhưng đã lâu rồi các công thức như thế hoàn toàn vắng bóng. Càng về cuối thế kỷ các công thức giải tích trong vật lý học càng có xu hướng phức tạp hơn, nhưng lại kém tổng quát và chính xác hơn. Có những công thức đăng trên tạp chí khoa học dài đến nửa trang nhưng chỉ gần đúng. Trong khi đó các kỹ thuật mô hình mô phỏng trên máy tính và phương pháp thống kê học ngày càng chiếm ưu thế trong việc cung cấp những tri thức mới.
Trở lại bài toán điểm tuyển sinh để minh hoạ phần nào những ý trên. Được biết các đề thi năm nay có dụng ý nhắm vào đối tượng trung bình, theo sát sách giáo khoa. Do đó, chúng ta ắt phải chờ đợi một hình phân bố có dáng dấp như đường cong chính giữa ở hình thứ hai: số đông thí sinh sẽ tập trung quanh điểm 14-16, ít thí sinh có điểm quá thấp hoặc gần điểm tối đa (30). Nếu đề thi quá dễ (như một số người nhận xét), chắc hẳn hình phân bố phải giống đường cong bên phải: điểm của đa số thí sinh sẽ xô về phía tay phải và trải dài về phía tay trái, số đông thí sinh đạt được điểm cao hơn 15. Trên thực tế, cả hai trường hợp trên đã không xảy ra. Kết quả tuyển sinh giống như đường cong "quá khó": tuyệt đại đa số thí sinh có điểm thi thấp hơn 15, đường phân bố xô về phía tay trái và trải dài về phía tay phải.
Tôi đã thử tìm cách làm khớp (fitting) kết quả tuyển sinh với một số hàm phân bố thống kê phổ dụng dùng phần mềm SPSS thì thấy có bốn phương án hay nhất theo thứ tự tăng dần như sau 1) làm khớp bằng một hàm lognormal, 2) bằng hai hàm lognormal theo tỷ lệ 56% và 44%, 3) bằng một hàm Weibull, 4) bằng hai hàm Weibull theo tỷ lệ 45% và 55%. Phương án cuối cùng chẳng những tốt nhất mà còn tốt hơn hẳn ba phương án kia. Nếu lấy tổng bình phương các sai lệch giữa điểm thi với công thức toán học để làm căn cứ đánh giá kết quả làm khớp thì phương án thứ tư tốt hơn phương án thứ ba 30 lần, phương án thứ hai 40 lần và phương án thứ nhất 700 lần. Cộng hai hàm ấy lại theo tỷ lệ 45%-55% ta có đường làm khớp (đậm nét) nằm khít với các kết quả tuyển sinh, đặc biệt là ở vùng đuôi từ 6 điểm trở lên. E rằng có thể làm phiền một số độc giả nên tôi không viết tường minh các biểu thức toán học ra đây. Chỉ muốn giới thiệu Weibull là nhà vật lý Thuỵ điển, ông tìm ra công thức này để mô tả phân bố thống kê ứng lực đứt gãy trong các phép thử vật liệu. Sau này người ta còn dùng hàm Weibull để mô tả phân bố thời gian sống sót của các bênh nhân ung thư, phân bố hàm lượng các chất gây ô nhiễm khí quyển v.v... Ưu điểm của hàm Weibull là nó uyển chuyển, có thể mô tả các phân bố có dạng rất khác nhau.
Máy tính đã giúp tôi tin rằng chúng ta có hai tốp thí sinh, trình độ nói chung khác hẳn nhau: tốp thứ nhất chiếm 45,5% (375108) với điểm trung bình là 4,9/30 điểm. Tốp thứ hai chiếm 54,5% (449305), nói chung là khá hơn, nhưng cũng chỉ với điểm trung bình là 11,3/30 điểm, vẫn còn thấp hơn so với dự kiến của những người ra đề. Vậy hai tốp đó là những ai? Thành thị và Nông thôn chăng, hay là Nam và Nữ, miền Nam và miền Bắc, khoa học Tự nhiên và Xã hội, nguyện vọng ưu tiên thi vào các trường khó và trường dễ v.v... Trong phiếu tuyển sinh ắt hẳn phải có các đặc điểm đó. Và máy tính lại giúp chúng ta tiếp tục giải mã. Nếu các phương án trên không thấy ứng nghiệm thì có khi điểm thấp hơn chính là thuộc tốp các cô cậu quen lối học tủ. Hoặc một cách lý giải nào khác nữa.
Trên đây chỉ là một trong rất nhiều thí dụ ứng dụng kỹ thuật thống kê. Được biết kỳ tuyển sinh này chẳng những đã tiết kiệm rất nhiều tiền của mà còn mang lại hiệu quả lớn nhờ ứng dụng thành công công nghệ thông tin. Mong sao lượng thông tin đồ sộ đó được khai thác triệt để để ngành giáo dục sớm có biện pháp nâng cao chất lượng giáo dục còn quá thấp kém hiện nay.
Bộ Giáo dục và Đào tạo