【学テの再検証とCBT化の行方(5)】大規模学力調査の基礎知識を踏まえているか

福岡教育大学准教授 川口俊明
この連載の一覧

全国学力テストのような大規模な学力調査を設計する場合、最低限知っておかなければならない基礎知識が幾つかあります。知識がないと、全くの善意から誤った判断を下す可能性もあるので注意が必要です。今回は、中でも重要だと思われる項目反応理論(Item Response Theory:IRT)について説明します。

IRTを理解するには、その対となる古典的テスト理論(Classical Test Theory:CTT)を知っておく必要があります。CTTは、全国学力テストをはじめ日本の小中学校で一般的に行われている100点満点のテストのことだと思ってください。CTTは簡便で理解しやすいのですが、受験者の学力とテストの難易度を区別できないという欠点があります。連載の第2回で取り上げたように、ある年の点数が70点、次の年の点数が80点だった場合、CTTに基づいた全国学力テストでは受験者の学力が上がったのか、テストの難易度が下がったのか区別できません。これでは、学力の変化を把握できず不便です。ここで登場してくるのが、IRTの考え方です。

IRTでは、個々のテスト問題に(レベル1、レベル2、レベル3のような)難易度があると考えます。同じ難易度の問題同士は入れ替え可能なので、IRTを導入すると、全く異なる問題から構成されたテストでも、その結果を比較することができるようになります。この特性を活用すると、異なる年度に行われた異なる内容のテストの結果を比較し、学力の変化を把握できます。この特性は大変便利なので、PISAやTIMSSといった国際調査でもIRTが利用されています。

もちろんIRTにも欠点はあります。個々の問題の難易度を確定するには、事前に予備調査と統計的な分析が必要です。また、受験者に問題が漏えいすると難易度が変わってしまうので、問題は厳重に秘匿しなければなりません。日本の学校教育では、指導に利用するなどの理由でテスト問題を公開することがありますが、これはIRTではご法度です。その意味で、IRTは日本の学校教育と相性の悪いテスト理論だと言えます。全国学力テストは、テストの結果も「指導改善に利用する」ことを目的の一つとしていますから、IRTを導入するのであれば、目的から見直さなければならないでしょう。

もっともIRTは、既にテスト理論のグローバル・スタンダードになっています。グローバル・スタンダードを無視して独自路線を貫くのも一つの道ではありますが、そこまでして現在の全国学力テストを維持すべきなのかどうかは、今一度考えるべきでしょう。


この連載の一覧

あなたへのお薦め

 
特集