埼玉県学力調査の試み(上) 「IRT」で学力の伸びを測る

OECDも注目する埼玉県学力・学習状況調査(埼玉県学力調査)の仕組みと、その分析結果から見えてきた教育効果とは――。全国学力調査に合わせ、各都道府県では独自に学力調査を行っていることが多い。中でも埼玉県が行っている学力調査は、個々の児童生徒の「学力の伸び」を測れる画期的な調査だ。当時、同県に出向し、その学力調査の開発に携わった大江耕太郎文化庁文化部芸術文化課文化活動振興室長と、大根田頼尚文科省高等教育局国立大学法人支援課課長補佐に聞いた。


■IRTによる縦断調査
――埼玉県学力調査は、全国学力調査や他県の学力調査と何が違うのか。

大江 大きな違いは二つある。一つは、一人一人の子供を追跡していく、パネルデータによる縦断調査という点だ。埼玉県では個々の児童生徒にコードを割り当てて追跡できるようにし、小4から中3までの約30万人の児童生徒のデータを収集、分析している。

もう一つは、問題の難易度設定や児童生徒の能力測定に、IRT(項目反応理論)という統計理論を使っている点だ。IRTによって、テストごとに出る問題が違っても能力を測ることができる。パネルデータとIRTを合わせている調査はおそらく全国的になく、これほど大規模にやっているのは世界的にもないと思われる。

――IRTとは、具体的にどういうものか。

大江 身近なものでは、TOEFLなどの資格検定試験で多く利用されている。一般的な資格検定試験は、夏の試験を受けても、春の試験を受けても、毎回受けている人は違っても、客観的な点数が出るようになっている。受検者の実力を正確に測り、「あなたは3級だ」「あなたのスコアは800点だ」と判定している。IRTは受検者や試験日時、問題の難易度が異なる中で、客観的にレベルを測定する必要がある資格試験で比較的発達してきた。

埼玉県学力調査を開発した大江氏(右)と大根田氏
■IRTで「ものさし」を定める

大根田 例えば、20問で100点満点のテストを児童が解いて65点だったとする。その後、同じ分野のやはり20問で100点満点のテストを受けたら75点だったとして、その子の能力は伸びたと言えるだろうか。

1回目に出た5点の問題と、2回目の5点の問題の関係は、統計に基づいて処理していないため、同じ難易度であるとは言えない。65点が75点になり10点上がっていても、実際は後者の問題が簡単だった可能性もある。そうすると、結局その子の能力が伸びたのか、問題が簡単だったのかよく分からない。

しかしIRTを使えば、問題の難易度を絶対値として確定することができる。問題の難易度があらかじめ正確に分かっていれば、たとえ子供が異なる問題を解いても、その解答に基づいて子供の能力がどうだったかが分かる。

同じ子供の伸びを測りたい場合には、通常の試験のやり方だと不十分だ。その同じ集団の中で平均よりも高いか、低いかを見るだけであれば、偏差値や平均点で分かる。しかし、ある人の能力が伸びたかどうかは、「ものさし」が同じでなければ分からない。問題の難易度を正確に確定できることが肝になる。その作業こそがIRTという統計的な方法だ。

大江 極端な話だが、これまでのテストでは、全員の学力が伸びた場合、相対比較では「誰も伸びなかった」と言うのと一緒になる。多くの子供が伸びた場合に、その子供たちをほめる手段が今までなかった。そのため、まずものさしを作り、一つの基準の中でみんなが伸びたというのがあり得て、かつ可視化できる仕組みを作りたかった。

大根田 今までのテストは全体集団の中の位置で評価されがちで、平均点以下の子が評価されにくい傾向があった。しかし、その子はその子なりに成長しているはずで、それをきちんと見える化して評価してあげるのが教育のあるべき姿だ。だからこそわれわれはこの「伸び」を見ようと思った。

生徒指導や社会経済的な背景で大変な学校では、全国や県内の学校と比較すれば平均以下ということもあり得るだろう。では、その学校の子供が成長していないか、教員が頑張っていないかといったら、そんなことはないはず。これまでの調査では、それが明らかにできなかった。子供も教員も伸びたこと、伸ばしたことが評価されるべきだ。

埼玉県学力調査の概要
■来年度から福島県も参加
――IRTによる学力調査を行うには、相当数の問題を用意して、データベース化しないと難しいのではないか。その問題作成や管理のコストが膨大なのがネックでは。

大根田 理想としてはそうだ。何万問という問題があって、その中からランダムに問題を選び、何回やっても違う問題が出てくるようにする。全ての問題にレベルが設定されているので、違う問題が出てきても、必ず「あなたは850点だ」「670点だ」と分かるのが理想的な形だ。それをかなり圧縮して、現実的に1自治体でもできる規模にしたのが埼玉県学力調査だ。

大江 正確にやろうとすれば、相当な時間と労力と資金をかけてやらなければいけない。実際にはそのようなコストはかけられないので、ある程度走りながらやっている。毎年毎年やることで、自動的に問題数が増えてくる。毎回新規の問題がどんどん増えれば、データベースがどんどんたまっていくような仕組みを作ったので、続ければ続けるほど信頼性は上がっていくだろう。

大根田 来年度から福島県も参加することになっている。そうやって参加自治体が増えていけば、それぞれで問題を作り、融通し合うことができるようになる。そうやって問題作成を共有化すれば、コストを下げていける可能性はある。問題のストックをいかに作っていくかが非常に重要だ。

埼玉県学力調査の特徴
■平均点の呪縛からの解放
――埼玉県がこのような学力調査を導入した経緯は。

大江 私は人事院の留学制度を利用して、文科省で教育経済学を専攻した第1号になる。米国で2年間、教育経済学を勉強し、ちょうど帰ってきて2、3年ほどして、埼玉県に出向した。データに基づいて効果を把握しようとしても、そもそもテスト設計が全然そうなっていないという問題意識があった。

ちょうど、埼玉県で学力調査を変えるという議論が県議会サイドから出た。チャンスだと思い、私自身が課題に思っていたものを提案した。すると、当時の教育長も財政当局も非常に理解を示してくれ、市町村も「理念は非常に素晴らしい」と好意的だった。平均点で評価されることには誰もが疑問を抱いていて、教育の本質である、子供たちをいかに変容させ、伸ばしたかを見てくれる調査であれば、協力したいということだった。

大根田 偶然にも私は文科省から留学して教育経済学を学んだ第2号で、2012~14年度まで埼玉県に出向していた大江と入れ替わりに15~17年度まで出向した。新しい学力調査の実施は15年度からの実施で、大江が設計した学力調査を引き継いで、周知や改善、定着をやらせていただいた。

――実際に新しい学力調査をやってみて、どんな課題があったか。

大根田 新しい学力調査の趣旨について、校長を含め教員への理解・共有が十分できていなかった。学校という組織は大変長い期間、平均点という考え方に慣れていてその呪縛からの解放には時間がかかる。われわれの学力調査では「私の学校の平均点は県平均よりプラス3点です」「去年は県平均マイナス3点だったのが今年はプラス4点なりました」という話をやりたいわけではない。見てほしいのは伸びた子供の割合だ。子供を伸ばせた学校は素晴らしいというのが大事な点になる。それを伝えるために、各市町村の校長会への説明を一つ一つ行って周知徹底を図った。

もう一つは、各教員が自身の教えた結果を知ることができるようにした点だ。通常の学力調査では、結果を教員が見た際、今の子供の状況は把握できるが、その結果をもたらしたのは自分ではなく、過去に教えていた教員であって、自分の指導方法を振り返る材料にはならない。

そこで、データをソートできるようにして、昨年のクラスを基準にデータを並び替えられるようにした。それを各校長が教員に返せるスキームにしてある。実際に県内のいくつかの市町村では、昨年度のクラスにソートした結果を去年の担任に返している。この結果を踏まえて、各教員が原因や改善点を考えたり、すごく伸ばした教員の取り組みを研修会で共有したりしている。

私が知っている校長は、クラスの子供全員を伸ばした先生を学校だよりに載せ、保護者にもアピールしている。その先生が頑張っていたとしても、仮にそのクラスや学校が平均点以下だったら、これまではどこまで頑張っても結局平均以下という情報しか分からなかった。データによって、伸ばしたことが明らかとなり、ほめられるようになったということは、教員や子供にとってモチベーションも上がる。この2、3年で、頑張った先生をデータに基づいて評価できる状況ができ、周知、共有が少しずつ進んできた。

【(下)に続く】