ウェクスラー知能検査の“逸脱”の考察。

 WISC-IV(児童用)で生じる検査結果の“逸脱”についての考察論文を読んだ。

 私も自分のWAIS-IV(Ver.4)の結果を見て、全検査IQはどういう計算方法なのか気になっていた。高すぎやしないかと。

 私の結果は、

  言語理解:143(95%信頼区間135〜147)

  知覚推理:145(95%信頼区間135〜149)

  ワーキングメモリー:147(95%信頼区間136〜151)

  処理速度:149(95%信頼区間136〜152)

だったが(まるで測ったかのようにやや右上がりの横一直線のグラフ)、全検査IQは156(95%信頼区間149〜159)。

 ※信頼区間については臭気判定士試験の統計的仮説検定で出てきたので理解している。信頼区間を95→90%に下げると推定範囲が狭くなる。一方90→95%に精度を上げると、推定範囲が拡がる。例:「156です」「絶対?」「そう言われると・・・、153〜159の範囲内と言っておきましょう」的な。

 単純に ( 143 + 145 + 147 + 149 ) / 4 とすると146となるはずだが156。

 論文では

本稿では、全検査IQ(FSIQ)の値が、4指標の得点の最大値・ 最小値の範囲に納まらない場合を逸脱と呼ぶこととする。

としているので、私の場合は処理速度の149が最大値で、156との間に7の差があり、いわゆる逸脱。

言語理解指標(VCI)が60、知覚推理指標(PRI)が60、ワーキングメモリー 指標(WMI)が60、処理速度指標が61であるが、全検査IQ(FSIQ)は51となっている。4 指標の合成得点はいずれも60程度であり、平均すると60.25となる。全検査IQ(FSIQ)は4 指標の合成得点の単純平均ではないにしても、全検査IQ(FSIQ)とのズレが10ポイント以 上となってしまうのは、検査実施者の立場からは、無視できないほど大きいと感じられる。
全検査IQ(FSIQ)と4指標平均の平均が交わるのは、 全検査IQ(FSIQ)と4指標平均の平均が100の時である。また、全検査IQ(FSIQ)が4 指標平均の最大値・最小値と交わるのは、全検査IQ(FSIQ)の値の±2SDの付近であり、最小値では70前後、最大値では130前後である。

 まとめると、全体が平均(100)より高い場合は4指標の平均よりも全検査IQは高く出て、低い場合は4指標の平均よりも全検査IQは低く出る。その差が100から離れれば離れるほど大きくなる(下は70、上は130付近が最大)。

 全体とは部分の総和以上の何かであるということだろう。

 論文ではIIIよりもIVでズレと逸脱が大きくなったとしているので、ウェクスラーは“全体”を見る方向性だと言える。

 例えば、(ある採用試験を担当する面接官になりきっていただき)読む、書く、喋る、覚える、計算するという5種のテストを実施する場合。100点満点でそれぞれ平均は50点だとする。

 読む:50点

 書く:50点

 喋る:50点

 覚える:50点

 計算する:50点

という人をどう採点するだろうか。

 いわゆる「可もなく不可もなく」であり、バランスよく平均的な能力の持ち主と評価するだろう。論文で言うところの「全検査IQ(FSIQ)と4指標平均の平均が交わるのは、 全検査IQ(FSIQ)と4指標平均の平均が100の時である」のそれ。プラスαの評価が生じないニュートラル地点。

 では、

 読む:50点

 書く:50点

 喋る:90点

 覚える:50点

 計算する:50点

という人をどう採点するだろうか。

 4種は平均だが「喋る」能力が突出しているので、広報担当やプレゼンテーションなど喋る仕事を任せてみようと評価するだろう。特に欠点はないから不採用の可能性は低く、本人もすぐに「居場所」が決まる。すなわち何かしらの恩恵がある人。

 では、

 読む:50点

 書く:50点

 喋る:10点

 覚える:50点

 計算する:50点

という人をどう採点するだろうか。

 喋らせるのは止めとこうと評価するだろう。「マイナスポイントはあるが、他は問題ない」ということで、人手不足なら不採用は免れるかもしれない。しかし常に「注意すべき点」がつきまとう。

 では、

 読む:30点

 書く:30点

 喋る:30点

 覚える:30点

 計算する:30点

という人をどう採点するだろうか。

 非常に使いにくいと評価するだろう。恐らく不採用で、「特技がない」「使い道がない」と全体的に厳しい評価が下る可能性が高く、現場に出ると相乗(マイナス)効果によって素点差以上に問題視されることがある。これが低い側の「逸脱」の根源と考えられる。

 では、

 読む:90点

 書く:90点

 喋る:90点

 覚える:90点

 計算する:90点

という人をどう採点するだろうか。

 マルチでどこにでも使え、無条件に受け入れられる。急遽欠員が出た時に“助っ人”としても各方面から重宝され、全体の評価が素点を上回る。これが高い側の「逸脱」の根源と考えられる。

 確率で考えてもシンプルに答えが出る。

 5種のテストのうち1種だけ高い点数をとる確率と、5種全部で高い点数をとる確率を比べたらその“希少性”が出る。国立大の5教科か私大の3教科かみたいなもの。低い場合も同じ。

 一般的に全部高い、全部低いという確率は低いため、それぞれに重みが付けられているということ。実社会に沿って考えたら当然の流れと言える。

 「逸脱」の最大値は130または70付近ということから、130を超える(または70を切る)と社会的評価は収束する(もはや数値の差異を実感できない)と考えられる。

 自分で言うのも何だが、この流れが続けば次期WAIS-V(Ver.5)ではもっと高く出そうな予感。WAIS-IVでは160まで測定できるらしく、それが拡張されればだが。

 というわけで、このズレと逸脱は特に不思議でも不可解でもないことが解った。CHC理論に準じていけばいくほどこの傾向は強まると考えられる。また検査する側にも時代が求めるものやウェクスラーの方針・意図を読み解くセンスが問われると結論付けておきたい。すなわち全体理解

「●●で知能は測れない」はどこに向かうのか。

なぜ知能と評価は直結しないのか。教養と肩書き。



 論文に注文を付けると、書いた年月日も入れといて。