إå᡼ ʸإ




ڡ 2008ǯ 01 07 07時49分36秒˹ޤ
/

項目Ȥϡ

項目応答理論(こうもくおうとうりろん)または項目反応理論(こうもくはんのうりろん)、略称IRT (Item Response Theory; Item Latent Theory)は、評価項目群への応答に基づいて、被験者の特性(認識能力、物理的能力、技術、知識、態度、人格特徴等)や、評価項目の難易度・識別力を測定するための試験理論である。この理論の主な特徴は、個人の能力値、項目の難易度といったパラメータを、評価項目への正誤のような離散的な結果から確率論的に求めようとする点である。
IRTでは、能力値や難易度のパラメータを推定し、データがモデルにどれくらい適合しているかを確かめ、評価項目の適切さを吟味することができる。従って、試験を開発・洗練させ、試験項目のストックを保守し、複数の試験の難易度を同等と見なす(例えば異なる時期に行われた試験の結果の比較をする)ためにIRTは有用である。また、コンピュータ適応型テスト(Computerized Adaptive Testing)もIRTによって可能になる。
より古典的なテスト理論(素点方式、偏差値方式)と比べると、IRTは、試験者が評価項目の信頼性の改善に役に立つ情報を提供し得る、標本(受験者)依存性・テスト依存性にとらわれずに不変的に受験者の能力値とテスト項目の難易度を求められる、という利点がある。
日本では試験にIRTを用いるようになったのは最近のことであるが、欧米諸国では既に広く使用されている。
一般的なモデルでは、項目への離散的な応答(正誤など)の確率が、1つの人パラメータと1つ以上の項目パラメータによる関数であるという数学的な仮説に基づいている。 用いられる変数は以下の通りである。
項目iの難しさを表す実数値。一般的には各項目に50%の正答率を持つ被験者の能力値を基準として決められている。
基本的な考え方としては、人パラメータと、項目の難易度パラメータの差をとり、ロジスティック曲線に当てはめて、正答する確率を求めるというものである。例えば能力試験において、ある項目が被験者にとって非常に簡単であった場合、その正答率は限りなく1に近づき、逆にある項目が被験者にとって非常に難しいものであった場合、その正答率は限りなく0 (パラメータcを用いる場合はci)に近づく。
最も簡単な1パラメータロジスティック(1PL)モデル(ラッシュモデルとも呼ばれる)では、変数にθとbiのみを用いる。しかし適用のための条件は厳しくなっている。このモデルでは、項目iに正答する確率は次の式で与えられる。
2パラメータロジスティック(2PL)モデルでは、さらにaiを用い、各項目が評価にとってどの程度適正な判断基準であるかを変数に組み込む。このモデルでは、項目iに正答する確率は次の式で与えられる。
ここで、定数Dは1.701という値で、ロジスティック関数を累積正規分布関数に近似するためのもので、確率が関数の定義域(一般的に-3〜3)内で0.01以上異ならないようになっている。 なお、IRTモデルは当初は普通の累積正規分布関数が用いられたが、このように近似されたロジスティックモデルを使うことで、大きく計算を単純化することができた。
3パラメータロジスティック(3PL)モデルでは、多肢選択形式の場合において、適当に選択肢を選択しても偶然正答する確率ciを考慮に入れ、項目iに正答する確率は次の式で与えられる。
人パラメータは被験者の評価の対象となっている1次元的な特性の大きさを表す。この特性は因子分析の1つの因子に類似している。また、個々の項目や人は相互に独立であり、集合的に直交であると仮定されている。すなわち、ある項目の正誤は他の項目の正誤に影響せず、ある人の正誤は他の人の正誤に影響しないという仮定を置いている。
項目パラメータは、ある項目の性質を示す。項目パラメータが定まると、受験者がその項目に正答する確率piは各受験者の能力θの1変数のみを持つ関数になり、縦軸に正答率、横軸に能力値としたグラフが描ける。このグラフは項目特性曲線(ICC; item characteristic curve)と呼ばれる。 パラメータbは項目の難しさであり、この値は人パラメータと同じスケール上にある。パラメータaは項目特性曲線の傾きを決定し、その項目が個人の特性の水準を識別する程度を示す。曲線の傾きが大きいほど、項目の難しさと人の特性の大きさに差があるときに回答の正誤がくっきり分かれることを示す。 最後のパラメータcは、項目特性曲線の負の側の漸近線である。すなわち、これは非常に低い能力を持つ人がこの項目に偶然正答する確率を示す。
各項目は互いに独立であるという前提を置いているので、項目特性曲線は加法的である。よって、すべての項目特性曲線を足したものが求められる。これはテスト特性曲線と呼ばれる。
試験のスコアはこのテスト特性曲線によって求められる。テスト特性曲線はθの関数であり、T(θ)の値を受験者のスコアとする。よって、IRTによるスコアは従来の方法によるスコアと比べ、計算・解釈において非常に異なっている。しかし、ほとんどのテストにおいて、値θと従来のスコアとの(線形)相関関係は非常に高い(.95以上になることが多い)。したがって、従来のスコアに比べ、IRTのスコアのグラフは累積度数分布曲線の形に近くなる。
ここまでで示したモデルでは、1次元的な特性と、項目に対する正解・不正解のような2値のいずれかの応答を前提としていた。しかし、多値ラッシュモデルのように多値(例えば0:全く誤り 1:ほとんど誤り 2:概ね正しい 3:完全に正しい、の4値)をとるように拡張されたモデルや、多次元的な特性を仮定したモデルも存在する。
以上ではθ, ai, bi, ciの各パラメータが存在するものとして考えてきたが、それぞれの真の値は一般的に未知である。よって、離散的な回答からそれぞれの値を推定することもIRTにおける重要な問題である。
IRTの主な知見の1つは信頼性の概念を拡張したことである。伝統的に、信頼性とは測定の精度を示すものであり、真のスコアと観察されたスコアの誤差の比率など、様々な方法で定義される単一の指標で現される。古典的なテスト理論では、クロンバックのα係数などがテスト全体としての信頼性の指標を表すものとして知られている。しかしIRTによると、評価の精度はテストの成績の全範囲にわたって均一ではないことが明らかになる。一般的に、試験点数の範囲の端のスコアは、中央に近いスコアより多くの誤差を含んでいる。
IRTでは、項目・テストのそれぞれについて、信頼性の概念を置き換える情報関数 (Information Function)という概念が用いられる。例えばフィッシャーの情報理論に従って、ラッシュモデルの場合には、項目情報関数は単純に正しい応答の確率と不正確な応答の確率の積で与えられる。すなわち、不正確な応答の確率をqi(θ) = 1 ? pi(θ)で表すと、以下の式で与えられる。
従って、情報量が多いほど、測定の間違いがより少ない(被験者の能力の推定がより正確である )ことを意味する。
2PL, 3PLモデルでもほぼ同様であるが、他のパラメータも考慮に入る。2PL, 3PLモデルのための項目情報関数はそれぞれ以下の式で表される。
各項目は互いに独立であるという前提を置いているので、項目情報関数は加法的である。テスト情報関数は単純にその試験における各項目の項目情報関数の和で求められる。テスト情報関数は、古典的なテスト理論における信頼性の概念を置き換えるものになる。
この性質を用いて、テスト項目の適切性に理論的根拠を与えることや、ある目的に特化したテストを作ることが可能になる。例えば、ある合格基準点を超えるか超えないかのみで合格・不合格が結果として与えられる(実際の合格点は重要でない)テストを作るのに有効なのは、合格基準点の近くで大きい情報が得られる項目だけを集めてテストを作ることである。また、コンピュータ適応型テストのように、ある時点での回答状況に応じて受験者の能力値を推定し、次にその受験者の能力値周辺で大きな情報が得られる問題を出題するということも可能になる。
等化(equiting)とは、異なったテストの結果、異なった受験者に対してのテストの結果を、項目パラメータや被験者能力値に関係なく、共通の原点と単位をもつ尺度に変換することである。等化には、水平的等化、垂直的等化の2種類がある。
古典的なテスト理論においては、テスト依存性や受験者依存性がつきまとうので等化を実現することは困難であった。しかしIRTによる項目パラメータは不変的であり、理論的には等化の必要はない。しかし、実際には一定の定数によって、2つのテストの得点を同一尺度上に変換することがよく行われる。この手続きは以下の式で行われる。
θ'は等化された能力値で、α, βは等化定数と呼ばれている。またこのとき、項目パラメータは以下のように調節される。
等化定数α, βの推定には、共通の受験者または共通の項目が必要となる。そして、等化のための基準には回帰係数、平均値と標準偏差、項目特性曲線の特徴等が用いられる。
科学者が考案した項目応答理論は非常に複雑な手法で試験のスコアを算出する為、科学者以外には問題の難易度と項目応答理論による配点の高低の相関関係の理解は困難である。その為、項目応答理論は「仮説」を立てて理解されている。
問題の難易度が低い場合は配点が低くなり、逆に問題の難易度が高い(正答率が偶然に正答する確率と同一)場合も配点が低くなる関係がある
一部では、全問正解ではないにも関わらずスコア満点の場合がある為、配点が0点の問題の存在が「予想」されている。
また、一部では項目応答理論には配点の概念自体が存在しないとの「仮説」も提唱されている(その場合でも、正答数が同一として、どの難易度の問題の正答が多いかによるスコア高低の傾向が存在すると「予想」されている)。
この項目「項目応答理論」は、自然科学に関連した書きかけの項目です。加筆・訂正などをして下さる協力者を求めています。
カテゴリ: 書きかけの節のある項目 | 自然科学関連のスタブ項目 | 確率論 | 統計学 | 解析学 | 心理学 | 数学に関する記事

[ 2] 項目応答理論 - Wikipedia
[ѥ] http://ja.wikipedia.org/wiki/IRT

 

ライブラリ項目を編集するときは、そのアイテムが使用されているドキュメントをすべて更新できます。更新しない場合、ドキュメントはライブラリ項目に関連付けられたまま保持されます。ドキュメントは後から更新できます。
その他、ライブラリ項目に対する変更には、名前変更を使用したドキュメントまたはテンプレートからの関連付けの解除、サイトのライブラリからの項目の削除、不明なライブラリ項目の再作成などがあります。
[CSS スタイル] パネルは、ライブラリ項目の編集時には使用できません。これは、ライブラリ項目には body エレメントしか含まれず、CSS スタイルシートコードはドキュメントの head セクションに挿入されるからです。また、ライブラリ項目には body タグやその属性を含めることができないため、[ページプロパティ] ダイアログボックスも使用できません。
[アセット] パネル ([ウィンドウ]-[アセット]) で、パネルの左側にある [ライブラリ] カテゴリを選択します。
ライブラリ項目のプレビューが [アセット] パネルの最上部に表示されます (ただし、プレビューでは何も編集できません)。
新しいウィンドウが開き、ライブラリ項目の編集ができます。このウィンドウはドキュメントウィンドウによく似ていますが、デザインビューの背景がグレーになっており、ドキュメントではなくライブラリ項目を編集していることがわかります。
表示されるダイアログボックスで、編集したライブラリ項目が使用されているローカルサイトのドキュメントを更新するかどうかを選択します。
[更新] を選択すると、編集したライブラリ項目が使用されているローカルサイトのドキュメントがすべて更新されます。
[更新しない] を選択すると、[修正]-[ライブラリ]-[現在のページの更新] または [サイト全体の更新] を使用するまで、ドキュメントは変更されません。
これによって、選択したサイトのすべてのページが更新され、現在のバージョンのあらゆるライブラリ項目が使用されます。
同時にテンプレートを更新する場合は、[テンプレート] も必ず選択します。詳細については、テンプレートを開いて編集を参照してください。
指定のファイルが更新されます。[ログを表示] オプションを選択した場合は、正常に更新されたかどうかなど、更新対象ファイルに関する情報が表示されます。
[アセット] パネル ([ウィンドウ]-[アセット]) で、パネルの左側にある [ライブラリ] カテゴリを選択します。
この名前の変更方法は、Windows のエクスプローラまたは Macintosh の Finder でファイルの名前を変更する操作と同じです。Windows のエクスプローラおよび Macintosh の Finder 場合と同様に、必ず間をおいてクリックしてください。ダブルクリックはしないでください。名前をダブルクリックすると、ライブラリ項目が開いてしまいます。
そのライブラリ項目が使用されているドキュメントを更新するかどうかを確認するメッセージが表示されます。
サイト内の、ライブラリ項目が使用されているすべてのドキュメントを更新するには、[更新] をクリックします。
[アセット] パネル ([ウィンドウ]-[アセット]) で、パネルの左側にある [ライブラリ] カテゴリを選択します。
ライブラリ項目は、一度削除すると [取り消し] を使って元に戻すことはできないので注意してください。ただし、以下の手順で、ライブラリ項目を再作成できる場合があります。
ライブラリ項目はライブラリから削除されますが、そのアイテムが使用されているドキュメントのコンテンツは変更されません。
プロパティインスペクタ ([ウィンドウ]-[プロパティ]) の [再作成] ボタンをクリックします。

[ 3] ライブラリ項目の編集
[ѥ] http://www.adobe.com/livedocs/dreamweaver/8_jp/using/06_ass19.htm

 

 


ͥåȥӥͥ
















եå᡼