教育学的テストの現代の類型学。 テストの主な目的は、トレーニングのレベルによって受験者を区別することであるため、高い 心理テストの法廷概要の内容

ベリー J.W.人間の生態と認知スタイル。 – ニューヨーク州、1976 年。

ブルーナー J.S.意味のある行為。 – L.、1990年。

クロンバック L.J.、ドレンス P.J.D.(編) 精神テストと文化的適応。 – ニューヨーク州、1972年。人間の知性のハンドブック/編。 R.J.著 スタンバーグ。 – ケンブリッジ、1982 年。

シーガル M.H.、キャンベル D.T.視覚に対する文化の影響。 – シカゴ、1966年。

サーペル R.文化が行動に与える影響。 – L.、1976年。

個人差の研究 / Ed.J. ジェンキンス、D. パターソン。 – ニューヨーク州、1961 年。

スーパー C.M.、ハークネス S.発達上のニッチ: 子どもと文化の接点における概念化 / Pierce R.A.、Black M.A. (編)。 寿命の発達: 多様性のリーダー。 – ケンダル、1993年。 – P. 61–77。

バーノン Ph.E.知性と文化的環境。 – L.、1969年。

ウーバー M.異文化間のテストや研究と中心文化を区別する / 知覚。 そして運動能力も。 – 1969. – V. 28. P. 201–233。

第 21 章: 基準に基づくテスト

過去 30 ~ 40 年の間に、心理診断において新たな動きが生まれ、広がりました。 基準に基づいたテスト(KORT) は、テスト中に得られた材料を評価するための、新しく完全に適切な方法を提案しました。 基準に基づくテストには、心理診断の概念全体をかなり深く再構築し、個人差を研究するシステム全体を新たに理解することが含まれます。 現在、CORT の 2 つの概念について話すことができます。 アメリカ人、その本質についてはさらに詳しく説明します。 ロシア、その主な規定と実務も開示されます。

§1. 基準を参照した検査の科学的根拠

教育における基準指向のテストの開発と適用の歴史は、「基準」の概念とその心理学化の深化を示しています。 このタイプのテストの開発では、知識とスキルの量を習得する形式的かつ定量的な側面に対処する CORT から、教育活動の参照構造を対象とした方法、精神的レベルの客観的な指標への移行が計画されています。これは学校教育プログラムの主要な要件と相関しています。

非伝統的な形式のテストの独立した本質を指摘し、それを統計的規範に焦点を当てたテストから分離した最初の人物は、 R・グレイザー。 彼はまた、少し前に「基準指向の測定」という用語を紹介しました。

CORT の特徴的な機能は、基準への準拠という観点からテストのパフォーマンスを評価することです。

裁判所 個人が問題をうまく解決するために知っていなければならないこと、または実行できなければならないことと比較して、個人が知っていること、または実行できることを測定します。知識、能力、スキル、精神的行動の観点から表現される、教育課題の完了に関する側面が、テストの焦点となる基準です。


診断に対する基準指向のアプローチは、特定の教材における各生徒の進捗状況をタイムリーに監視する機会を提供するだけでなく、内容を改善する道も開きます。 構造コンポーネント学生たちの教育活動。

説明されている内容を考えてみましょう G.ウェルズ射撃訓練には 2 つのバリエーションがあり、それぞれが伝統的な、統計的規範指向または基準を参照したテストのアプローチに関連付けられています。 あるケース(統計的標準アプローチを使用)では、射撃者に簡単な説明が与えられ、彼の結果が自分の結果と比較されるのではなく、他の射撃者の結果と比較されることが強調されます。 タスクが完了すると、結果と生徒が占めた場所が報告されます。 別のケース(主題コンテンツの特定の領域に焦点を当てるアプローチを使用するオプション - 「基準」の意味での「ドメイン」)では、矢印に詳細な指示が与えられ、得られた結果が自分のものと比較されます。以前に取得した結果の場合、矢印は 可能な方法間違いを克服し、それを改善するためにトレーニングを継続することを申し出ます。 G. ウェルズは、数学、文学、音楽、その他の学問を研究するときに、同様のことを想像するのは難しくないと述べています。

今日、ほとんどの検査学者は、基準指向のアプローチと基準指向のアプローチの間には大きな違いがあることを認識しています。 テストが準備される目的、教育課題の完了結果を評価する際にテストが提供する情報の特異性、構築および処理の方法、これらすべてがこれら 2 種類のテストの違いの基礎となります。 KORT は最初から特定の教育課題を念頭に置いて設計されており、KORT と課題の間の有意義な対応関係が事前に計画されています。 (関連性)。 CORT に関して言えば、教育課題は、その後テスト指標が関連付けられる「外部基準」ではなく、テストによって明らかにされる現実、目標、内容、達成方法です。

クラス V の生徒に、樹木に関するプロジェクトを実施し、地元の樹木とその葉の絵、生態系や生活の質への貢献という観点からの樹木に関する情報、およびその方法に関する推奨事項を含むレポートを書くという課題が与えられているとします。木を守るために。 このようなタスクでは、テスト作成者が実行プロセスと最終製品の基準を定義します。 したがって、樹木プロジェクトは次の基準に従って評価されます。

· 報告は慎重に行われます。

· 少なくとも 3 つ描かれ、ラベルが付けられている 他の種類木;

· それぞれの種類の木の説明。

· 木の価値が記述されている。

· 樹木を保護する方法が説明されています。

タスクパフォ​​ーマンスの同様の参照モデルを使用して、各生徒のレポートを評価できます。 基準に基づくスコアリングを確実に使用するには、既存の 5 つのスコアごとに 1 つずつ、合計 5 つのモデル応答を提供する必要があります。

CORT を構築する際に最も重要な条件は、学習タスクの完了を適切に反映するタスクを開発することです。 難しいか簡単か、結果の正規分布に寄与するかどうかなどは、そのようなテストにおけるタスクの品質を決定するものではありません。 一定の訓練段階に合格した人の大多数は試験課題に対処できるが、訓練を受けていない人の大多数は試験課題に対処できないことが確認された場合、これはこれを含めるための必要な根拠として機能する可能性があります。 CORT のタスク。 必要ですが、十分ではありません。 研究者はまた、タスクを正常に完了した被験者が、単に必要な用語を覚えたり、必要なアクションのアルゴリズムを機械的に再現したりする能力を実証しただけではなく、基準に固有のスキルを実際に適用していることを確認する必要もあります。 したがって、このようなテストにおける項目分析では、次の点に焦点を当てる必要があります。 徹底したチェック統計的特性だけではなく、タスクのパフォーマンスの構成を分析します。 CORT と統計的標準を指向したテストを比較すると、前者を実際に適用する際に標準化手順が使用できる可能性が排除されません。 その実施基準は、教育基準、つまり訓練の特定の段階で習得する必要がある主題の知識とスキルのセットと相関しています。

§2. CORT における基準の概念

それは70年代初頭、XX世紀に普及しました。 米国やその他の国では、CORT の開発は次のような基準の概念に基づいていました。 主題の知識とスキルの参考セット。この概念の枠組みの中で、次のような基準が考えられます。 実行レベルそして スキルレベル。

基準の解釈 実行レベルそれは教育心理学の考え方と一体的に結びついており、それによれば、教育プロセスは教育行動の各要素の逐次的な発展として理解されています。 後者は、明確な測定と適切な制御に適した、観察可能な外部アクションの「レパートリー」として記録されます。 同時に、教育プロセスの目標は、観察と管理の対象となる種類の行動への強制的な「変換」の対象となります。 これは、テスト タスクを開発するときに特に重要になります。 特に、教育目標を達成するために必要な行動を直接示すような形で策定することが推奨されます。 米国の基準参照テストの開発者 (V. J. Popham、R. Svezy、N. Gronlund など) が学習目標を運用化する必要性を強調したのは偶然ではありません。 R. Svezi 氏は、教育目標は、それを達成するための行動を明確かつ明確に示す必要があると指摘しています。 この場合にのみ、この目標の達成が KORT での測定の対象となります。 この考え方では、「理解する」「評価する」「認識を示す」「考慮する」「実施する」などが考えられます。 それらは特定の教育目標に関連付けられていますが、それらを達成するために実行する必要がある行動の性質を直接示すものではありません。 この観点から、「書く」、「ラベルを付ける」、「計算する」、「下線を引く」という用語は、特定の目標により関連しており、必要なアクションの性質も明確に定義しています。

学習目標の達成は通常記録されます 正解レベルの割合 KORT タスクを完了します。 必要な習熟度に対応するテスト完了レベルは 80 ~ 100% 程度である必要があることが経験的に確立されています。 実践が示しているように、このレベルを修正すると、教材の習得において安定した肯定的な結果が反映され、大多数の生徒は主題への関心を維持します。 基準レベルを75%に引き下げると、教育成績が悪化します。

パフォーマンスレベルに基づいて設計されたCOURTSは、プログラムされた指導で広く使用されています。 最初のそのようなテストは、教育プロセスへの教育機械の導入と個人の使用に関連して登場したことに注意する必要があります。 カリキュラム、そして、要求される充足レベルを確立する際の統計的規範の不適切性が、ここで特に明確に明らかになりました。 学生が所定の量のプログラムのうち何を習得したか、また以前に知っていた内容と比較して教材の習得がどの程度進んだかを確立する必要性が浮上しました。 テスト結果が基準、つまり正解率を満たさなかった場合、学生は追加の精緻化が必要な教材の断片に戻ることが推奨されました。

研究者や教師は、教育過程で個別のプログラムを使用し、習熟度の基準を使用しているため、一部の生徒が必要なスキルを持っていないために所定のレベルに達していないという事実に注意を払わずにはいられませんでした。 スキルとその構成要素の操作は、教育過程で十分な精緻化を受けずに形成されないか、固定化されて「欠陥のある」システムに統合されている可能性があることが示唆されました。 CORT の理論と実践において、基準の理解が生まれます。 スキルレベルとしては、それらの。 特定のスキルを構成するすべての運用コンポーネントのリファレンス セット。 このような特性により、教師や研究者は生徒の行動と生徒ができるべきことを比較することができます。

習熟度の確立を目的とした基準に基づくテストの特徴は、習得した内容の量を明らかにするだけでなく、新しくより複雑な内容を習得する際に習得した知識を積極的に活用する生徒の能力も示すことです。 前述したように、パフォーマンスベースのテストでは、生徒が学習の次の段階に進む十分な準備ができているかどうかを確認できます (これはテストの本質に当てはまります)。 同時に、学生の知識とスキルが特定の問題を解決するために適応された標準的な構造に編成されているかどうか、またそれらがどのような同化レベルに位置しているかは不明のままです。 習熟度のレベルは基準要件を具体化したもので、主に教育の理論と方法論で確立された習熟度の基準とパターンによって決定されます。 後者は教育スキルの構成として学校教育プログラムに記録される。

教育実習で、生徒の読解力がどの程度発達しているかを監視するテストが必要だったとします。 このスキルは、その構造コンポーネントの観点から見ることができます。 以下にそのおおよそのリストを示します。 読んだテキストに質問をしたり、難しい文章を再構成したり、主要なアイデアを強調したり、読んだテキストの計画を立てたりします。これらのコンポーネントに名前を付けるだけでは十分ではありません。 それらのそれぞれは、主にその外部の現れの観点から指定されなければなりません。 彼らの作戦を実行する。 たとえば、主要なアイデアを強調表示するようなコンポーネントは、次のように操作的に表すことができます。

1) を表現する文に下線を引きます。 本旨抜粋;

2) パッセージのタイトルを選択します。

3) 主なアイデアなどを裏付ける事実を列挙します。

このような CORT では、選択した各コンポーネントを個別のサブテストで検査する必要があります。 サブテストには、対応するコンポーネントのすべての操作形式を提示するタスクが含まれます。 このように準備された CORT の結果に基づいて、生徒が読解のどの要素 (およびどの操作形式) を習得しているか、またはまだ習得していないかについて、具体的な結論を引き出すことが可能になります。 これにより、問題の原因を判断し、適切な是正措置を講じることができます。

スキルレベルなどの基準を使用したテストの結果は、いわゆる タスク完了チェックリスト。これは、テスト タスク ソリューションの品質を確認するために観察できる、実行プロセスまたは最終結果の機能や特性を示します。

たとえば、サンプル演習テスト「角度の二等分」では、次の手順が定義されています。

· コンパスが使用されます。

· コンパスの端を角度の頂点に置き、辺の間に円弧を描きます。

· コンパスの点は円弧と角の辺の各交点に配置され、等しい円弧が描かれます。

· 角度の頂点から円弧の交点まで線が引かれます。

· 分度器で確認すると、得られた 2 つの角度が等しいことがわかります。

言い換えれば、完了チェックリストは、特定のタスクの成功を決定する事前に決定されたアクションのリストです。 学生がそのようなタスクを実行するのを観察することで、研究者はチェックリストに従って学生が実行するすべてのアクションを記録し、それらをタスクプロセス標準への準拠の尺度を決定するための基礎として使用します。

診断テストの開発と、これらのテストが目的とする教育理論および教育実践との間には常に密接な関係があることが知られています。 上で概説した CORT の基準概念の機能はすべて、学習の行動主義モデルに基づいています。 このモデルによって仮定された教育的知識およびスキルと精神的発達との分離は、基準に基づくテストに反映されました。 教育実践では、学校カリキュラムの内容の同化を管理および評価するために達成度 CORT が使用されます (第 8 章を参照)。一方、精神的行為の特定は、伝統的な基盤に基づいて構築された知能と能力のテストを使用して実行されます。

教育課題を完了するための心理的条件に対処する CORT の開発は、学習と発達が密接に関連していると考える理論の文脈でのみ可能です。 国内の心理学および教育学の文献では、教育課題の構造的および操作的構成を習得しても、課題のパフォーマンスの分析がすべて終わるわけではないことが繰り返し指摘されてきました。 教材を習得するには、適切なレベルの精神的発達、特に教材に適した精神的行動の形成が前提となります。 CORTS では、行われた精神的行為が診断指標として機能し、次のような基準の概念が具体化されています。 課題を完了するための生徒の論理的および心理的準備。このような基準は、生徒の精神的発達が教育プログラムの教材によって課せられる要件を満たしているかどうかを判断することを目的としています。 このアプローチでは、基準と比較したテスト結果により、生徒の思考にプログラムの新しいセクションを習得するために必要な精神的行動が含まれているかどうか、また新しい種類のタスクを実行するときに自信を持って精神的行動を使用できるかどうかについての情報が得られます。

この基準の概念は、2 種類の CORT の開発と適用に実装されています。

1. 次の基準を使用する人もいます。 社会心理学的基準 –特定の教育段階で必要な現代の学童の心の棚卸しを決定する一連の概念と論理的スキル。 社会心理学的基準の定義自体は、この基準が数学、自然科学、社会および人文科学の分野などの幅広い主題分野で課題を実行するための被験者の論理的および心理的準備を特徴付けることを示唆しています。 これに基づいて、一連の精神発達ジェスト (SHTUR、ASTUR、TURP など) がすでに開発されており、構築の原則とその適用の実践については、前の章で説明しました。

2. 別のタイプのコートは、特定の学術分野の主題固有のタスクを実行するための被験者の論理的および心理的準備ができているかを診断するためのツールとして機能します。 したがって、数学的、言語的、生物学的な CORT が開発されています。その基準では、 精神的行動を更新するための主題論理的標準。このような CORT での分析の対象となるのは、恣意的に選択された教育課題ではなく、以下の条件を満たす論理的および心理的な準備状態です。

· 教育課題で提示される資料は、特定の学問分野における教育内容の内部で完了した領域を特徴付けるものでなければなりません。

このタスクは次のようにする必要があります ただし、主題領域のこのセクションの他のタスクに関連して。 それを実行するとき、新しい用語や概念が生徒の思考に含まれ、それに基づいて過去との論理的なつながりが確立され、概念的な知識が吸収されます。

· 教育課題は、最も完全な心理的解読に適している必要があります。つまり、 精神的行動の体系的かつ連続的なリストの形式で提示できます。

· 教育課題の実施を仲介する精神的行為は形成段階にある必要があり、この段階では論理心理学的分析とその後の修正が可能です。

現在、このタイプの基準を実装する CORT の教育課題の心理分析の理論的前提条件が決定されています。 パフォーマンス レベルや習熟レベルに焦点を当てたテストとは異なり、問題の CORT は心理的な内容を含むテストです。

§3. 心理学的な内容を含む CORT の開発

CORT メソッドの心理的内容は次によって決定されます。

· 特別な焦点 - 精神的発達を監視し、そのレベルを評価することにテストが焦点を当てています。 CORT メソッドは、生徒の教育課題の遂行を仲介する精神的行動を調査します。 原則として、方法論の文献にはこれらのアクションが何であるかを示すものはなく、もしあるとしても、最も一般的な性質が与えられています。これらは、意味のある指標を定義せずに、分析、統合、比較、一般化の必要性について言及しています。特定の主題の特異性を持つマテリアルへの実装の。 これらの行動は、課題の論理的分析と心理的分析の両方を通じて、また、学生が課題を実行する際に、どのような行動を実行する必要があるかを概説できるようにする特別に組織化された観察中に特定する必要があります。

· テスト課題の内容を選択するための方法論的テクニックの使用、および主題教材のオリエンテーション方法の分析。それぞれは、必要な精神的能力を習得する生徒の「主観的論理」によって決定されます。行動。

これらすべては、テスト仕様の開発中に考慮されます。 特定のテストが焦点を当てる基準を記述することにより、仕様は同時にテストが属するコンテンツ領域の境界を定義します。

仕様がどのように実行されるかを示すために、CORT メソッドの開発における既存の経験に目を向けましょう。 このテストはさらに詳しく説明しますが、数学(中等教育第 6 学年)に基づいて開発され、文章問題の用語に従って方程式を構成する能力を媒介する精神的動作を特定することを目的としています。 方程式を書く能力は、多くの数学的知識とスキルの鍵となります。 グレード V ~ VI では、このスキルはちょうど形成されつつあり、その心理的な内容もここで規定されます。 スキルの機能を決定する精神的な行動。 さらに段階が進むと、このスキルの役割が増加します。

テスト仕様書を作成する際には、まず検討内容の基準値を明らかにする必要があります。 このテストでは、数学の学習の詳細は、児童の思考技術の形成を媒介する精神的活動の実現と密接に関係しています。 これらのテクニックは、文章問題を研究して解決するための条件として機能します。 この場合、文書問題を解く上で重要なのは、一連の問題モデルの構築であり、その最後のリンクが数学モデル (方程式) であることが仕様書に記載されています。 量間の関係のモデル化は構成的な特性です 数学的思考、およびサインモデルとその変換は、精神的行動の意味のある基礎として機能します。 したがって、テキストの数学的問題を精神的に変換した結果である記号モデルへの方向性は、精神的行動の形成の基準として機能します。 これがこのテストに含まれる内容です。 文章題の条件に従って方程式を作成することは、生徒が次の精神的な行動を習得していることを前提としています。

・ 実行する 分析タスクの状況、つまり 問題の本文に従って方程式を作成するために不可欠な条件 (方程式の基礎) を特定します。

· インストールします 身元一般化の度合いが異なる象徴的なモデルと説明文の間。

· タスクを次のように分割します 必須ベースのクラス –数量間の関係の種類。

· 見る 類似性問題では、量間の依存関係をモデル化するという同様の性質に基づいています。

特定された一連の精神的行動は、CORT 方法論を構築するための基礎を形成します。 各アクションの成熟度は、別個のサブテストによってチェックされます。 問題のテストには、(指定されたアクションの数に応じて) 4 つのサブテストがあります。 それらには、「本質的なものの特定」、「4番目の奇妙なもの」、「類似のものの検索」、「アイデンティティの確立」という名前が付けられています。

テスト開発者は、試験対象の学習コンテンツを代表する内容がテストに含まれることを確信する必要があります。 この目的のために、テキストの数学問題のカタログ化が実行されました。 これには、プロット、タスクの特徴、その実質的な内容 (つまり、問題にどのような量が示されているか、相互に関連する量、または さまざまな意味同じ量)、問題文に含まれる量間の関係の符号モデルの種類。 次に、各タスクのおおよその割合が決定されました。 学校の数学の教科書でこの種の問題が取り上げられる場所。 したがって、カリキュラムで提示されるすべての主要な種類の問題がサブテストのタスクに含まれていました。 CORT 方法論を開発する際、選択されたタスクのテキストは、条件に含めることに関連していくつかの変更を受けました。 刺激素材。たとえば、CORT メソッドの課題の場合、刺激材料は、学生が教材内で既存の方向転換方法、つまり主観的な「ロジック」を使用することを促すことができる課題の内容と構造の要素でした。 課題条件には、同じ数値データ、類似した語彙等を入力した。 これらすべての重要でないデータは、問題の実際の数学的内容の外部にあり、信号を「マスク」することを目的とした「ノイズ」の機能を実行しました。 特定のタイプの符号モデルによって固定される量間の関係。

課題に刺激物質を導入することにより、精神的行為の形成の程度が設定された基準にどの程度該当するかを判断することが可能となる。 生徒が精神的行動を更新するという主題の論理をまだ習得していない場合、教材内の不適切な方向付け方法を克服することはできません。 これらすべては CORT 技術によって明確に実証されます。

検討中の CORT の 4 つのサブテストすべてのサンプル タスクを、その実装の意味のある指標とともに示します。

サブテスト「本質の特定」。これには、次のタイプのタスクが含まれます。指定されたタスク用にコンパイルする必要がある方程式の性質を決定する際に、選択された (A、B、C、D) 条件のどれが重要であるかを確立します。

工場は 15 日以内に自動車の生産注文を達成する必要がありました (A) が、期限の 2 日前 (B) で工場は計画を達成しただけでなく、計画を上回ってさらに 6 台の自動車を生産しました (B)。なぜなら 毎日計画を上回る 2 台の車両が生産されました (D)。 計画通りにその工場は何台の車を生産する予定でしたか?

適切な実行この課題では、生徒が数量間の関係を示す条件 (条件 B) に従って指導されることを前提としています。「計画を超えて生産された生産量は、計画よりも 6 両多い。」 この条件は方程式の性質を特定する際の「鍵」ですが、条件 A、B、D には数学的情報が含まれていますが、個々の代数式の形式のみを決定し、方程式全体を決定するわけではありません。

サブテスト「4番目の奇数」。これには、次のタイプのタスクが含まれます。4 つのタスクが与えられ、3 つは 1 つのタイプ、1 つは別のタイプです。 余分ですが、別の種類の問題に関連しています。 どのタスク (A、B、C、D) が冗長であるかを判断する必要があります。

A. トラクター運転手のチームは、毎日 60 ヘクタールを耕すことを計画しました。 しかし、除雪計画は毎日25%超過したため、締め切り前日に除雪は完了した。 畑を耕した日数を確認する必要があります。

B. 農家は 1 日あたり 25 ヘクタールの種まきを計画していました。 しかし、彼はなんとか毎日の播種量を 5 ヘクタール増やすことができたので、その作業は 3 日間で終了しました。 前倒し。 農家が種を蒔いた畑の面積はどれくらいですか?

B. 電車は 2 つの駅間の距離を 1.2 時間で移動します。 線路の修復のため、列車は速度を 20% 落とし、この距離を 1 時間半で走行しました。 電車の初速を求めよ。

D. 2 つのリンクでは、その区画から 8,840 セントのトウモロコシを収集し、最初のリンクでは 1 ヘクタールあたり平均 150 セントの穀物を受け取り、2 番目のリンクではそれぞれ 108 セントの穀物を受け取りました。 2 番目のリンクのセクションは、最初のリンクのセクションより 35% 大きかった。 最初のリンクの領域を決定し、

課題を完了するとき、生徒は量間の関係の一般的なタイプに基づいて課題を比較し、組み合わせることが重要です (一連の課題の追加の課題は課題 D)。 プロットの共通性(農業作業 - タスクA、B、D)、個々の詳細の類似性(量の値間の関係はパーセンテージの形で与えられます - タスクA、B、D)はありません。タスクが同じ種類に属すると結論付けるのに十分な根拠。

サブテスト「類似のものを見つける」。これには、次のタイプのタスクが含まれます。 これに似た問題を見つけてください。合計が 81 になる 3 つの連続する奇数を見つけてください。

A. コードは 3 つの部分に切断され、最初の部分は半分に切断されました。 2回目以上そして3番目は別々に。 2 番目の部分が最初の部分より 81 cm 短いことがわかっている場合、3 つの部分のそれぞれの長さはいくらになりますか?

B. 2 つの数値の合計は 81 です。一方を 2 倍すると、結果の数値の合計は 136 になります。2 つの数値のそれぞれの値は何ですか?

B. 三角形の角度の合計は 180 度です。 角度は数字 3、4、5 に比例します。三角形の角度を見つけます。

D. 一方の数値の 1/5 がもう一方の数値の 1/6 に等しい場合、合計が 132 となる 2 つの数値を見つけます。

類似点を見つけるアクションを更新するときに不可欠なのは、検討中の問題の記号モデルの類似性を方向付けることです (タスク B)。 数値データの類似性 (A)、課題状況条件の個々の語彙単位 (B)、類似した構文構成 (D) に基づいて類似点を見つけることは、生徒がサブテストで提示された精神的動作を習得していないことを示します。

サブテスト「アイデンティティの確立」。これには、次のタイプのタスクが含まれています。コンパイルされた問題のうち、6x–x=25 の形式の方程式に対応するものはどれですか?

A. ヴィティアは 2 つの数字を考えました。 それらの商は 6 で、その差は 25 です。Vitya はどのような数字を考えていましたか?

B. お母さんはラズベリーとリンゴの入ったパイを 25 個焼きました。 ラズベリー入りのパイは6倍ありました。 アップルパイは何個ありましたか?

B. 1 つの部屋には 2 つ目の部屋の 6 倍の人がいます。 25 人が最初の部屋から 2 番目の部屋に移動した後、両方の部屋の人数は同じになりました。 最初は各部屋に何人いましたか?

D. 最初の 1 週間で利用可能な石炭の 1/6 が使い果たされた後、25 トンの石炭が倉庫に残りました。 倉庫には石炭がどれくらいありましたか?

180. 学校卒業生の最低限許容される能力を判断できるテスト項目は次のとおりです。

+: 達成度テスト

-: 知能検査

-: 実験手法

-: 進路指導試験

181. 基準に基づくテストはテストのグループに属します...

+: 実績

-: 知能

-: 性格

-: 創造性

182. 達成度テストの利点は...そして...

+: テストの客観性を確保する

+: 測定結果の解釈の客観性

-: テスト タスクを完了するための制限時間

-: テスト中のすべての被験者の状態を考慮する

-: 「正誤」の階調なし

183.物理学、化学、生物学の学校分野における 2 つのサブテストからなる自然科学的思考のテストが開発されました。

+: G.A.ベルラバ

-: D.B. エピファニー

-: E.L. ソーンダイク

-: G. エビングハウス

-:K.M.グレビッチ。

184. 達成度テストのコンパイルには、タスク ..., ... を含める必要があります。

+: 明確に定式化されている

+: 推測の可能性を排除した回答

-: 正解はどれか

-: 回答の選択肢は可能な限り完全である必要があります

185. 専門能力テストは、…、…の目的で使用されます。

+: 最も責任のあるポジションの人員の選択

+: スペシャリストの資格レベルの決定

-:人材の知的発達レベルの明確化

-: スタッフのキャリアアップの機会の評価

-: 学習能力の尺度

186. 大学で使用される学力テストは、次の目的で使用されます。

+: 性能評価 職業訓練

-: 生徒のトレーニング前後の成果の比較

+: 研修生間の知識のギャップを特定する

-: 将来の専門家としての個人的な資質を判断する

-: 科学的概念を運用する際の生徒のスキルを特定する

187. テスト ### は、分野やセクションの習得の現在または最終的な結果を評価するために使用されます。

+: 実績

188. カリキュラム要素の習熟度、特定のトピック、スキルの習熟度を評価することを目的としたテストは次のとおりです。

+: 特定の科目の学力テスト

-: 広範囲に焦点を当てた学力テスト

-: プロとしての成果をテストする

-:知能検査。

189. 教育の中間段階での基準テストは…生徒の目標を追求する

+: 精神活動の欠落した構造の修正

-: 精神的操作の発症の防止

-: 知的発達レベルの診断

-: 知識とスキルの開発レベルの評価


190. テストの結果には、学生が与えられた教材から何をどのように学んだのかに関する情報が含まれています

+: 基準指向

-:知的な

-: 個人的

-: 射影

191. 基準を参照したテストの構築には...と...が必要です

+: 番組素材の分析

+: 科目に必要な知識とスキルを強調します。

-: 生徒の平均的なIQレベルを考慮した課題の選択

-: タスクを完了するための個々の戦略を考慮する

-: 「単純なものから複雑なものへ」という原則に従ってタスクをコンパイルします。

192. G.A. ベルラバによる基準指向テストにおける経験型の思考は、次のことに焦点を当てています。

+: タスクの特定の条件

-: 問題の解決策を科学的に分析する試み

-: 特定の状況において何が特別なのかを特定する

-: オブジェクト間の普遍的な関係を特定する

193. ...問題を解決するときに特定の自然科学法則を使用する思考タイプですが、答えは間違っています

+: 経験科学的

-: 経験的な日常

-: 差動合成

-: 統合的

194. G.A. ベルラヴァによる自然科学的思考のテストにおける課題は、自然界にある ... そして ... です。

+: 高品質

+: ブール値

-: 定量的

-:比喩的

-: 経験的

195. 学力検査と適性検査の違いは、...

+: 特定の知識の習得に成功

+: 職業の選択を予測するふりをせずに、過去の経験

-: 個人の知的発達のレベルを示す指標

-: 学生が一定の知識を習得する機会

196. 基準に基づくテストが提案されました...1963 年

+: R.グレイザー

-:R.キャッテル

-: G. アイセンコム

-:G.A.ベルラヴォイ

197. 特定の知識やスキルにおける個人の習熟度を評価できるテスト ある形活動は...

+: 達成度テスト

-: 射影テスト

-: 知能検査

-: 性格検査

198. 職業上の業績をテストする形式は次のとおりです...

+: 筆記試験、口頭試験、行動試験

-: 基準と知的

-: 客観的および主観的

-: 一般、ローカル、および現在

199. 達成度テストの開発に関連する一連の出来事:

1: ボストンでは口頭試験を筆記試験に置き換える

2: T.L.ケリーが学校の教科に関する一連のテストを公開

3:アメリカでの教育テストサービスの創設

4: 非常に才能のある子供たちを選抜するための米国でのテスト

200. 他のテストとは異なり、達成度テストでは次のことを判断できます。

+: 特定の教材の習得に成功

+: 応用学生研修プログラムの有効性

-: 特定の職業の個人の選択の予測

-: 生徒の知的発達のレベル

-: 教員の資格レベル。

201. 専門的業績の試験形式とその特徴の遵守:

L1: アクションテスト

R1: 専門的な活動のための割り当て

L2: 筆記試験

R2: 専門知識を問う問題

L3: 口頭試験

R3: 面接での質問

R4:入学時の知識、スキル、能力 教育機関

R5:大学入学時の志願者の意欲の度合い

202. 達成度テスト項目を作成するには、次のことが必要です。

+: タスクと回答の明確で曖昧さのない表現

-: マイナーな用語が含まれています

-: 生徒の能力を確認するためのタスク

-: 個人の特徴を特定するための質問

203. スペルの知識をテストするための表の形式で提示された最初の学力テストの外観は、名前に関連付けられています...

+: J.M. ライス

-: G. ミュンスターバーグ

-: J. ギルフォード

-: G.エビングハウス

204. 統一国家試験では...

+: 達成度テスト

-: 知能検査

-: 専門試験

-: 性格アンケート

205. 米国で開発された国家準備テスト (MRT) は、対象者の年齢を診断するように設計されています。

+: 幼稚園

-: 小学校

-:10代

-: 高校

2 教育学テストは、教師に関係なく、生徒の教育成果のレベル、特定の分野における生徒のアイデア、知識、能力、スキルの総合性を客観的かつ機能的に測定できる、特定の形式のタスクのシステムです。内容。


3 教育試験の分類 管理レベルに応じて、入学試験、現行試験、主題試験、中間および最終認定試験。 内容別: 同種および異種。 結果を解釈するための方法論によると、規範指向と基準指向です。 プレゼンテーションの形式によると、空白、コンピュータ通常、およびコンピュータ適応型。


4 均一なテスト – いずれかの分野の内容に基づく。 異種テスト - 複数の分野の内容に基づく、多分野テスト - 個々の分野の同種テスト (サブテスト) のセット。 学際的なテスト - 各テスト タスクには、複数の専門分野の内容の要素が含まれている必要があります。 このようなタスクを実行するには、一般化された統合的な知識とスキルを使用する必要があります。 これは、学生の専門的活動に対する準備レベルが州の基準の要件に準拠している度合いを最終的に証明するのに最適ですが、実装は非常に困難です。


5 規範指向の教育学テスト - 個々の受験者の教育成果 (専門知識とスキルのレベル) を相互に比較できます。 これらのテストは、受験者間の比較のために、信頼性の高い正規分布のスコアを取得するために使用されます。 基準指向の教育テストは、特定の分野で学生が習得する必要がある知識、スキル、能力の全範囲と比較して、個人の教育成果のレベルを測定できるタスクのシステムです。


基準指向のテスト開発の 6 段階 1. 関連分野の州基準に基づいて、テスト内容の範囲とテストの目標が決定されます。 知識の中間管理のための試験の計画(仕様)は、最終的な認定のために、専門分野の州基準に従って、分野のすべての教育単位において、1 つ以上の教育単位の知識、スキル、能力をカバーする必要があります。 2. 仕様項目ごとに、いくつかのテスト タスクが開発されます。 3. 部門の方法論委員会 (専門家) が、タスクがコンテンツ領域およびテスト目標に準拠しているかどうかを評価します。 学内模擬試験は学科教員が実施します。 テストの予備調整が行われます。 生徒のテスト時間は次のように決定されます: Tst = Tpr * 2。


7 4. 専門家の意見をもとに課題を調整し、教室で模擬テストを実施します。 質の悪い結果が生じる可能性があるため、これはパイロット テストであることを生徒に伝えないでください。 5. 各タスクとテスト全体の統計パラメータの分析に基づいて、テストが再調整されます。失敗したタスクは削除され、必要に応じて新しいタスクが作成されます。 6. 専門家と経験に基づいた方法を使用した評価基準の選択。 テストの信頼性の評価。 内容と基準の妥当性の評価。 7. テストの最終バージョンとその並行形式を作成します。 テスト自体と関連資料の複製。


8 最初に、テストは何を測定することを目的としているのか、という質問に答える必要があります。 テストのコンテンツ領域と目的は何ですか。 計画を作成する際には、各セクションの内容の割合のおおよそのレイアウトが作成され、その分野の各セクション (各教育単元) に必要なタスクの数が、その重要性とその学習に割り当てられた時間数に基づいて決定されます。プログラム。 この仕様により、テストの構造、内容、およびテスト内のタスクの割合が固定されます。 また、作成者が推奨する各タスクの重み、テスト完了の推奨時間、規格の要件の範囲、およびテストでタスクを配置するための推奨戦略を仕様書に示すことをお勧めします。


9 誰が検査を受けるのか、つまり どのような生徒がテストに参加しますか? テスト結果を受け取ることに本当に関心があるのは誰ですか?また、ユーザーにどのような情報を提供する必要がありますか? 評価基準は、主要分野以外の現在のパフォーマンスを評価する場合は 50%、特別な分野の認定テストについては 85% に設定できます。 テストの信頼性は、二重テスト中の合否判定の一貫性の程度によって評価されます。 これを行うには、結果の「2x2」共役表が入力され、テスト結果の一貫性に関するファイ相関係数とカッパ係数が計算されます。


テストのテスト課題の内容を選択するための 10 の原則 1. 合同の原則 - 教育テストの内容と内容の対応 学術分野。 テスト項目は次のとおりです。 正しい比率コンテンツ領域の重要な側面をすべてカバーします。 2. 重要性の原則 - 検討中の現象の本質、内容、法則、パターンを表す最も重要な基本的な知識のみをテストに含める必要性を反映しています。 3. 科学的信頼性の原則 - 科学的論争において許容されるすべての物議を醸す観点は、テストタスクから除外されるべきです。 4. テスト内容が現在の科学的知識のレベルに適合するという原則 - バンクに新しいテストタスクを追加することにより、テストを継続的に改善する必要があります。 5. テスト内容の一貫性、複雑さ、バランスの原則 - 学問分野の主要なトピックを包括的に反映した課題の選択。 6. 試験課題の難易度を高める原則 - 各教育要素には一定の平均的な難易度があり、知識を監視する過程でそれを考慮する必要があります。 7. 内容と有利なスタートの関係の原則 - タスクのすべての内容をテスト形式で表現できるわけではありません。 また、テストの内容は、論理的および意味論的な要件と基準を満たしている必要があります。


11 回答を選択できるタスク (閉じた形式) テスト タスク セットの要素を繰り返し選択するタスク セットの要素を繰り返し選択しないタスク セットの要素を繰り返し選択するタスク 確立するためのタスク開いた形式の対応関係 回答オプションとの対応関係を確立するタスク 対応関係を確立するタスク 開いた形式で正しい順序を確立するタスク 閉じた形式 (既成の順序オプションを使用) で正しい順序を確立するタスク 正しい順序を確立するタスク3 つ以上の解答選択肢 値を比較するタスク 複数の正解を選択するタスク 3 つのステートメントから論理的に選択するタスク 1 つの情報ブロックを参照するタスク 文の一部に下線を引くタスク 文の一部を省略するタスク因果関係 「準プロフェッショナル」状況に関するタスク 2 つの答えがあるタスク モニター画面上のマウス カーソルの位置を選択するタスク オープン フォームのタスク 短い答えのあるタスク 拡張された答えのあるタスク


12 多肢選択タスクの要件 タスクのテキストでは、曖昧さや不明確な表現を排除する必要があります。 タスクの主要部分は非常に簡潔にまとめられており、7 ~ 8 単語からなる 1 文に過ぎません。 タスクは非常に簡単です 構文構造; タスクの主要部分にはできるだけ多くの単語が含まれており、与えられた問題に対して 2 ~ 3 個のキーワードを答えに残しておきます。 1 つのタスクに対するすべての答えはほぼ同じ長さでなければなりません。または、一部のタスクでは正解が他のものより短い場合があります。 推測による正解の選択に寄与する言葉による連想はすべてテキストから除外する必要があります。 異なるタスクで正解として同じ桁番号を選択する頻度はほぼ同じである必要があります。 タスクの主要部分には、与えられた問題に無関係な内容を一切含めないでください。 繰り返される単語はすべて、課題の本文に入力することで回答から除外する必要があります。


13 多肢選択タスクの要件 回答に「すべて」、「なし」、「決して」、「常に」、「上記のどれでもない」、「上記のすべて」という単語を使用することはお勧めできません。 場合によっては、正解を推測するのに役立ちます。 次々に続く回答は、不正解のリストから除外されます。 問題に関する価値判断や学生の意見を含む課題はテストから除外されます。 すべての気を散らすものは、正解を知らない被験者にとって同様に魅力的であるはずです。 問題の主要部分はステートメントの形式で定式化され、次の要素を置き換えると真または偽のステートメントに変わります。答え。 1 つのタスクに対する答えが、他のテスト タスクに対する正解の鍵として機能するべきではありません。 あるタスクの気を散らす要因を他のテスト タスクの答えとして使用しないでください。 タスクに代替回答が含まれている場合は、正解の直後に代替回答を与えるべきではありません。通常、回答者の注意はこれら 2 つの回答のみに集中するためです。 すべての回答は設計が並行しており、テスト タスクの主要部分と文法的に一貫している必要があります。


14 情報技術 1. サーバーとは、プログラムです。 テスト; チーム; コンピューター。 2.「」のようなウイルス トロイの木馬「偽装がないことが特徴です。はい、いいえ。経済理論 3. 労働力、資本、土地、起業能力 - 経済資源の基本的な分類。お金は経済資源として分類できますか? はい、慣れていれば可能です。」投資資源を購入する; サービスの労働力の支払いに使用する場合は可能; すべての答えは正しい; すべての答えは不正解; お金を銀行に預けて利息が得られる場合は可能 経済理論 4. 起業家の特殊性労働力とは対照的に、経済資源としての人材とは、起業家が生産に必要なすべての要素を結び付けることによって商品やサービスの生産とリリースを組織することができ、起業家が生産管理と事業管理について主な決定を下すことができます。起業家は決して危険を冒さない 現金で; すべての答えは正しいです。 答え 1) と 2) は正解です。


15 タスク B では、質問に対する回答の選択肢が不十分に定式化されています。正解は不正解の中に「隠蔽」される必要があります。 課題 B では、正解は長さによって簡単に区別できます。 マーケティング A. 需要曲線は、次の点を示しています。昨日よりも今日生産される商品が少ない場合、より低い価格でしか販売できない商品が少なくなります。 昨日よりも今日より多くの商品が生産された場合、その増加した量はより高い価格でしか販売できません。 昨日よりも今日より多くの商品が生産された場合、その増加した量はより低い価格でしか販売できません。 今日、昨日と同じ量の商品が生産された場合、その価格を徐々に上げることができます。 B. 特定の製品に対する競合他社の値下げに対するあなたの反応: 私も値下げします。 私は、企業の能力と現実の状況を考慮し、価格政策の調整を含む一連の措置をただちに実行します。 私はこの市場を去るつもりです。 この商品の生産を中止させていただきます。


16 提示された質問に対する回答の選択肢が不十分に定式化されています。 回答は質問に含まれるフレーズの続きである必要があります。 マーケティング パートナーが個別に決定を下さないことは、パートナーシップでは一般的ではありません。 各パートナーは会社の負債に対して無限の責任を負います。 株式を売却して追加資金を調達する可能性。 パートナーは会社の業務に対して個人的に責任を負います。 株式を売却して追加資金を調達することは不可能です。 BCT (ボストン コンサルティング グループ) マトリックスでは、製品カテゴリー (ドル箱) は次のように定義されています。 高い売上成長率。 ライフサイクルの終わりにあります。 市場シェアを維持するために必要以上の利益がもたらされる。 同社の製品ポートフォリオに長い間残っている製品です。


17 情報技術 左側のパネルのドライブを変更するにはどうすればよいですか? Shift+F1 Ctrl+F1 Alt +F2 Alt +F1 経済理論 供給曲線は、生産コストの価値と製品の価格の関係を反映しています。 人口の増加と供給。 特定の製品の生産量とその価格。 生産コストと供給量の大きさ。 特定の製品の生産量と使用されるリソースの量 最初の例では、答えの選択肢が同じ確率ではないことは明らかです - 1) 2 つの同一の組み合わせ - Alt +F2 と Alt +F1、2) F1 が 3 回発生したがって、正解は Alt +F1 です。 推測の可能性は最小限に抑える必要があります。 例外は、計算を伴う数学的または物理的な問題であり、計算せずに答えを「見る」必要があります。 選択肢の位置に関するルールが守られており、注意をそらす要素には正解要素と不正解要素が組み合わされています。 このテクニックを使用すると、気を散らすものの魅力を高めることができます 経済理論 砂糖はコーヒーを補完しますが、フルクトースの代わりになります。 砂糖の価格が上昇すると、他の条件が同じであれば、コーヒーとフルクトースの需要が減少し、コーヒーとフルクトースの価格が下落する可能性があります。 コーヒー需要の微減とフルクトースの需要の増加、コーヒー価格の上昇とフルクトースの需要の増加に対する正解はありません。

従来のテストとは異なります。伝統的なテストでは、個人の結果をグループの結果と相関させることによって評価が実行されます(統計的標準への方向付け)。基準指向のテストでは、個人の結果を特定の基準と相関させることによって評価が実行されます。 そのような基準は、スキル、能力、知識の習熟度です。

CAT は教育で使用されます。 CAT を使用したテストの目的は、スキルの習熟度を評価することです。 最終的なスコアはスキルの習熟度を表すものであり、個人差は含まれません。 弱点猫。 したがって、基礎的なスキルを評価するためにそれらを使用することが可能です。

CAT の国内の例は、精神発達の学校テスト - SHTUR (1) です。

基準に基づいたテスト– タスクの内容の論理機能分析に基づいて、ある基準に対する個人の達成レベルを決定するために設計されたテストの一種。 通常、特定のタスクを正常に完了するために必要な特定の知識、スキル、能力が基準 (または客観的な基準) とみなされます。 これが、基準指向のテストと、個人の結果とグループの結果の相関関係 (統計的規範への指向) に基づいて評価が実行される従来の心理測定テストとの主な違いです。 「基準に基づくテスト」という用語が提案されました R・グラッサーテスト項目と実際のタスクとの間の内容および構造的対応関係を確立することは、基準指向のテストの開発において最も重要な段階です。 これらの目的は、以下を含むいわゆる仕様によって実現されます。

b) 基準課題の達成を確実にする知識、スキル、能力の体系化。

c) テスト項目のサンプルとその構築のための戦略の説明。

基準参照テストには 2 つのタイプがあります。

1) タスクが同種であるテスト、つまり、同じまたは類似した内容および論理的基盤に基づいて構築されたテスト。 通常、この種の基準指向のテストは教育プログラムに基づいて開発され、関連する知識、スキル、能力の形成を監視するために使用されます。

2) タスクが異種混合であり、論理構造が著しく異なるテスト。 この場合、段階的なテスト構造が一般的であり、各ステップは行動の基準領域に関連する内容の論理機能分析によって決定される独自の難易度によって特徴付けられます。 A. Anastasi (1982) は、テスト指標の解釈の有意義な意味を基準に参照したテストに重点を置くことは、テスト全般に有益な効果をもたらす可能性があると考えています。 特に、特定のスキルや能力に関して知能テストを使用して得られた結果を説明すると、記録される指標が大幅に充実します。 基準参照テストの場合、妥当性と信頼性を判断するための通常の方法はほとんどの場合不適切です。

社会心理学的基準に基づいて、よく知られた心理測定テストを使用して得られた結果が分析されます。

チケット番号 26 の学力テスト。

達成度テストは、スキルと知識の開発の達成レベルを評価することを目的とした一連の精神診断手法です。

2つのグループの学力テスト:

1. 学習成功度テスト(教育システムで使用)

2. 専門的業績に関する試験(専門的および労働的行為を遂行するために必要な専門知識および業務技能を診断するための試験)。

学力検査は適性検査の逆です。 違い: これらのテストの間には、診断される以前の経験の均一性の程度に違いがあります。 適性テストは学生が受けるさまざまな経験の蓄積の影響を反映するのに対し、学力テストは何かを学ぶ比較的標準的なコースの影響を反映します。

適性検査・学力検査の実施目的:

能力テスト - 活動の成功の違いを予測するため

· 達成度テスト - トレーニング終了時に知識とスキルの最終評価を提供します。

適性テストも達成テストも、能力、スキル、または才能を診断するものではなく、以前の業績の成功のみを診断します。 人が何を学んだかについての評価があります。

学力テストの分類。

幅広い志向 - 知識とスキル、主な学習目標(長期間にわたって計算)の順守を評価します。 例: 科学原理を理解するための学力テスト。

高度に専門化 - 個々の原則、個人または学問的主題を習得します。 例: 数学のトピック - 素数セクションをマスターする - このセクションをどのようにマスターしたか。

達成度テストの利用目的。

先生の評価の代わりに。 教師による評価と比較した多くの利点: 客観性 - 主要なトピックを特定し、主要なトピックがどの程度習得されているかを確認できます。 各トピックの習得度のプロファイルを作成できます。

達成度テストは非常にコンパクトです。 到達度テストは集団テストなので便利です。 学習プロセス自体を評価し、改善することができます。

達成度テストをどのように設計するか?

1. 達成度テストは、コース内容の特定の領域を反映するタスクで構成されます。 まず、内容のトピックを計画し、学習過程で重要なトピックを特定する必要があります。 トピックを教えた教師は、学力テストの作成に参加する必要があります。 精神診断医は主要なテーマを知っていなければなりません。

2. 二次的な知識や重要でない詳細をタスクから除外します。 課題の完了は生徒の機械的記憶にある程度依存するのではなく、むしろ生徒の理解と批判的な評価に依存することが望ましいです。

3. 課題は学習目標を代表するものでなければなりません。 学習目標、教材の習得の成功など、評価が難しいものがある場合(たとえば、権利に関するトピックを習得するなど)、教材の習得を反映するような方法で課題を作成する必要があります。

4. 学力テストは、学習する学問分野を完全にカバーしていなければなりません。 課題は、研究対象の領域を広く代表するものである必要があります。

5. テストタスクには無関係な複雑な要素があってはならず、複雑な要素があってはならず、追加の困難があってはなりません。

6. 各タスクには回答の選択肢が付いています。

7. タスクは明確、簡潔、そして明確に定式化されなければなりません。 どのタスクも別のテスト タスクのヒントにならないようにします (コンパイル後に確認します)。

回答は、回答を思い出す可能性を排除するような方法で構成する必要があります(つまり、トピックに関係のない回答の選択肢や、被験者が推測できないように非常に簡単な回答の選択肢を与えないでください。回答の選択肢は明らかに受け入れられないものとして破棄されます) )。

8. 履行基準が設定されます。 心理学者は多数のタスクを作成しますが、そのすべてがテストに含まれるわけではありません。 まず、すべてのタスクがチェックされます。 テストには、その内容を十分に理解している人の 100% 多数が解決するタスクが含まれます。 2 番目のテストは、内容をマスターしていない人向けです。半分未満を完了する必要があります。 割り当ては最大基準に従ってコンパイルされます。 90-100% - 高レベルのトレーニング。 学力テストは静的な基準に対して評価されるのではなく、クラスに対して評価されます。 個々の結果が比較されます。

専門的な成果のテスト。

職業能力試験は、専門訓練や職業訓練の効果を評価するために行われます。 最も責任あるポジションに人を選ぶ - 専門的な選択。 従業員が別のポジションに移動する際にスキルレベルを評価するために使用されます。 目標は、専門的な知識とスキルのトレーニングのレベルを評価することです。

3 つの形式の専門能力テスト:

1.アクション実行テスト

2. 書かれた

3. 専門的な業績に関する口頭試験

1. 実行テスト。 基本的なスキルやアクションの習得を示す一連のタスクの完了。 これらのメカニズム、機器、ツールは、専門的活動の個々の要素の作業またはモデル化、個々の操作を再現する機能に使用されます。

2. 筆記による学力テスト。 ある人がどの程度の専門知識を持っているかを知る必要がある場合に使用されます。 フォーム上の割り当て。 特定の形式の回答を使用して書面で行われます。

3. 専門的な業績に関する口頭試験。 第一次世界大戦中、人材の選抜には適性検査が行われた。 専門知識を明らかにする一連の質問。 インタビュー形式で診断します。 個別に実施しております。 使いやすい。 印刷する必要はありません。 被験者は指定された形式で回答しなければなりません。

職業達成テストは、達成テストと同じように作成されます。 明らかに数倍の数のタスクが作成されます。 彼らはチェックします。 3 つのグループの労働者がテストされます。

1. 高度な資格を持つ専門家

2.初心者

3. 関連する専門職の代表者。

次の場合、タスクはテストに含まれます。

· タスクは大多数の専門家によって完了されました (これは有効性の兆候です)

· タスクを完了した初心者の割合は低かった (約 60 ~ 70%)

· そして、さらに少数の関連専門職の代表者がタスクを完了した場合。

達成度テストは、250 種類を超える専門的活動に対して開発されています。 実際にはそのようなテストはありません。


チケット番号 46 専門的活動の精神診断。

専門的活動の精神診断特別な手段の使用に基づいた間接的な質問を使用して、人の職業上の関心を調査できます。 心理テストこれにより、その人の職業上の志向性をより詳しく知ることができ、その表現の程度を特定することが可能になります。

職業適性の診断: 個人の職業適性は、「特別な知識、技術、能力を備えた状態で、社会的に許容される労働効率を達成するために必要かつ十分な一連の心理的および精神生理学的特性」と定義されます。 この概念には、「仕事そのものの過程やその結果を評価する際に人が感じる満足感」も含まれます。

専門的な診断のタスク: a) 現在のプロフェッショナリズムのレベルの決定。 b) 専門職の要件に対する個人の遵守と、個人の要件に対する専門職の遵守を確立する。 c) 個人の潜在的な専門的能力を特定する。 d) 特定の従業員が実際の専門能力を活用して効果的に仕事を遂行できるよう支援すること。
したがって、専門家の専門的活動を診断することは、その時点での専門性のレベルを決定し、特定の専門職の客観的要件に対する特定の人の遵守の程度を確立することを含む、診断機能自体を実行するだけではありません。 最終的に、専門家の専門的活動を診断した結果は、その人にとってさらなる個人的成長と専門的成長のための可能な方向性を決定することになります。 個人の職業に対する要件、職業上の自己実現の潜在的な機会、および実際の職業上の機会を判断することは、専門家が職業上の活動を最適化するのに大きく役立ちます。

法執行機関に選ばれた候補者の精神診断
精神診断検査 候補者に仕える 法執行機関特別に選択された一連のテストを使用して実行する必要があります。
これは、次の問題の解決策を提供します。 候補者、 ほとんど
個々の心理的性質に応じて働くのに適している
法執行機関。 独自の方法で、
知的能力が大きく影響を受ける可能性がある
職業上の不適応であり、したがって要件を満たしていない場合、
法執行当局に提出された。
精神診断検査中 候補者指名予備金から
仕事への適性の程度を心理的に評価する
リーダーとして。 この場合、同じバッテリーが使用されます
初めて仕事に就く人の選択と同様に、テストは、
違いは、職業上重要な資質が、
管理職に任命された人。
上記の目的に従って、精神診断検査は次のことを行う必要があります。
· 候補者の知的発達の一般的なレベルを特定する。
彼の個々の心理的特性の構造、気質の特徴
そして性格、選んだ職業に対する適応能力。
· 十分な信頼性があり、電流だけでなく
(診断)だけでなく、予測の妥当性も考慮します。 機会を与える
候補者の現状を評価するだけでなく、科学的にまとめます
彼の将来に関する最も合理的で信頼できる予測
効果的な使用。
・コンパクトで集団検査に便利 候補者 V
自動処理を使用した限られた期間
試験結果;
・改善のために相互にチェックし、補完し合う
得られた結果の信頼性、精度、信頼性。
人の心理検査 選択された V 臓器検察庁も同様に、
予備役から検察庁の指導的地位に昇進した
地域的かつ平等なレベルは、これらのテストに基づいて作成される必要があります。
専門的な心理学の経験を総合的に研究した結果、
に近いいくつかの州法務部門に蓄積されている
従業員の仕事の性質と専門的活動
検察官、および特別に実施された捜査に基づいて、
研究の結果、一連のテストが完了しました。
主なものには、次の精神診断方法が含まれます。
J. Raven による行列、R.B. による 16 要素性格アンケート カテラ (16-FLO)、
標準化された性格研究方法 (SMIL) - 適応。 V
追加: M. Luscher カラーテスト、アンケート「レベル」
A.M. エトキン著「主観的コントロール」、USK アンケート、テスト「行動戦略」
紛争状況」K.トーマス著。
研究の過程で、専門家の心理的基準
選択されたテストによって明らかにされた適合性は、
検察官を評価するための客観的な基準。 個人ファイル、
並びに検察グループの指導的地位に任命された事実
昇進予備軍から労働者を除外することで、検査を受けたすべての労働者を分離することができた
職業上の適性を 4 つのグループに分類します。
1 番目のグループ - 高レベルのプロフェッショナルな効率性、完全なレベル
職務上のコンプライアンス、職業上の成功の可能性が非常に高い予測。
2 番目のグループ - 職業上の適性の平均レベル (主に
検察および捜査の専門分野の要件を満たしている)。
3番目のグループ - 候補者は検察庁の要件を部分的に満たしています
調査の専門知識(以下の場合に雇用可能) 多数
欠員);
グループ 4 - 専門的効率の低レベル、一貫性のなさ
正式な任命候補者、彼の職業上の失敗の予感。
J. Raven の漸進行列スケール (Raven のテスト)。
このテストは被験者の知能を研究し、その能力を特定するように設計されています。
論理的に考える能力、オブジェクト間の重要なつながりを見つける能力、
現象、精神的パフォーマンス、能力のレベルを判断するため
注意、知性全般を集中させます。 資質、
弁護士の活動、さらには検察や捜査の活動に必要な場合
労働者。 この方法による低い結果により、症状が軽減された人々を特定することが可能になります。
知的、認知能力が未発達
分析的思考、集中力の欠如。

受験者の同化の程度を確認できます 特定のセクション特定の主題分野で。 これらのテストは 20 世紀の 60 年代に登場しました。 基準指向のテストは次のように分類されます。 対象分野そして資格試験。

基準参照テストの目的は、受験者が基準を知っているかどうかを判断することです。 教材(件名、セクション、トピック)。 テストの結果、すべての被験者がすべてのタスクを正常に完了したことが判明する場合があります。 これは、トレーニング教材を習得したことを意味します。 すべての被験者がテスト課題を完了できなかった場合、これは教材が習得されていないことを意味します。 どちらの場合も、テストはタスクを完了しました。

CRITERION-BASED テストは、学生が習得すべき知識、スキル、能力の全範囲に対する教育成果のレベルを測定できるタスク システムです。 このようなテストの材料は、特別な分析によって確立された、特定の学問的主題とその実施の個々の心理的側面からのタスクです。

テスト結果と社会心理学的基準を比較するとき、学童の精神的発達が考慮されている年齢発達段階に対応しているかどうかを判断します。 テストの結果を基準と比較することで、生徒が行った精神的行動が検討中の資料の論理に対応しているかどうかを判断できます。 教育内容の特定の分野に特有の精神発達の要素間の関連性は研究の対象となります。 「規範的」な方法と「基準」的な方法を実施した結果の相関関係は、訓練の特定の段階で学問の内容を習得する際の学生の精神的発達の特徴を確立する可能性があります。

28. 裁判所とその内容および 構造的特徴特定の学習状況に対応し、その結果を監視および評価する運用手段として機能します。 通常、高いテスト再テスト信頼性係数の取得に関連する制限 (特に、再テストに対するトレーニングの影響、生徒の概念的および論理的発達の変化の判断など) は、CORT 状況で現れざるを得ません。 したがって、トレーニングの特定の段階を完了していない学生の CORT の結果は、当該の教材を習得した後の同じ学生のテスト結果とは大きく異なります。

CORT の国内の例としては、学校の精神発達テストがあります。 SHTUR は、7 年生から 9 年生の青少年の精神的発達を診断することを目的としています。

SHTUR は 6 つのサブテストで構成され、各サブテストには 15 ~ 25 の同様のタスクが含まれる場合があります。

最初の 2 つのサブテストは、学童の一般的な認識を特定することを目的としており、生徒が能動的および受動的な発話において特定の科学的、文化的、社会政治的な用語や概念をどの程度適切に使用しているかを判断することができます。

3 番目のサブテストは類推を確立する能力を確認すること、4 番目は論理的な分類、5 番目は論理的な一般化、6 番目は数列を構成するための規則を見つけることを目的としています。

SHTUR テストはグループテストです。 各サブテストを完了するために割り当てられた時間は限られており、すべての生徒にとって十分な時間です。 テストは 2 つの並列形式 A と B で開発されます。

SHTUR の著者は、K.M. Gurevich、M.K. Akimova、E.M. Borisova、V.G. Zarkhin、V.T. Kozlova、G.P. Loginova です。 開発されたテストは、あらゆる診断テストが満たさなければならない高い統計的基準を満たしています。

32. 年で表すと、特定の個人が精神的発達の点で、特定の年齢のほとんどの人々に相当することを示します。 たとえば、23 歳(実際のパスポート年齢)の若者をテストしたところ、彼の精神年齢は 25 歳であることが判明しました。 このことから、この若者はほとんどの 25 歳と同じくらい知的に発達していることがわかります。 彼の知能指数 (IQ) = 25x23 = 1.1、これは約 110% (「優れた」標準) です。