Тесты достижения примеры известных. Тесты достижений и тесты способностей

Для диагностики успешности обучения разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов, либо малоформализованные диагностические средства, которые может использовать учитель, такие как наблюдение, беседа и др.). Как отмечает А. Анастази, по численности этот тип тестов занимает первое место.

Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин, являются более объективным показателем обученности, чем оценка. Последняя зачастую становится не только оценкой знаний учащегося, но и инструментом воздействия на него, может выражать отношение педагога к его дисциплинированности, организованности, особенностям поведения и т.д. Тесты достижений лишены этих недостатков, разумеется, при условии грамотного их составления и применения.

Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во-первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками учебным материалом, например разделом математики "стереометрия" или курсом английского языка. На формировании способностей (например, пространственных) влияние обучения также сказывается, но оно не является единственным фактором, определяющим уровень их развития. Поэтому при диагностике способностей трудно найти однозначное объяснение высокой или низкой степени их развитости у школьника.

Во-вторых, различие между тестами определяется целями их применения. Тесты способностей направлены, главным образом, на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения. Тесты же достижений применяются для оценки успешности овладения конкретными знаниями с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов и т.д., т.е. с помощью этих тестов диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов. Вместе с тем нельзя отрицать, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной учебной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не отразиться на дальнейшем процессе обучения.

Тесты достижений отличаются также и от тестов интеллекта. Последние не направлены на диагностику конкретных знаний или фактов, а требуют от учащегося умения совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие как аналогии, классификации, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа. Например, тест достижений на материале истории определенного периода может содержать такие вопросы:

Заполни пропуски в предложениях:

Вторая мировая война началась в... году: а) 1945, б) 1941, в) 1939, г) 1935.

22 июня 1941 года фашисты напали на... : а) Польшу, б) Советский Союз, в) Францию, г) Венгрию.

В тесте же умственного развития вопросы с использованием понятий из истории будут иметь следующий вид:

Вам даны пять слов. Четыре из них объединены общим признаком, пятое слово к ним не подходит. Его надо найти и подчеркнуть: а) товар, б) город, в) ярмарка, г) натуральное хозяйство, д) деньги; а) рабовладелец, б) раб, в) крестьянин, г) рабочий, д) ремесленник.

Для того чтобы правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный ученик, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях теста достижений. Однако если у него плохо сформированы умения работать с понятиями, анализировать их, находить существенные признаки и т.д., то задания теста интеллекта могут вызвать значительные затруднения, поскольку для их выполнения одной хорошей памяти недостаточно. Необходимо владение целым рядом мыслительных операций, знание тех понятий, на материале которых составлены задания теста.

Наряду с тестами достижений, предназначенными для оценки усвоения знаний по конкретным дисциплинам или их циклам, в психологии разрабатываются и более широко ориентированные тесты. Это, например, тесты на оценку отдельных навыков, требуемых школьнику на разных этапах обучения, таких как некоторые общие принципы решения математических задач, анализа литературных текстов и др. Еще более широко ориентированными являются тесты для изучения умений, которые могут пригодиться при овладении рядом дисциплин, например навыки работы с учебником, математическими таблицами, географическими картами, энциклопедиями и словарями.

И наконец, существуют тесты, направленные на оценку влияния обучения на формирование логического мышления, способности рассуждать, строить выводы на основе анализа определенного круга данных и т.д. Эти тесты в наибольшей степени приближаются по своему содержанию к тестам интеллекта и высоко коррелируют с последними. Поскольку тесты достижений предназначены для оценки эффективности обучения по конкретным предметам, то обязательным участником формулирования отдельных заданий должен стать преподаватель. Психолог же обязан обеспечить соблюдение всех формальных процедур, требуемых для создания надежного и валидного инструмента, с помощью которого можно было бы осуществлять диагностику и проводить сопоставления по исследуемым качествам отдельных учащихся или их групп (классов, школ, регионов и т.д.).

Отдельные тесты достижений можно объединять в тестовые батареи, что позволяет получать профили показателей успешности обучения разным дисциплинам. Обычно тестовые батареи предназначаются для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от класса к классу либо от курса к курсу. Однако в последнее время созданы батареи, позволяющие получать и такие данные.

При составлении заданий теста достижений следует соблюдать ряд правил, необходимых для создания надежного, сбалансированного инструмента оценки успешности овладения определенными учебными дисциплинами или их разделами. Так, необходимо проанализировать содержание заданий с позиции равной представленности в тесте разных учебных тем, понятий, действий и т.д. Тест должен быть не перегружен второстепенными терминами, несущественными деталями и не иметь акцента на механическую память, которая может быть задействована, если в тест включать точные формулировки из учебника или фрагменты из него. Задания теста должны быть сформулированы четко, кратко и недвусмысленно, чтобы все учащиеся однозначно понимали смысл того, что у них спрашивается. Важно проследить, чтобы ни одно задание теста не могло служить подсказкой для ответа на другое.

Варианты ответов на каждое задание должны подбираться таким образом, чтобы исключались возможности простой догадки или отбрасывания заведомо неподходящего ответа.

Важно выбирать и наиболее приемлемую форму ответов на задания. Учитывая, что задаваемый вопрос должен быть сформулирован коротко, желательно также кратко и однозначно формулировать ответы. Например, удобна альтернативная форма ответов, когда учащийся должен подчеркнуть одно из перечисленных решений "да - нет", "верно - неверно". Часто в задании делаются пропуски, которые должен заполнить испытуемый, выбирая из представленного набора ответов верный (выше мы приводили пример задания из теста достижений с такой формой ответов). Обычно на выбор предлагается 4 - 5 вариантов ответа. Этот вид теста, как и любой другой, должен удовлетворять всем необходимым критериям, обладать высокой надежностью и удовлетворительной валидностью.

Наряду с тестами учебных достижений в высшей школе могут найти применение и тесты профессиональных достижений. Они применяются, во-первых, для измерения эффективности обучения или тренировок; во-вторых, для отбора персонала на наиболее ответственные должности, где требуются хорошие профессиональные знания и опыт; в-третьих, для определения уровня квалификации рабочих и служащих при решении вопросов перемещения и распределения кадров по рабочим постам. Эти тесты, как правило, призваны оценивать уровни развития конкретных знаний и навыков, требуемых для отдельных профессий, поэтому область их применения ограничена и определяется рамками узкой специализации.

Известны три формы обсуждаемых тестов: тесты исполнения или, как их еще называют, тесты действия, образцы выполнения работы, а также письменные и устные тесты.

В тестах действия требуется выполнить ряд заданий, наиболее важных для успешного осуществления определенной профессиональной деятельности. Зачастую для этого просто заимствуются отдельные элементы из реальной трудовой деятельности. Поэтому для проведения тестирования могут быть использованы соответствующее оборудование или инструменты. Если это по каким-то причинам невозможно, то используются тренажеры, способные либо воспроизводить отдельные рабочие операции, либо моделировать узловые ситуации профессиональной деятельности. Учитываются скорость выполнения работы и ее качество (например, число и качество деталей и т.д.).

Тест имеет отдельные нормативы для мастеров высокой квалификации и для начинающих работников. Известные специалисты в области промышленной психологии Дж.Тиффин и Э.Маккормик рекомендуют использовать в качестве критериев для сравнения три квалификационные ступени работников: низкую, среднюю и высокую. Соответственно, валидность теста устанавливается путем сопоставления средних показателей его выполнения по этим трем группам. Очень распространены тесты исполнения при определении уровня квалификации представителей конторских профессий (клерков, стенографисток, машинисток, секретарей и др.). Это, например, Блэкстонский тест оценки квалификации стенографисток, тест адаптации к конторской работе Пурдье, тест изучения навыков печатания на машинке Терстона и ряд других.

Письменные тесты достижений используются там, где на первый план выступают специальные знания, осведомленность, информированность. Они, как правило, создаются по заказу, имеют узкую профессиональную направленность и представляют собой серию вопросов, которые предъявляются на специальных бланках. Преимущество письменных тестов достижений состоит в возможности одновременной проверки целой группы людей.

Еще одним вариантом оценки уровня квалификации работников являются устные тесты профессиональных достижений. Они широко применялись в период Первой мировой войны для отбора и аттестации военного персонала. Тесты представляют собой серию вопросов, касающихся специальных профессиональных знаний, и задаются в форме интервью. Они удобны в применении, просты в интерпретации.

Следует отметить, что тесты, конечно же, не могут раскрыть полностью все стороны квалификации работника. Их целесообразно использовать в комплексе с другими способами определения уровня профессионального мастерства.

Тесты достижений в настоящее время широко распространены за рубежом, например, в США они разработаны более чем для 250 различных профессий.

На наш взгляд, этот тип тестов мог бы реально помочь в решении целого ряда проблем высшей школы. Особенно пригодны они для оценки эффективности профессионального обучения, сравнения разных методов и учебных программ путем сопоставления достижений групп, обучающихся разными способами. Не менее полезны они для выявления пробелов в знаниях у начинающих профессионалов и их своевременного доучивания с помощью индивидуализированных методов и приемов. Объективность, простота применения, краткость процедуры делают их пригодными для аттестации работников на разряд, для оценки квалификации. Однако работа по созданию таких тестов не проста, она требует специальных знаний и квалификации.

Оценивая тесты учебных и профессиональных достижений в целом, следует отметить их хорошие возможности в осуществлении контроля за процессами обучения и формирования профпригодности.

Контрольные вопросы и задание

1. Перечислите варианты названий тестов достижений.

2. В чем преимущества тестов достижений по сравнению с традиционной оценкой?

3. Почему нельзя отнести тесты достижений к категории интеллектуальных тестов или тестов способностей?

4. Укажите основные правила составления тестов успешности.

5. Для решения каких задач могут использоваться в высшей школе тесты профессиональных достижений?

Для понимания различий между педагогическими и психологическими тестами необходимо ввести понятие тестов достижений и тестов способностей. Среди всех типов стандартизованных тестов тесты достижений численно превосходят все остальные. Они создавались для измерения эффективности программ и процесса обучения. Именно этот тип тестов в общем смысле ассоциируется с названием «педагогический тест». Тесты достижений принято противопоставлять психологическим тестам способностей, состоящим из тестов общего интеллекта, комплексных батарей способностей и тестов специальных способностей. А. Анастази считает, что «с определенной точки зрения, различия между тестами достижений и способностей есть различия в степени единообразия соответствующего предшествующего опыта. А это значит, что тесты достижений измеряют влияние относительно стандартизованного курса обучения, такого как курс биологии, физики или программирования. В отличие от тестов достижений выполнение тестов способностей отражает совокупное влияние разнообразного опыта повседневной жизни». Можно сказать, что тесты способностей измеряют эффективность обучения в относительно неконтролируемых и неизвестных условиях, в то время как тесты достижений измеряют эффективность обучения при частично известных и контролируемых условиях.

Другим отличием тестов способностей от тестов достижений являются цели их использования. Тесты способностей предоставляют некоторый срез психологических данных, на основе которых прогнозируется выполнение той или иной деятельности и делается предположение о возможных достижениях в новой ситуации. Результаты тестов способностей содержат информацию, позволяющую произвести оценку целесообразности прохождения индивидом специальных курсов обучения. Напротив, тесты достижений обычно дают конечную оценку достижений индивида по завершении обучения, в них основной интерес сосредоточен на том, какой информацией индивид владеет и что может делать к настоящему времени. Эта разница между тестами, пожалуй, лучше всего видна, когда оценивается их валидность. Лучший способ оценить тесты способностей – это осуществить прогностическую, критериально ориентированную валидацию, тогда как тесты достижений в основном оцениваются в терминах валидности по содержанию.

Тем не менее, нужно признать, что различия между тестами способностей и достижений не столь однозначны. Некоторые тесты способностей могут отражать достаточно конкретную и единообразную предшествующую образовательную программу, а тесты достижений – охватывать относительно широкий нестандартизованный курс обучения и использоваться в качестве вероятностной информации о возможностях предстоящего обучения. В сущности, тесты достижений служат тем же целям, что и тесты способностей. Скажем, успехи ученика по математике были определены по его показателю в тесте достижений, который можно затем использовать для прогнозирования его успехов в алгебре.

При рассмотрении различий между тестами способностей и достижений не следует думать, что тесты достижений измеряют эффективность обучения, а тесты способностей – врожденные, не зависящие от обучения способности. Столь ошибочное суждение было достаточно распространено на заре психологического тестирования, но в значительной степени пересмотрено при уточнении смысла используемых в психометрии понятий. Без сомнения, все психологические тесты измеряют наличное поведение индивида, а оно неизбежно отражает воздействие прошедшего обучения. Тем не менее, факт, что каждый тестовый показатель связан с «прошлым», не устраняет его связи с «будущим».

Важное отличие психологических тестов от педагогических видится в том, что при составлении первых исследователи стараются учесть предрасположенность учеников к различным видам репрезентативных систем (визуалы, аудиалы, кинестетики) и различные типы интеллекта (вербальный, логический, пространственный и т.д.). К сожалению, в педагогике возможности такого учета значительно ограничены, во-первых, преобладанием в школе знаково-логической визуальной информации, направленной на развитие соответствующих типов интеллекта. Как правило, от учеников требуется воспроизведение рационализированной и вербальной (письменной или устной) информации о фактах. Поэтому часто дети с более развитыми пространственными способностями выглядят неуспевающими, а дети с более развитыми по сравнению с пространственными вербальными способностями кажутся необыкновенно талантливыми.

Многочисленные функции тестов достижений давно признаны в образовании. Как средство выставления оценок подобные тесты хороши своей объективностью и единообразием. Если они должным образом построены, то обладают и другими достоинствами: их содержание адекватно изучаемому предмету, они сводят на нет в процедуре оценивания действие случайных факторов. Тесты достижений составляют также важный компонент корригирующих программ обучения, поскольку их можно использовать как для выявления учащихся, не способных к отдельным видам обучения, тан и для измерения успехов в выполнении корригирующих программ.

При всех типах обучения периодическое применение правильно построенных и соответственно подобранных тестов достижений облегчает этот процесс. Такие тесты выявляют недостатки прошлого обучения, подсказывают направление последующего и обеспечивают мотивацию обучающегося. Побудительную силу знания своих результатов неоднократно выявляли психологические эксперименты с самыми разнообразными ситуациями обучения: варьировали возраст испытуемых и их образовательный уровень. Эффективность такой самопроверки обычно сказывается немедленно. Поэтому, когда проверка достижений применяется главным образом как средство обучения, желательно, чтобы учащиеся узнали о допущенных ошибках как можно раньше.

Кроме того, тесты достижений помогают приспособить курс обучения к потребностям индивида. Учение происходит более плодотворно, когда начинается с той стадии, на которой уже находится обучающийся. Проведение тестирования в начале учебного года позволяет предпринять конструктивные шаги по ликвидации обнаруженных при выполнении тестов основных пробелов в знаниях учащихся.

Особенно важно в связи с этим видеть многочисленные условия, влияющие как на выполнение теста, так и на школьное обучение, в том числе кумулятивное влияние предшествующего и настоящего жизненного опыта, приобретаемого вне школьной среды.

Так, интеллект часто связывается с развитыми логико-математическими способностями или высокой осведомленностью человека. Но сегодня такая трактовка представляется явно упрощенной и ограниченной. Интеллект – это наша способность успешно реагировать на новые ситуации и учиться на опыте (Г. Гарднер). Возможности творческого развития человека и успешность будущей профессиональной и жизненной адаптации детерминируются с развитием семи видов интеллекта.

1. Вербальный интеллект – это способности, предполагающие умение аргументировать, убеждать, беседовать, поддерживать и учить с помощью речевых навыков. Этот вид интеллекта просто необходим журналистам, адвокатам, писателям, учителям. Тренировка вербального интеллекта успешно происходит в операциях чтения, письма, сочинительства и в процессе публичных выступлений (дискуссий, монологов, задавания вопросов и ответов на них).

2.Логико-математический интеллект – умение проводить операции с числами и логикой, способность думать в понятиях причины и следствия, формулировать тезисы, развивать концепции, анализировать, классифицировать и обобщать.

3.Пространственно-визуальный интеллект – этот вид интеллекта работает в образах, метафорах и пространственных представлениях. Люди с развитым пространственным интеллектом отличаются наблюдательностью, способностью легко ориентироваться на местности и в незнакомой среде, предпочтением выражать свои идеи графически. Этот вид интеллекта является основой профессиональной деятельности архитекторов, фотографов, художников, скульпторов, пилотов, механиков, инженеров.

4.Музыкально-ритмический интеллект связан со способностью человека к восприятию ритмов и мелодий, гармонии и дисгармонии, запоминанию музыкальных интонаций, ладов и звукосочетания.

5. Телесно-кинестетический интеллект – интеллект нашего тела. К нему относятся: способность контролировать движения, ловко оперировать частями тела, способность развивать и сохранять физические качества. К сожалению, в учебном процессе этим интеллектом недопустимо пренебрегают.

6.Межличностный интеллект – под этим понимается способность осуществлять коммуникацию, вступать во взаимодействие с людьми, понимать, чувствовать и учитывать уникальность каждого, а также умение адекватно предъявляться, без попытки спрятаться за других, за свои проекции, шаблоны, стереотипы. Развитие этого интеллекта возможно лишь в условиях интерактивного обучения.

Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механи-ческих, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Было разработано около дюжины комплексных батарей способностей для использования в образовании и при консультировании и распределении персонала. Различаясь составом, методическими качествами, они сходны в одном - их характеризует низкая дифференциальная валидность. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.

Экспериментально-теоретической основой для построения комплексных батарей способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними - факторного анализа. ФАКТОРНЫЙ АНАЛИЗ позволял точнее определить и классифицировать специальные способности. Поэтому остановимся немно-

го на истории этого направления исследований.

Английский психолог Чарльз Спирмен в статье 1904 г. пришел к выводу, что положительная корреляция между тестами на различные способности (например, математические и литературные) выявляет некоторый общий ГЕНЕРАЛЬНЫЙ ФАКТОР. Он обозначил его буквой G (от англ. General - общий). Помимо фактора, общего для всех видов деятельности, в каждом из них при его осуществлении обнаруживается специфический фактор, свойственный только данному виду деятельности («S-фактор»).

[Примечание. После Ч. Спирмена многие другие исследователи неоднократно подтверждали существование генерального фактора. В том числе вполне остроумно это делалось с помощью факторного анализа таблицы обыкновенных отметок учеников по разным школьным предметам (М. Рошлэн). Существование фактора «G» на этих данных пояснить очень просто: как правило, отличники (ученики с высоким G) и двоечники (ученики с низким G), отличающиеся соответственно более высокими или более низкими баллами по всем предметам, встречаются чаще, чем ученики с резко нестабильным профилем достижений - высокими баллами по одним предметам и низкими баллами по другим предметам. - Прим. научного редактора].

Позднее теория Спирмена уступила место МНОГОФАКТОРНЫМ ТЕОРИЯМ интеллекта (подробнее о теориях интеллекта см. 3.4). Выяснилось, что отдельные тестовые показатели объединяются в родственные подгруппы и за каждой такой подгруппой скрывается определенный «латентный фактор», определяющий общий уровень достижений испытуемого по всей подгруппе тестов. Причем в разные тесты один и тот же «латентный фактор» вносит разный вклад (вес, ФАКТОРНУЮ НАГРУЗКУ). Например, «вербальный фактор» может иметь больший вес в

Основы психодиагностики

тесте на словарный запас, меньший - в тесте ело-

весных аналогий и совсем незначительный - в тесте на математическое мышление. Корреляции тестов между собой являются результатом нагруженности их родственным им всем латентным фактором. Важно подчеркнуть, что факторы, которые выделялись в результате факторного анализа, не придумывались и не задавались учеными из теоретических соображений, а возникали как бы сами собой - в результате появления группировок скоррелированных тестов.

Одним из первых разработал и применил многофакторный анализ тестовых данных американский психолог Л. Л. Терстоун (основные работы вышли в 20-30-е гг.). С помощью разработанного им центро-идного метода факторного анализа, основываясь на обширном статистическом материале, он выделил 12 факторов, которые он обозначил как «первичные умственные способности» (см. 3.4). Дальнейшие исследования привели к увеличению факторов. Число когнитивных факторов, описанных на сегодняшний день, "Превышает 120.

Современное понимание факторного анализа вносит некоторое изменение в ту его трактовку, которая существовала в 20-40-х гг. Факторный анализ - это обобщение линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения функциональной связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще. Поэтому факторный анализ и добываемые посредством этого анализа факторы не

Психодиагностика как научная технология

всегда верно отражают зависимости между психическими процессами- В настоящее время разрабатываются более сложные алгоритмы многомерной статистической группировки тестовых данных. К возможностям традиционного факторного анализа и к выделенным с его помощью факторам современные ученые относятся с определенной осторожностью и не считают этот анализ универсальным инструментом изучения психики, а следовательно, и безошибочным базисом для конструирования психологических тестов,

Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, - ТЕСТЫ ДОСТИЖЕНИЙ- Этим термином западные тесто-логи-психометристы окрестили педагогические тесты предметных знаний - знаний по определенным учебным предметам, а также профессиональные тесты - на специальные профессиональные умения и навыки-

В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий-История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845 г.). В Америке тесты достижений используются при отборе сотрудников на государственную службу, начиная уже с 1872 г., а с 1883 г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение первой мировой войны и сразу после нее. [Примечание. Наши обычные школьные контрольные работы на проверку знани^ и умений являются ничем иным, как не слишком хорошо формализованными и отработанными тестами дости-

Основы психодиагностики

жений. - Прим. научного редактора],

Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных тестов достижений и широко применяемых в США до сих пор является Стэнфор-дский тест достижений (SAT), впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах в средних учебных заведениях.

Значительное число тестов специальных способностей и достижений было создано в рамках психотехники (индустриальной психологии) под воздействием практических запросов со стороны промышленности и экономики. Дальнейшее развитие тестов достижений привело к появлению в середине XX века критериально-ориентированных тестов (см. 3.5).

В целом развитие исследований и сбор статистических данных о применении тестов в психодиагностике значительно продвинуло науку о тестах (ТЕС-ТОЛОГИЮ), которая в психологии составила ядро ПСИХОМЕТРИКИ (науки о психологических измерениях). С 1936 года в США выходит специализированный журнал «Психометрика». Другой ведущий журнал в этой области - «Образовательные и психологические измерения». В этих журналах еще до второй мировой войны и вскоре после нее выпущены ставшие классическими работы таких психометрис-тов, как Рюлон, Гилфорд, Кронбах, обосновавших, в частности, широко используемые ныне методы измерения НАДЕЖНОСТИ, ВАЛИДНОСТИ И РЕПРЕЗЕНТАТИВНОСТИ тестов (см. 2.3).

Психодиагностика как научная технология

Личностная психодиагностика

В практике профотбора психодиагностика оказалась накрепко увязанной с экономическими и прагматическими критериями, которые заставляют очень часто отдавать предпочтение весьма приближенным, но зато очень кратким и очень дешевым при проведении тестам достижений. Подобные тесты не столько дают развернутый психологический портрет тому, кто прошел отбор, сколько направлены на то, чтобы отсеять заведомо непригодных. (В самом деле, зачем измерять зрительную память у кандидата в летчики, который не проходит, например, по более значимому и информативному вестибулярному тесту?)

Таким образом, оптимальность программы психодиагностического обследования оказывается напрямую связана с иерархией измеряемых психических свойств (диагностических признаков) по уровню их информативности в контексте данной прикладной задачи. Наиболее информативные свойства (признаки), как это известно из теории информации, - это те, которые разделяют обследуемую популяцию при- * мерно поровну. Доля присутствия определенного 4 свойства в популяции называется в теории тестирования «БАЗОВЫМ УРОВНЕМ». Как отмечает А. Анас-тази (1982), при резком отклонении базового уровня от оптимального в 50 процентов инкрементная ВА-ЛИДНОСТЬ (см 2.3.) теста оказывается настолько малой, что его использование становится практически нецелесообразным - приращение точности над базовым уровнем не покрывает издержек на само проведение и обработку теста.

Но в медицине - другом важнейшем источнике социального заказа на психодиагностику - базовый уровень интересующих нас патологических отклонений от нормы по определению оказывается весьма

Основы психодиагностики

низким, резко отличающимся от 50 процентов. Вся основанная на модели НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ (см. 2.3.) традиционная «гауссовская» статистика (включая такие известные статистические инструменты, как критерий Стьюдента, коэффициент линейной корреляции Пирсона) в этом случае оказывается во многом неэффективной. В медицине задача специалиста не сводится только лишь к селекции (отделению больных от здоровых), но ему нужно получить точную «диагностическую» картину заболевания с целью определения оптимального лечения, подходящего в данном конкретном индивидуальном случае. Именно эти объективные обстоятельства и условия профессиональной деятельности обусловили развитие в области медицинской психологии второго из двух сложившихся на сегодня различных подходов к диагностике - КЛИНИЧЕСКОГО- Свое название этот подход получил именно в силу теснейшей связи с диагностической деятельностью врача.

Запросы медицинской практики дали импульс развитию методов ЛИЧНОСТНОЙ ПСИХОДИАГНОСТИКИ. Она нацелена на способности не в большей мере, чем на стилевые и мотивационные черты личности. В этой сфере используются чаще всего не тесты, а особые методы, среди которых выделяются прежде всего ОПРОСНИКИ И ПРОЕКТИВНЫЕ МЕТОДИКИ.

Опросники - это большая группа методик, задания которых представлены в виде вопросов или утверждений, а задачей испытуемого является самостоятельное сообщение некоторых сведений о себе в- виде ответов. Теоретической основой этого метода можно считать интроспекционизм - психологию самонаблюдения. Метод опросников вначале рассматривался в качестве разновидности самонаблюдения. Но при заданных вариантах ответа это самонаблюде-

Психодиагностика как научная технология

ние, которому придается стандартизированный характер, по многим формальным признакам сближается с объективным тестированием.

Прототипом личностных опросников был разработанный американским психологом Робертом Вуд-вортсом в 1919 г, «Бланк данных о личности». Этот опросник был предназначен для выявления и отсеивания с военной службы лиц с невротической симптоматикой. За прошедшие с того времени десятилетия опросники получили широчайшее распространение в качестве психодиагностического метода исследования личности. Искусная косвенная постановка вопросов, маскирующая их оценочную направленность, стандартизированная процедура предъявления и подсчета баллов во многом сблизили современные опросники с объективными тестами, основанными на объективных заданиях. Здесь речь идет скорее о тест-опросниках, а не о методе стандартизированного самонаблюдения как таковом.

Последние 50 лет самый популярный личностный тест-опросник - MMPI (Миннесотский Многофазный Личностный Перечень). Он используется преимущественно в клинической практике. Но опытные психиатры и психотерапевты обращаются с MMPI, следуя скорее логике клинического обследования, а не логике измерительного теста, а именно: профиль увязывается с результатами беседы и истории болезни, применяются скорее не групповые, а ИПСАТИВНЫЕ НОРМЫ (сравнение относительных различий по шкалам внутри результатов, полученных от данного конкретного испытуемого), больше внимания уделяется качественным, а не количественным данным и т. п.

Другим известным методом диагностики личности являются ПРОЕКТИВНЫЕ МЕТОДИКИ. Их родоначальником традиционно считается метод словесных ассоциаций, возникший на базе ассоцианистского

ОСНОВЫ ПСИХОДИАГНОСТИКИ

течения в психологии.

Возникновение метода свободных словесных ассоциаций связано с именем уже упоминавшегося выше Ф. Гальтона (1822-1911). В 1879 г. он опубликовал результаты- своих ассоциативных экспериментов. Предлагая испытуемому отвечать на слово-раздражитель первой пришедшей в голову словесной ассоциацией, Гальтон с помощью секундомера фиксировал время ответа. Позднее эта методика получила развитие в исследованиях Э. Крепелина (1892), К. Юнга (1906), Г. Кента и А. Розанова (1910) и других.

Как интерпретируются результаты этой методики? Большинство исследователей сегодня склонны рассматривать ассоциативный эксперимент в качестве приема для изучения интересов и установок личности. Однако следует отметить, что интерпретация получаемых результатов определяется теоретическими взглядами исследователей. Поэтому вопрос о валидности методики (их однозначной настройки на измерение определенного психического свойства) не может быть решен однозначно вне соотнесения с теоретическими позициями ее разработчиков и пользователей.

Ассоциативный эксперимент стимулировал появление такой группы проективных методик, как «неоконченные предложения» (или «завершение предложений»). Впервые для изучения личности «завершение предложений» было использовано А. Пейном в 1928 г.

Кроме ассоцианизма теоретические истоки проективных методов можно искать в, психоанализе, ставящем во главу угла понятие бессознательного. Бессознательное принималось первоначально как.скрытый двигатель личности, мотив, слепо действующий из таинственных глубин организма. Разум, по отношению к бессознательному, служит лишь маскировочным механизмом. Для того, чтобы пси-

Психодиагностика как научная технология

хологу прорваться в область бессознательного, понять скрытые в нем тенденции, необходимо в "эксперименте направить сознание на решение особых заданий, которые позволили бы непроизвольно проявиться бессознательному в особой проективной продукции - бессюжетных словесных ассоциациях, сюжетных фантазиях, образах, выраженных в рисунках (как это делается в рисуночных проективных методиках) и т. п. Такого типа задания и включались в проективные методики.

Одна из самых популярных проективных методик была разработана в 1921 г. швейцарским психиатром Германом Роршахом, который, кстати, одним из первых ввел в обиход термин «психодиагностика». Создавая эту методику, Роршах экспериментировал с большим количеством чернильных пятен, которые он предъявлял различным группам психически больных людей. В результате своих наблюдений Роршах постепенно объединил те характеристики ответов, которые можно было соотнести с различными психическими заболеваниями, в относительно стройную систему показателей. В дальнейшем эта методика использовалась и анализировалась многими исследователями как за рубежом, так и у нас в стране.

Еще одна из старейших и наиболее распространенных в мире проективных методик - Тест тематической апперцепции (ТАТ) - была создана в США в 1935 г. X. Морган и Г. Мюрреем (см.2.5).

Завершая краткий обзор истории развития и становления психологической диагностики на Западе, отметим, что она отличается широким разнообразием используемых методик как в отношении формы, так и их содержания. Возникновение психологической диагностики вызвано требованиями практики, а развитие направлено на удовлетворение ее требований. С этим связано появление не всегда теоретичес-

Основы психодиагностики

ки обоснованных, но методически совершенных приемов и способов диагностирования.

Одновременно с обилием новых лабораторных разработок для практической западной психодиагностики после второй мировой войны стал характерным определенный консерватизм, выражающийся в приверженности к работе с немногими тестами, которые прошли серьезную многолетнюю психометрическую адаптацию, по которым собраны десятки тысяч протоколов, выполнены сотни и тысячи диссертационных работ (по проверке этих тестов на особых контингентах испытуемых и в особых условиях, созданию парциальных тестовых норм, дополнительных шкал и т. п.). Любому новому тесту, каким бы он ни был передовым в научном отношении, в этих условиях очень трудно конкурировать с «классическими» методиками, по которым накоплена огромная методическая литература. Даже новые компьютерные тесты, обладающие массой объективных достоинств (например, гибкими возможностями настройки на конкретного испытуемого - свойствами так называемого АДАПТИВНОГО ТЕСТИРОВАНИЯ), с трудом пробивают себе дорогу и до сих пор не могут сравниться в популярности с «классическими» методиками. Не случайно многие образцы современных компьютерных тестов являются не более, чем компьютерными версиями существовавших до них буклетных, или «карандашно-бумажных», методик.

Медленно завоевывают себе приверженцев на Западе и такие новые научные направления в области личностной психодиагностики, порожденные опять же компьютерной революцией второй половины XX века, которые основываются на комбинации методов стандартизированного опроса и проективных техник. Это прежде всего техники семантического шкалирования (Ч. Осгуд,1952; Дж. Келли, 1965), позволяю-

Психодиагностика как научная технология

щие в результате компьютерной многомерной обработки данных реконструировать так называемые «субъективные семантические пространства» (см. 2.4).

Конструирование тестов достижений.

Любой практический психолог должен уметь сконструировать тест достижений.

Тест достижений – это группа психодиагностических методик, направленных на оценку достигаемого уровня развития навыков и знаний.

2 группы тестов достижений:

Тесты успешности обучения (используются в системе образования)

Тесты профессиональных достижений (тесты диагностики специальных знаний и трудовых навыков, необходимых для выполнения профессионально-трудовых действий).

Тест достижения противоположен тесту способностей. Различия: между этими тестами существует различие в степени единообразия предшествующего опыта, который и диагностируется. Если тест способностей отражает влияние совокупного разнообразного опыта, получаемого учащимися, то тест достижений отражает влияние относительно стандартного курса обучения чему-то.

Цель применения тестов способностей и тестов достижений:

тесты способностей – для предсказания различия успешности выполнения деятельности

тесты достижений – делают конечную оценку знаний и навыков по завершении обучения.

Ни тесты способностей, ни тесты достижений не диагностируют способности, навыки, одаренность, а только успешность предшествующего достижения. Идет оценка того, чему человек научился.

Классификация тестов достижений.

Широкоориентированные – для оценки знаний и навыков, соответствие основным целям обучения (рассчитанным на продолжительное время). Например: тесты достижений на понимание научных принципов.

Узкоспециализированные – усвоение отдельных принципов, отдельных или учебных предметов. Например: усвоение темы в математике – раздел простые числа – как усвоен этот раздел.

Цели использования тестов достижений.

Вместо учительской оценки. Ряд преимуществ по сравнению с учительской оценкой: объективность - можно выяснить насколько усвоены главные темы, выявление основного. Можно построить профиль усвоения каждой темы.

Тесты достижений очень компактны. Тесты достижений – групповые – поэтому удобны. Можно оценить сам процесс обучения и усовершенствовать его.

Как конструировать тесты достижений?

Тест достижений состоит из заданий, которые отражают определенную область содержания курса обучения. Сначала нужно спланировать тему содержания, выявить важные темы в курсе обучения. В конструировании теста достижений должен участвовать учитель, который преподавал темы. Психодиагност должен знать основные темы.

Исключить из задания второстепенные знания, малосущественные детали. Желательно, чтобы выполнение заданий в малой степени зависело от механической памяти ученика, а зависело от понимания, критической оценки ученика.

Задания должны быть репрезентативны целям обучения. Есть цели обучения, успешность усвоения материала, по которым сложно оценить (например, усвоение темы о правах), тогда нужно составлять задания так, чтобы отразить усвоенность материала.

Тест достижений должен полностью охватить ту область учебного предмета, который должен быть изучен. Задания должны быть широко репрезентативны этой изучаемой области.

Тестовые задания должны быть свободны от посторонних затрудняющих элементов, не должно быть затрудняющих элементов, не должно быть дополнительных трудностей.

Каждое задание сопровождается вариантами ответов.

Задание должно быть четко, кратко, недвусмысленно сформулировано. Чтобы ни одно задание не было подсказкой на другое задание теста (проверить после составления).

Ответы должны быть построены так, чтобы исключить возможность напоминания ответов (то есть не давать не относящихся к теме варианты ответов или очень легкие, чтобы испытуемый не смог догадаться, отбросив варианты ответов, как заведомо неприемлемые).

8. Задается критерий выполнения. Психолог разрабатывает большое число заданий, не все они войдут в тест. Для начала все задания проходят проверку. Войдут в тест те задания, которые решаются стопроцентным большинством людей, которые хорошо владеют материалом. Вторая проверка на тех, кто не владеет материалом – они должны выполнить меньше половины. Задания составляются по максимальному критерию. 90-100% - высокий уровень обученности. Тест достижений не оценивается по сопоставлению со статической нормой, а с классом. Сопоставляется индивидуальный результат.

Тесты профессиональных достижений.

Тесты профессиональных достижений используются для оценки эффективности обучения профессионалов или профессиональных тренировок. Для отбора людей на наиболее ответственные должности – профотбор. Используется для оценки уровня квалификации работников, при переходе на другую должность. Цель – оценить уровень обученности профессиональным знаниям, навыкам.

3 формы тестов профессиональных достижений:

тест исполнения действия

письменные

устные тесты профессиональных достижений

Тесты исполнения. Выполнение ряда заданий, обнаруживающих владение основными навыками или действиями. Используются те механизмы, аппаратура, инструменты, которые используются в трудовой деятельности или моделировании отдельных элементов профессиональной деятельности, способность воспроизводить отдельные операции.

Письменные тесты достижений. Используются там, где требуется выяснить, насколько человек владеет специальными знаниями. Задания на бланках. Выполняются в письменной форме с определенной формой ответов.

Устные тесты профессиональных достижений. В период первой мировой войны тесты профессиональных достижений использовались для отбора персонала. Серии вопросов, выявляющих специальные знания. Диагностика в виде интервью. Проводилась индивидуально. Удобны в применении. Не нужно распечатывать. Испытуемый должен в заданной форме отвечать.

Тесты профессиональных достижений создаются, как и тесты достижений. Создается большое количество заданий, заведомо больше в несколько раз. Проверяют. Испытывают три группы работников:

эксперты высокой квалификации

представители смежных профессий.

Задание включается в тест, если:

задание выполнено большинством экспертов (это есть признак валидности)

задание выполнено меньшим процентом новичков (приблизительно 60-70%)

и, если еще меньший процент представителей смежных профессий выполнило задание.

Больше чем для 250 видов профессиональной деятельности разработаны тесты достижений. У нас таких тестов практически нет.

Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механических, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Было разработано около дюжины комплексных батарей способностей для использования в образовании и при консультировании и распределении персонала. Неодинаковые по составу и методическим качествам, они сходны в одном - их характеризует низкая дифференциальная валидпость. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.

Теоретической основой для построения комплексных батарей способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними - факторного анализа. Факторный анализ позволял точнее определить и классифицировать то, что называли специальными способностями. Поэтому остановимся немного на истории этого направления исследований.

Английский психолог Ч. Спирмен (1863-1945) в статье 1904 г. пришел к выводу, что положительная корреляция между тестами на различные способности (например, математические и литературные) выявляет некоторый общий генеральный фактор. Он обозначил его буквой g (g-фактор, от англ. general - общий). Помимо фактора, общего для всех видов интеллектуальной деятельности, в каждом из них при его осуществлении обнаруживается специфический фактор (s-фактор, от англ. specific - характерный, специфический), свойственный только данному виду деятельности.

Теорию Ч. Спирмена называют двухфакторной. Согласно ее положениям, целью психологического тест ирования должно быть измерение g у индивидов. Если такой фактор проявляется во всех изучаемых психических функциях, то его наличие будет единственным основанием для предсказания поведения индивида в разных ситуациях. Измерение же специфических факторов смысла не имеет, поскольку эти факторы - каждый из них - могут обнаружить себя только в одной ситуации.

Ч. Спирмен не отрицал того, что двухфакторп ля теория требует уточнения. Если сравниваемые деятельности достаточно похожи, то в какой-то степени их корреляция может быть результатом не только фактора g, но и некоторого промежуточного фактора - не столь общего, как#, но и не столь специфичного, как s. Такой фактор, свойственный только части деятельностей, был назван групповым.

Позднее распространилась точка зрения, согласно которой структуру свойств составляет ряд достаточно широких групповых факторов, каждый из которых может в разных тестах иметь различный вес. Например, вербальный фактор может иметь больший вес в тесте на словарный запас, меньший - в тесте словесных аналогий и совсем незначительный - в тесте на математическое мышление. Корреляции тестов между собой являются результатом нагруженности их групповым фактором.

Американские психологи Т. Келли и Л. Терстоун, продолжив работы факторно-аналитического направления, занялись проблемами групповых факторов. Их основные работы вышли в 20-30-е гг.

Л. Терстоун (1887-1955), основываясь на многочисленных исследованиях, выделил 12 факторов, которые он обозначил как «первичные умственные способности». Среди них можно отметить следующие:
а) словесное понимание;
б) беглость речи;
в) числовой;
г) пространственный;
д) ассоциативная память;
е) скорость восприятия;
ж) индукция (логическое мышление) и др.

Дальнейшие исследования привели к увеличению факторов. Число когнитивных факторов, описанных на сегодняшний день, превышает 120.

На основе факторных исследований создавались многофакторные батареи тестов способностей, позволяющие измерять индивидуальный уровень каждой из способностей. Наиболее известны среди них Батарея тестон общих способностей (General Aptitude Test Battery - GATB), разработанная Службой занятости США для использования консультантами в государственных учреждениях, и Батарея тестов специальных способностей (Special Aptitude Test Battery - SATB), включающая тесты способностей для конкретных профессий.

Современное понимание факторного анализа вносит некоторое изменение в ту его трактовку, которая была в 20-40-е гг. Факторный анализ - это высшая ступень линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения математической связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще, то же относится и к невысоким коэффициентам корреляции. Поэтому факторный анализ и добываемые посредством этого анализа факторы не всегда верно отражают зависимости между психическими процессами.

Но, пожалуй, главное, что вызывает сомнение, - это понимание так называемых специальных способностей. Эти способности трактуются не как индивидуальные особенности, возникшие в качестве продукта влияний требований общества на индивида, а как особенности, исконно присущие данной индивидуальной психике. Такая трактовка порождает массу логических трудностей. В самом деле, откуда вдруг сложились и проявились у современного индивида такие способности, о которых даже представления не имели предшествующие поколения? Нельзя же думать, что в психике таятся способности, пригодные для всех грядущих общественных требований. Но техника факторного анализа принимает эти способности как некую данность; они же в действительности суть психические образования, находящиеся в динамике.

Сказанное убеждает в том, что к возможностям факторного анализа и к его факторам нужно относиться с большой осторожностью и не считать этот анализ универсальным инструментом изучения психики.

Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, - тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения па эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента перехода в бостонской школе с устной формы экзаменов на письменную (1845). В Америке тесты достижений используются при отборе сотрудников на государственную службу начиная уже с 1872 г., а с 1883 г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение Первой мировой войны и сразу после нее.

Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэнфордский тест достижений (Stanford Achievement Test - SAT), впервые опубликованный в 1923 г.. Сего помощью в средних учебных заведениях оценивается уровень обученное™ в разных классах. Значительное число тестов специальных способностей и достижений было создано в рамках психотехники под воздействием практических запросов со стороны промышленности и экономики. Для изучения собственно психологических различий эти тесты не предназначаются. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов.