Психологическая библиотека
Под ред. проф. А. В. Петровского.Учебник
М., 1996.
ЧАСТЬ I. ПРЕДМЕТ И ИСТОРИЯ ПСИХОЛОГИИ
ГЛАВА 3. МЕТОДЫ ПСИХОЛОГИИ
5. ИЗМЕРЕНИЯ В ПСИХОЛОГИИ
Первым, кто заговорил о необходимости измерения в психологии, был создатель психологии способностей, ученик Г. Лейбница (1646-1716) немецкий ученый X. Вольф (1679-1754). Он ввел понятие «психометрия» и пытался измерять одно явление посредством другого, например, величину внимания - продолжительностью аргументации, которую мы в состоянии проследить и удержать. Однако настоящая потребность в измерительных приемах возникает век спустя с развитием экспериментальной психологии, особенно психофизики, основателем которой считается немецкий физик и психолог Густав Фехнер (1801-1887). Исследуя вслед за Э.Г. Вебером (1795-1878) соотношение реальных физических стимулов (света, цвета, звука, запаха, прикосновений и т.п.) с ощущениями, которые они вызывают у человека, Фехнер предложил метод измерения и предпринял попытку математического описания наблюдаемой закономерности. Он исходил из верной мысли о том, что ощущение не может быть измерено непосредственно в абсолютной величине, поскольку мы не располагаем эталоном ощущения, как это имеет место при измерении физических величин (эталон длины, веса, времени и т.д.). Но мы можем измерить внешние стимулы, которые задаются экспериментатором (вес предметов, интенсивность раздражителей, время и т.д.), и определить разностные пороги ощущения, соответствующие этим стимулам. Отсюда идея Фехнера: взять за эталон едва заметное различие, полагая, что одно едва заметное различие субъективно равно другому. Используя этот прием, Фехнеру удалось квантифицировать (правда, косвенно) психические явления. Эта идея оказалась очень продуктивной, она быстро продвинула экспериментальную психологию вперед и содействовала становлению психологии как научной дисциплины.
Шкалирование. Суть любого измерения психических процессов заключается в том, чтобы квантифицированному ряду значений, характеризующему исследуемый процесс, поставить в соответствие ряд чисел или других символов. Этот числовой (символический) ряд позволяет нам в обобщенном, абстрагированном виде рассматривать степень выраженности, количество или частоту проявлений изучаемого процесса. В измерительных процедурах подобный числовой ряд получил название «шкала». Только в отличие от известных эталонных метрических шкал, имеющих в качестве единицы измерения («кванта») сантиметр, секунду, частоту колебания и т.д., единицей измерения большинства психологических шкал выступает субъективное различение, т.е. квантуется исследуемый процесс.
Существуют разные уровни измерений. Например, самым простым из них является простая классификация по заданному критерию. Предположим, стоит задача определить, кого из тридцати ребят, принимавших участие в спортивных занятиях, можно отнести к следующим классам:
1 - активные
2 - скорее активные, чем пассивные
3 - скорее пассивные, чем активные
4 - пассивные
Мы получили так называемую шкалу наименований по критерию активности, состоящую из цифр 1, 2, 3, 4. Каждая из этих цифр представляет собой не число, а присвоенный символ, поэтому эти цифры могут быть заменены, к примеру, буквами. Отсюда в шкалах наименований нельзя проводить никаких арифметических действий с числами, которые мы присваиваем объектам или классам объектов. Производится только подсчет частоты одного класса, т.е. встречаемости того или иного результата в каждом классе. Методы, применяемые в ходе такой математической обработки, называют «статистикой качественных признаков».
Наиболее распространены в психологических измерениях порядковые (или ранговые) шкалы. Примером такой шкалы является обычная система школьных баллов, в которой цифры представляют собой упорядоченный ряд оценки уровня знаний. Эти баллы позволяют ранжировать учащихся по уровню знаний. Однако на основе такого рода баллов нельзя сказать, насколько или во сколько раз уровень знаний, соответствующий, положим, четырем баллам, ниже уровня знаний, соответствующего пяти баллам. То есть, шкала порядка представляет собой уменьшающийся или увеличивающийся ряд чисел, в котором перестановки чисел (элементов этой шкалы) недопустимы.
Школьная балльная система представляет собой так называемую однополюсную шкалу порядка, однако в психологических измерениях встречаются двухполюсные (биполярные) шкалы. Примером может служить методика семантического дифференциала (Ч. Осгуд, 1952), направленная на измерение свойств или состояний индивида на основании полярных проявлений этих свойств. При этом первоначально отбирают некоторое множество понятий, которые характеризуют изучаемое свойство. Затем каждому понятию находят антоним (например, активный-пассивный, здоровый-больной, сильный-слабый, и т.д.). Между этими двумя полярными понятиями располагается шкала с промежуточными оценочными категориями. Словесное определение промежуточных категорий часто вызывает затруднения, так как в языке мы, как правило, легче находим понятия для обозначения экстремальных степеней выраженности того или иного свойства. Ниже изображен фрагмент самооценочной биполярной шкалы порядка, построенной по типу семантического дифференциала.
«X» | +3 | +2 | +1 | 0 | -1 | -2 | -3 | «Y» | |
1. Хороший | плохой | ||||||||
2. Контактный | замкнутый | ||||||||
3. Активный | пассивный | ||||||||
4. Честный | лживый | ||||||||
5. Приветливый | мрачный | ||||||||
6. Бодрый | вялый |
Если одно из двух противоположных значений признака обозначить «X», а другое «Y», то семь делений по шкале (слева направо) могут быть интерпретированы как: (+3) - весьма выраженное X; (+2) - выраженное X; (+1) - немного заметное X; (0) - ни Х ни Y (или Х и Y в равной мере); (-1) - немного заметное Y; (-2) - выраженное Y; (-3) - весьма выраженное Y. Оценку выраженности своего состояния по каждой паре признаков человек может сделать, выбрав одно из цифровых значений предложенной шкалы.
Тестирование. Идея квантования как отрезка различения была очень эвристичной. Ее восприняли и стали применять для разработки объективных методов оценки практически во всех направлениях психологии.
В основе метода объективной психологической оценки лежит тест (или проба), который может представлять собой либо стимул определенной модальности [1], если это психофизическое исследование; либо задачи разного уровня сложности, если это педагогическая психология, либо задания, связанные с исследованием внимания, памяти, сообразительности и т.д. в общей и возрастной психологии. Для того, чтобы эти тесты (пробы) могли дать объективные и измеримые данные, они предварительно проверяются на большом числе испытуемых. Например, в педагогической психологии - на детях одного возраста, или людях одного уровня образования и т.д. При этом из всех предложенных задач отбираются те, которые успешно решаются значительным числом всех испытуемых (например, двумя третями). Эта процедура называется нормированием или определением «нормы». С ней впоследствии сравниваются решения тех испытуемых, знания, умения и навыки которых измеряются. Результаты этих измерений оцениваются в условных баллах или в ранговых оценках, объединенных в шкалу порядка и указывающих, какое место данный испытуемый мог бы занять по отношению к соответствующей группе испытуемых (т.е. к «норме»).
Задача психологических тестов, таким образом, - измерить различия между индивидами или между реакциями одного индивида в разных условиях. Решение этой задачи привело к развитию дифференциальной психологии и дифференциальной психофизиологии. Велико значение психологических тестов и для других направлений психологии.
Количество и разнообразие различного рода тестов, опросников и шкал в настоящее время огромно. А начиналось тестирование с разработок Ф. Гальтона (1822-1911), который первым их применил для измерения психических свойств. Еще одной его заслугой была разработка методов математической статистики для анализа данных по индивидуальным различиям. В дальнейшем заметный вклад в развитие психологического тестирования внесли работы Джеймса Кеттела (1860-1944) с его «умственными тестами», которые содержали измерение мышечной силы, скорости движения, чувствительности к боли, остроты зрения и слуха, времени реакции, памяти и т.д. Измерением памяти у школьников занимался Г. Эббингауз (1897). Во Франции в 1908г. свою первую шкалу умственного развития для детей создали А. Бине и Т. Симон. Когда США вступили в Первую мировую войну, под руководством P.M. Йеркса (1876-1956) были разработаны армейские так называемые «альфа и бета-тесты», позволяющие отобрать годных к военной службе лиц. Впоследствии эти тесты неоднократно перерабатывались и стали образцом для большинства групповых тестов интеллекта. Тестирование получило мощнейший стимул для своего развития, и вскоре были разработаны групповые тесты интеллекта для всех возрастов и уровней образованности (от дошкольников до аспирантов). Их начали широко использовать в школах, колледжах. Коэффициент интеллекта IQ (см. главу «Способности») учитывался при приеме в учебные заведения и на работу. Однако вскоре стало ясно, что применяемые тесты являются очень грубым инструментом и область их применения весьма ограничена. Тем не менее они широко распространены, продолжают совершенствоваться и применяться для разных целей.
Наряду с тестами интеллекта в ответ на запросы практики возникли также тесты достижений. Их еще называют тестами объективного контроля успешности: школьной, профессиональной, спортивной и т.п. От разных типов контроля знаний и умений (устных и письменных) эти тесты отличаются своей формой. Учащимся предлагается вопрос, ответ на который в нескольких вариантах представлен на этом же бланке. Один из ответов верный, остальные - нет. Нужно отметить верный ответ. При подготовке тестов достижений практикуется экспертная оценка знаний, которая проводится параллельно с тестированием. Когда тест отработан и стандартизован, необходимость в этом отпадает. К сожалению, применение теста достижений ограничено только той областью знаний, которая поддается формализации.
Применение тестов. Как методический инструмент тесты широко используются в современных исследованиях. Однако прежде, чем решить, какой из сотен имеющихся тестов может быть применен для исследования, психолог задается вопросом: какова цель теста? Для какой группы лиц он лучше подходит? Чем он отличается от других методов изучения индивидуальности человека? Насколько ответственно он конструировался? Насколько он точен и надежен? Насколько адекватны и действительны его результаты?
От каждого измерительного инструмента требуется, чтобы он был как можно более точным, чтобы на полученные результаты можно было положиться, как на данные, близкие к «настоящей» величине измеряемого признака. Следовательно, точность можно понимать как меру достоверности, с какой тест измеряет то, что он измеряет. Существует ряд источников погрешностей, которые снижают точность тестов и надежность результатов. К ним относятся: неблагоприятные условия тестирования, недостаточное внимание к состоянию испытуемых в момент испытания, неверное поведение экспериментатора, а также субъективность в истолковании результатов теста. Кроме учета и устранения источников погрешностей, надежность теста (т.е. его согласованность) повышают посредством повторного испытания с последующим вычислением коэффициента корреляции между данными первого и второго тестирования. Подобная тщательная и объективная проверка надежности теста необходима психологам, чтобы знать, для каких целей и в каких пределах его можно применять.
Наряду с надежностью к тесту предъявляется требование валидности, или адекватности. Валидность - это степень, в которой тест является инструментом, измеряющим то, для чего он предназначен.
Для установления валидности обычно требуется независимый внешний критерий по отношению к тому, что тест должен измерить. Например, если разрабатывается тест для измерения склонности к риску, то он может быть валидизирован проверкой этой склонности в группе мотогонщиков, каскадеров и т.д. Совокупность таких внешних показателей риска будет критерием, с которым следует соотнести исходные тестовые показатели риска.
Далее определяется коэффициент валидности с помощью коэффициента корреляции. При конструировании тестов применяется еще целый ряд специальных статистических процедур, позволяющих сделать тест более чувствительным и надежным инструментом.
При работе с тестами следует отметить также и этический аспект: использование, проведение и интерпретация психологических тестов должны обязательно идти под контролем квалифицированного психолога. В руках недобросовестного или некомпетентного экспериментатора тесты могут принести серьезный вред. Особенно это касается личностных тестов или опросников, в связи с чем важно предотвратить доступность их содержания для любого желающего.
Описанные выше базовые методы исследований, а также методы измерения и тестового оценивания индивидуальных различий лежат в основании многих современных объективных методов эмпирических исследований. К основным из них относятся метод опроса, проективный метод, метод отраженной субъективности.
1 Модальность - термин, обозначающий одно из основных свойств ощущений, их качественную характеристику (цвет в зрении, тон и тембр в слухе, запах в обонянии и т.д.).