Зависимую переменную исследователь измеряет, но не контролирует непосредственно. Независимые переменные, напротив, находятся под контролем исследователя. Цель исследования — определить, действительно ли изменения значений выбранных независимых переменных обусловливают изменения в значении зависимой переменной. В исследовании, которое провели Дюфресн и Кобасигава, независимыми переменными были возраст ребенка и контраст трудного и легкого материала для запоминания, тогда как в исследовании Черри и Парк таковыми были возраст и тип контекста. Эти переменные независимы в том смысле, что их величина заранее определена, а не является результатом исследования. Опять же «изменчивость» необходима: если независимая переменная неизменна, нет никакой возможности выяснить, оказывает ли она воздействие. Изменение и сравнение — неотъемлемая часть любого исследования.
Разделение переменных на зависимые и независимые оправдано во многих, но не во всех исследованиях. Предположим, вы хотите узнать, есть ли связь между IQ ребенка и его успеваемостью в школе. Вы могли бы протестировать выборку школьников и получить два показателя: результаты IQ теста и школьные отметки. Здесь интересен вопрос, связаны ли изменения одного показателя их с изменениями другого, учатся ли лучше дети с высоким IQ? В таком исследовании нет независимой переменной, величину которой мог бы контролировать экспериментатор; IQ, отметки и связь между ними — все это результирующие переменные. Особенности такого «корреляционного» исследования детально рассматриваются далее. Сейчас же важно то, что не для всех исследований подходит схема независимая переменная — зависимая переменная.
Приведенные примеры исследований могут служить в качестве иллюстрации другой особенности независимых переменных. Различные значения независимой переменной можно задать двумя способами. Первый — через экспериментальные манипуляции, которые в буквальном смысле создают переменную. Это то, к чему прибегли Дюфресн и Кобасигава, составляя свои трудные и легкие пары, а также Черри и Парк, создавая плоский и объемный фон. Однако с другой независимой переменной из обоих исследований — хронологическим возрастом — дело обстояло иначе. Очевидно, что исследователи не могут противопоставить два возраста так же, как легкие и трудные задания. С такими переменными контроль осуществляется не через манипуляции, а через отбор испытуемых с желательными характеристиками (например, в возрасте 20 или 70 лет). Поскольку отбор является единственным возможным способом контроля, возраст и другие «субъектные переменные» могут создавать особую проблему при интерпретации — к этому вопросу мы еще вернемся.
Прежде чем идти дальше, введем несколько новых терминов. Независимые переменные также называют факторами, а конкретные значения, которые они принимают, — уровнями. Поэтому исследование Дюфресна и Кобаснгавы можно охарактеризовать как 4 х 2-факторное, то есть эксперимент с двумя факторами, один из которых имеет 4 уровня (возраст), а другой — 2 уровня (условия). Аналогично, исследование Черри и Парк можно охарактеризовать как 2 (возраст) х 2(условия)-факторное. Заметьте, что такого рода обозначение формата говорит нам о количестве экспериментальных ячеек или групп. Например, в исследовании Черри и Парк было 4(2x2) отдельные группы: молодые люди, видевшие модель, молодые люди, видевшие схему, пожилые люди, видевшие модель, и пожилые люди, видевшие схему.
Валидность
В каждом исследовании есть переменные и отношения между ними. Поэтому, когда мы хотим описать исследование, центральным является конструкт переменных: какого вида различия изучаются и какими способами? Если мы хотим выйти за рамки описания и перейти к оценке исследования, центральным конструктом становится валидность. Вопрос валидности — это вопрос точности: направлено ли исследование на изучение того, что, как предполагается, изучается с его помощью? Все обсуждаемые в книге частные методологические моменты возвращают нас к базовому вопросу точности выводов, которые делаются на основе исследования.
Существует множество форм валидности (Cook & Campbell, 1979). В этой главе рассматриваются три: внутренняя, внешняя и конструктная. В главе 7 к ним добавляется еще одна форма: валидность статистического вывода.
Внутренняя валидность характеризует внутренний контекст исследования. Речь идет о том, действительно ли независимые переменные связаны с зависимыми так, как это предполагается. Получим ли мы правильные выводы о причинном воздействии (или отсутствии причинного воздействия) одних переменных на другие? Возьмем в качестве примера исследование Дюфресна и Кобасигавы. Их выводы внутренне валидны, если трудные пары действительно требовали больше времени на запоминание, если среднее время запоминания действительно увеличивалось как функция от возраста и если способность отличать легкие пары от трудных действительно улучшалась с возрастом. Если существует альтернативное объяснение любого из этих выводов, тогда внутренняя валидность исследования ставится под сомнение. Предположим, что испытуемые 7-классники были бы в основном из классов для «одаренных» детей, а младшие дети обладали бы средними способностями. Тогда у нас было бы альтернативное объяснение кажущемуся улучшению с возрастом: различия отражают не естественные возрастные изменения, а разницу в уровне способностей. (Эта проблема называется «систематической ошибкой отбора», далее она обсуждается подробнее.)
Вопрос внешней валидности — это вопрос возможности обобщения. Поэтому он встает, как только мы выходим за рамки конкретного исследования. Теперь важно, правомерны ли полученные выводы для другой выборки, других ситуаций и другого поведения — не для любых, конечно, выборок, ситуаций и поведения, а для тех, результат изучения которых, по нашему мнению, должен быть прогностичным. Возьмем, к примеру, исследование Черри и Парк. Их результаты внешне валидны, если у молодых людей действительно в целом лучше пространственная память, а также, если и молодым и пожилым действительно в целом помогает отчетливость и выразительность фона. В обоих случаях «в целом» означает то, что данное явление обнаруживается во всех выборках молодых и пожилых людей, при любых способах измерения пространственной памяти и при любых признаках фона. Если какой-то из результатов нельзя принять за правило по какому-либо параметру, тогда этот результат внешне невалиден. Возможно, к примеру, что характеристики фона имеют значение только в «мелкомасштабной» среде, таких как масштабы предъявлявшиеся Черри и Парк модели и схемы, а также, что этот эффект не сравним с ситуацией естественных размеров предметов обстановки в реальной жизни. Если бы это ограничение имело место (в другом исследовании было показано, что это не так), тогда исследование Черри и Парк ограничивало бы внешнюю валидность.
Добротное исследование должно отвечать требованиям и внутренней, и внешней валидности. Как замечают Кэмпбелл и Стэнли (Campbell & Stanley, 1966), «внутренняя валидность — это базовый минимум, без которого невозможно интерпретировать ни один эксперимент» (р. 5). С точки зрения логики, при отсутствии внутренней валидности невозможно обобщить результаты исследования, поскольку они вообще невалидны. Однако внешняя валидность также играет огромную роль. Внутренне валидные выводы бессмысленны, если они не работают за пределами экспериментальной ситуации.