Внутренняя валидность также является необходимым условием третьей формы валидности — конструктной. Конструктная валидность имеет отношение к теоретической точности: правильно ли мы объясняем причинно-следственные связи, которые были обнаружены в исследовании? Иными словами, если допустить, что выводы внутренне валидны, знаем ли мы, почему получили определенные результаты? Предположим, мы уверены в том, что манипуляции с контекстом в исследовании Черри и Парк действительно обусловливают различия в успешности запоминания. Почему контекст имел значение? Вероятно, наиболее очевидное объяснение — которым руководствуются в большинстве подобных исследований — заключается в том, что важны именно отчетливость и детальность визуальной информации: местоположение предмета лучше всего запоминается тогда, когда он помещен в достаточно дифференцированную среду. Однако вероятно и другое обоснование. Возможно, модель была более интересна и привлекательна, чем схема, что вызывало более пристальное внимание, а отсюда лучшее запоминание. Согласно этой точке зрения, любые манипуляции, которые повышают уровень внимания, должны повышать и успешность выполнения задания вне зависимости от отчетливости фона или наличия ориентиров. Возможно также, что испытуемые чувствовали себя более уверенно перед пространственной моделью, так как она более привычна, чем абстрактная схема, и именно повышение уверенности улучшало результаты. Если правдоподобные альтернативные объяснения нельзя исключить, тогда исследование характеризует недостаточная конструктная валидность. Сказанное выше — всего лишь предварительные замечания о конструктах, которые в дальнейшем мы будем рассматривать с разных точек зрения. Пока же сделаем еще одно замечание, касающееся валидности. Оно имеет отношение к трудности достижения в одном исследовании всех форм валидности. Эта трудность обусловлена тем, что меры, принимаемые исследователем с целью повышения одной формы валидности, работают против другой формы. Необходимость компромиссного выбора наиболее очевидна в отношении внутренней и внешней валидности. В целом, чем жестче контроль, тем выше внутренняя валидность исследования — то есть тем больше уверенности может быть у экспериментатора в том, что переменные связаны между собой именно так, как он предполагает. В то же время искусственный характер ситуации жестко контролируемого эксперимента ставит под угрозу возможность перенесения результатов на внелабораторные условия. И наоборот, исследование, проведенное в естественной обстановке при естественном поведении, не ставит под сомнение возможность обобщения, поскольку ситуации, на которые исследователь хочет перенести свои выводы, максимально приближены к тем, которые он изучает. Однако недостаток экспериментального контроля может крайне затруднить установление валидных отношений.
Отбор
При принятии решений, касающихся переменных, нужно отвечать на вопрос «какие»: какие независимые переменные я буду изменять и какие потенциальные следствия этих изменений я буду измерять? Но важен также ответ на вопрос «кто»: на ком я буду изучать связи между независимыми и зависимыми переменными?
Формирование группы участников эксперимента называется отбором. Отбор важен по причине ограниченности рамок исследования. За очень редкими исключениями психологи не имеют возможности обследовать всех людей, которые их интересуют. Изучающий период младенчества, к примеру, не будет обследовать всех младенцев в мире, даже всех, родившихся в США, или (вероятно) даже тех, кто родился в определенном регионе. Вместо этого он обследует выборку, на основе результатов которой он надеется сделать общие выводы об интересующей его популяции. Обобщение правомерно, если выборка репрезентативна в отношении популяции. Это, как явствует, вопрос внешней валидности.
Как исследователю убедиться в том, что выборка репрезентирует популяцию? Следуя логике, сначала нужно определить, что представляет из себя сама популяция. Она необязательно должна быть столь велика, как все младенцы мира, скорее всего это что-то вроде «всех доношенных 3-месячных младенцев США». Следующим Шагом после очерчивания границ популяции является случайный отбор. Как подразумевает сам термин, случайный отбор означает, что представители популяции имеют равные шансы попасть в выборку. При этом наиболее вероятно, что в результате процесса отбора характеристики выборки будут отражать
характеристики популяции. Заметьте, однако, что вероятность этого напрямую зависит от размера выборки. Случайная выборка, состоящая из 100 человек, будет значительно более репрезентативна, чем случайная выборка, состоящая из 10 человек. Этот принцип — лишь один из ряда доводов (мы столкнемся с некоторыми из них в главе 7) в пользу больших выборок.
Насколько репрезентативны выборки, на практике используемые в исследованиях? Некоторое представление об этом дает нам обзор журналов Child Development и Developmental Psychology. В первую очередь, какую информацию мы получаем об этих выборках? Во всех проанализированных статьях нам сообщают количество участников и их возраст; в 91 % случаев указывается соотношение количества представителей обоих полов. В 70 % случаев предоставляются некоторые сведения о социальном статусе испытуемых и в 72 % — об их расе. Сравнение с результатами контент-анализа в первом издании книги (которые основывались на анализе тех же журналов за 1983 год) говорит о том, что в последние годы исследования отчетов стали информативнее. Соответствующими показателями из обзора 1983 года были 75 % для пола, 52 % для социального статуса и 24 % для расы. Тем не менее, неопределенность при описании расового или социально-экономического состава выборки является скорее правилом, чем исключением. Например, типичны фразы «преимущественно белые», «преимущественно среднего класса»; реже можно встретить точные численные значения и способы подсчета. Опубликованные в недавнем номере Child Development критерии рас и социальных классов (Entwisle & Astone, 1994) могут со временем привести к конкретизации исследовательских отчетов.
Неопределенность характерна и для сведений о способе привлечения испытуемых. Как отмечалось в главе 1, испытуемые не появляются по волшебству, исследователь постоянно должен задаваться вопросом, к кому и как обратиться. Имеют значение три момента. Во-первых, каково было исходное количество кандидатов, к которым обращались с просьбой принять участие в эксперименте? Изучая период младенчества, к примеру, использовал ли исследователь объявления о рождении детей в местной газете, списки в роддомах или информацию, полученную у педиатров? Популяции, которые можно выделить, пользуясь этими источниками, могут существенно различаться. Второй вопрос касается процента тех, кто в итоге согласился на участие. Если исследователь обратился, к примеру, к 100 новоиспеченным матерям, сколько из них принесли своих малышей на обследование? И, наконец, каков процент испытуемых, прошедших все исследование, — или, иначе говоря, сколько испытуемых отказалось сотрудничать в ходе исследования? В некоторых видах исследования, практически во всех, где фигурируют младенцы, выбывание испытуемых может явиться довольно серьезной проблемой. И, тем не менее, информация об отборе испытуемых и количестве выбывших встречается в отчетах редко. Только в 34 % статей сообщаются более или менее точные сведения о способе отбора и о доле согласившихся из числа тех, к кому обратились с просьбой об участии. Только в 50% соответствующих случаев дается информация о том, сколько участников выбыло в ходе исследования.