Наряду с центральной тенденцией, дескриптивные статистические показатели характеризуют изменчивость распределения. Нам необходимо знать не только, какова центральная тенденция, но и то, насколько приближаются показатели к центральному значению или отклоняются от него. Чаще всего мерой изменчивости служит дисперсия. При ее расчете сначала находят среднее для выборки. Затем определяется разница между этим средним арифметическим и показателем каждого из испытуемых. Эти значения разности, или «отклонения», возводятся в квадрат, суммируются, а полученная сумма делится на N - 1, результатом чего и является показатель дисперсии. Таким образом, дисперсия — это приблизительно среднее квадратичных отклонений; «приблизительно», поскольку делитель равен N - 1, а не N. Чем больше разница между индивидуальными показателями, тем больше дисперсия.
В научных статьях в качестве меры изменчивости обычно указывается не дисперсия, а стандартное отклонение. Стандартное отклонение — это просто квадратный корень из показателя дисперсии. В табл. 7.2 он подсчитан для каждой из групп нашего гипотетического исследования. Полученныезначеиия стандартного отклонения подтверждают наши интуитивные предположения о степени разброса индивидуальных показателей в группах. Обратите особое внимание на весьма значительное стандартное отклонение у 4-летних мальчиков, в группе, где было отмечено несколько крайне высоких показателей.
Статистические показатели, выводимые логическим путем
Предположим, мы получили значения среднего арифметического, представленные в табл. 7.2. Оказывается, что уровень агрессии изменяется как функция от возраста и пола. Но как выяснить наверняка, является ли обнаруженное различие истинным или это просто случайные колебания? На этот вопрос призваны ответить статистические показатели, выводимые логическим путем.
Для объяснения смысла статистических показателей, выводимых логическим путем, нужно вспомнить некоторые разграничения (имеющие частичное совпадение), введенные в предыдущих главах. Одно из них — разграничение между истинными показателями и погрешностями измерения. Любой показатель состоит из двух компонентов; действительного результата испытуемого, полученного при измерении, и любого рода погрешности измерения, возникающей при попытке выявить этот истинный показатель. Второе разграничение — между первичной дисперсией и вторичной дисперсией, или дисперсией ошибки. Первичная дисперсия связана с изучаемыми независимыми переменными; вторичная дисперсия, или дисперсия ошибки, обусловлена действием всех других факторов, то есть может иметь какой угодно источник, за исключением независимых переменных. Последнее разграничение — между популяцией и выборкой. Популяция — это весь тот контингент людей, который интересует исследователя; а выборка — это группа людей, фактически включенных в исследование.
При сравнении двух выборок (двух возрастов, двух полов, экспериментальных условий и т. д.) нас интересует вопрос, есть ли истинное различие между популяциями, из которых отобраны эти группы. Если бы нам удалось собрать данные по всей популяции, а не только по выборке, и исключить возможность погрешности измерения, у нас был бы ответ: полученные результаты и были бы результатами интересующей нас популяции. Однако, разумеется, сделать этого мы не можем; выборки — это всегда лишь часть популяции, измерение всегда неточно, и всегда существуют посторонние источники дисперсии. Именно поэтому нам необходимы методы оценки, или определения на основе логических заключений вероятности того, что выявленные различия между выборками отражают истинные различия между популяциями.
Поясним сказанное выше на примере гипотетического исследования агрессии и вопроса различий между полами в уровне агрессии. Мы уже знаем, что различия между полами действительно есть, в том смысле, что показатели мальчиков и девочек неодинаковы. Однако мы знаем и то, что это различие может объясняться погрешностями измерения и побочными источниками дисперсии. Кроме того, мы наблюдали лишь небольшую выборку из популяции, которая нас интересует — только 60 детей из миллионов 3- и 4-леток, посещающих детские сады США, и только несколько часов из жизни этих детей. Возможно, понаблюдав за теми же детьми вновь, мы получили бы несколько отличные результаты. Возможно, что, понаблюдав вторую выборку из 60 детей, мы опять-таки получили бы иные результаты. И возможно, что если бы нам удалось понаблюдать всю интересующую нас популяцию, мы получили бы еще какую-то совокупность данных. Именно для определения вероятности всех этих «возможно» необходимы статистические показатели, выводимые логическим путем.
В предыдущем абзаце цели использования статистических показателей, выводимых логическим путем, рассматриваются с двух позиций. Во-первых, с точки зрения воспроизводимости результатов или надежности. Получим ли мы одинаковые результаты, вновь и вновь производя один и тот же эксперимент? Во-вторых (что в действительности то же самое), с точки зрения перехода от выборки к популяции. Достаточно ли велико отличие, обнаруженное в выборке, чтобы доказать существование отличия в популяции? Как бы мы ни формулировали вопрос, нужно выбрать одно из двух: либо наши результаты действительно отражают положение вещей в популяции, либо они обусловлены действием случайных факторов, действующих в нашем конкретном исследовании. И как бы мы ни формулировали вопрос, использование статистических показателей, выводимых логическим путем, не дает однозначного ответа о том, что из сказанного верно; все, о чем мы можем судить по этим статистическим показателям — это о вероятности каждой из альтернатив. Это, фактически, главное, что нужно осознать в отношении статистических выводов: они вероятностны, а не абсолютны.
Теперь обратимся к конкретному примеру статистического анализа. Рассмотрим вновь различия между полами в уровне агрессии. Нам нужно определить, отражает ли обнаруженное в исследовании различие истинное различие в популяции или же оно — результат случайности. Как уже отмечалось, в качестве примера, за основу мы возьмем логику статистического анализа при использовании f-критерия.
Формула расчета f-критерия представлена ниже. Логика, положенная в основу этой аналитической проверки, довольно проста. Величина f-критерия, а следовательно, и вероятность того, что результаты неслучайны, зависит от трех факторов. Первый — разница между значениями средних. Чем больше различие, тем больше t. Второй — изменчивость внутри сравниваемых групп. Именно изменчивость представлена в довольно громоздком делителе. Чем она меньше, тем больше С. Наконец, третий фактор — объем выборки. Объем выборки влияет на конечный результат по двум направлениям. Во-первых, как можно заметить, проанализировав формулу, объем выборки влияет на изменчивость: чем больше п, тем меньше делитель. Во-вторых, даже подсчитав С, мы все еще должны определить,
какова вероятность того, что это значение t - результат случайности. Эта вероятность зависит как от величины С, так и от объема выборки. Чем больше п, тем ниже вероятность того, что полученное значение t — всего лишь результат случайных колебаний.