Глава 7
Статистика
Все психологические исследования включают статистическую обработку данных. Нельзя стать исследователем в области психологии, не обладая знаниями основ статистического анализа. Кроме того, не имея элементарных представлений о том, что лежит в основе разных статистических показателей, невозможно понять и оценить исследования других людей.
Сказанное выше хорошо известно всем студентам, достаточно далеко продвинувшимся в изучении психологической науки. Все они также знают, что овладение статистикой — долгий процесс, который требует прослушивания нескольких курсов и прочтения нескольких увесистых учебников. Я не буду пытаться ужать содержание нескольких книг до одной главы. Моя задача намного скромнее: изложить в качестве дополнения к материалам о тестах некоторые основы и принципы, стоящие за статистическими процедурами. Эта глава может быть введением или дополнением к курсу статистики, а также может служить материалом, помогающим освежить уже имеющиеся знания.
Изложение в этой главе идет в направлении от сравнительно простого к более сложному. Начнем с того, что вспомним цели использования статистических показателей, затем, в качестве примера статистического объяснения, приведем уже знакомый вам t-критерий. Остальная часть главы в значительной мере будет посвящена усложненным вариантам простого анализа с использованием t-крите-рия — разнообразным ситуациям, когда нужны другие статистические показатели, их типам, а также основаниям для выбора между этими показателями. Поскольку каждый случай рассматривается кратко и в общих чертах, для каждой из затронутых тем предлагается список литературы.
Использование статистических показателей
Используя статистические показатели, психологи преследуют две цели: описать данные и прийти к логическому заключению об их значении. Первая из этих целей проста и понятна, достижение второй цели связано с определенными трудностями.
Таблица 7.1 Количество агрессивных действий в выборке детей дошкольного возраста (гипотетические данные)
Трехлетние мальчики |
Трехлетние девочки |
Четырехлетние мальчики |
Четырехлетние девочки |
5 |
0 |
2 |
3 |
4 |
0 |
27 |
3 |
*0 |
10 |
3 |
0 |
14 |
3 |
34 |
10 |
5 |
0 |
3 |
1 |
15 |
18 |
38 |
4' |
0 |
2 |
0 |
3 |
2 |
0 |
4 |
0 |
9 |
5 |
19 |
4 |
5 |
15 |
35 |
3 |
3 |
0 |
'Л |
5 |
2 |
6 |
2 |
11 |
1 |
0 |
3 |
0 |
16 |
10 |
18 |
1 |
3 |
6 |
10 |
3 |
Дескриптивные статистические показатели
Вернемся к одному из предыдущих примеров: исследованию агрессии методом наблюдения в условиях детского сада. Допустим, исследователь собрал данные, представленные в табл. 7.1. Как можно заметить, имеют место значительные индивидуальные различия в частоте агрессивных действий; вполне вероятно, что есть также различия между полами и возрастными группами. Но как разобраться в этом хаосе цифр и определить истинное положение вещей?
Первый шаг — охарактеризовать данные при помощи ряда дескриптивных статистических показателей. Большинство дескриптивных статистических показателей используется для выявления центральной тенденции, или преобладающей формы ответов в выборке. Чаще всего в качестве меры центральной тенденции выступает среднее арифметическое, или просто среднее. Из табл. 7.2 явствует, что группы испытуемых из нашего гипотетического исследования действительно имеют разный средний уровень агрессии.
Чаще всего среднее — наиболее информативный дескриптивный статистический показатель. Однако он не единственный, в ряде случаев знание лишь среднего не дает полного представления о полученных результатах. Сравним группы 3- и 4-летних мальчиков. Как явствует из табл. 7.2, средний уровень агрессии у старших мальчиков выше. Однако сырые данные из табл. 7.1 свидетельствуют о том, что фактически большинство показателей агрессии обеих групп достаточно близки. Более высокое среднее у старших детей явилось следствием наличия нескольких очень высоких показателей. Или же сравним группы 3-летних мальчиков и девочек. Полагаясь на средние значения из табл. 7.2, мы могли бы заключить, что эти группы имеют одинако-
вый уровень агрессии. Однако сырые данные из табл. 7.1 свидетельствуют о том, что эти средние значения имеют разные основания.
Приведенные выше примеры демонстрируют необходимость иных дескриптивных статистических показателей помимо среднего арифметического. Есть еще две меры центральной тенденции. Одна из них — медиана. Медиана — это центр распределения, выше которого находится одна половина показателей, а ниже — другая. Сравним вновь результаты 3- и 4-летних детей. Из табл. 7.2 явствует, что данные результаты имеют общую медиану — 4. Это свидетельствует о фундаментальном сходстве двух распределений, сходстве, которое мешает заметить разница средних. В целом, медиана приобретает особце значение тогда, когда распределение асимметрично, то есть включает несколько необычно высоких или низких показателей. В таких случаях среднее может дать искаженную картину типичных ответов.
Таблица 7.2 Дескриптивные статистические показатели для данных из таблицы 7.1
|
Среднее |
Медиана |
Мода |
Стандартное отклонение |
3-летние |
5,6 |
4 |
5 |
5,38 |
мальчики |
|
|
|
|
3-летние девочки |
5,0 |
3 |
0 |
5,88 |
4-летние |
13,4 |
4 |
3 |
13,90 |
мальчики |
|
|
|
|
4-летние девочки |
3,4 |
3 |
3 |
3,29 |
Мальчики в |
9,5 |
4 |
3 |
11,09 |
целом |
|
|
|
|
Деоочки в |
4,2 |
3 |
. 0 |
4,75 |
целом |
|
|
|
|
3-летние в |
5,3 |
3,5 |
0 |
5,55 |
целом |
|
|
|
|
4-летние в целом |
8,4 |
3 |
3 |
11,15 |
Третья мера центральной тенденции — мода. Мода — показатель, наиболее часто встречающийся в определенной группе. Эта мера используется редко, однако в некоторых обстоятельствах ее значение довольно информативно. Рассмотрим, к примеру, данные 3-летних девочек из табл. 7.1. Ранее мы отметили, что средний уровень агрессивных действий в этой группе — 5,0 — практически такой же, как и у мальчиков. Однако, в отличие от мальчиков, для 3-летних девочек модальным было нулевое значение. Этот факт вполне заслуживает того, чтобы упомянуть о нем в отчете.