* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.
Простейшие методы статистической обработки материалов психологическ их исследований
Статистические методы применяются при обработке материалов психологических и с следований для того , чтобы извлечь из тех ко личественных данных , которые получены в экспериментах , при оп росе и наблюдениях , возможно больше полезной информаци и . В ча стности , в обработке данных , получаемых при испытаниях по пси хологической диагностике , это будет информация об индивидуаль но-психологических особенностях испытуемых . В о обще психологи ческие исследования обычно строятся с опорой на количественные данные . Вот пример.
К школьному психологу обратился шестиклассник Саня Ю . с прось бой испытать его двигательный темп . Саню очень интересовал бас кетбол , и он собирался вступить в баскетбольную команду , а бас кетболист , нес о мненно , должен иметь высокий двиг ательный темп . Психолог разработал план небольшого исследования . Он начал с того , что попросил Саню так быстро , как он только может , ставить точки в центре кружков , нарис о ванных на листке бумаги . За одну минуту Саня поставил 137 точек . Насколько этот темп характерен для Сани ? Чтобы установить это , психолог попросил Саню повто рить эту пробу 25 раз . Действительно , некоторые р е зультаты пре вышали первоначально полученное число , но некоторые оказались и поменьше . Психолог пр о суммировал все полученные за 25 про б ре зультаты , а сумму разделил на 25 — таким путем он получил сред нее арифметическое по всем пробам . Это среднее арифметическое составило 141. Таков по этой пробе максимал ь ный темп Сани . Можно ли считать этот темп высоким ? Потребовался еще один шаг в исс ледовании . Психолог сформировал группу из 50 шестиклассни ков , не отличающихся ни от Сани , ни друг от друга по возрасту бо лее чем на полгода . С этими ребятами психолог также провел сна чала по несколько тренировочных проб , чтобы получить надежные данные о б их темпе , и , наконец , последнюю пробу , для обработки.
Все эти экспериментальные данные в виде средних арифметиче ских были построены в один порядковый ряд , который был разбит по десяткам (по децилям ). Санины данные вышли в десятку с наи более быстрыми р е зультатами . По этим количественным данным психолог сделал вывод о том , что Саня обладает сравнительно вы соким двигательным темпом , о чем и было ему сообщено.
Современная математическая статистика представляет собой большую и сложную с и стему знаний . Нельзя рассчитывать на то , что каждый психолог , сделавший диагностику своей специально стью , овладеет этими знаниями . Между тем статистика нужна пси хологу постоянно в его повседневной работе . Специалисты-статис тики разработали целый комплекс простых методов , к оторые со вершенно доступны любому человеку , не забывшему то , что он вы учил еще в средней школе.
В зависимости от требований , которые предъявляют к статистике различные области науки и практики , создаются пособия по геоло гической , медицинской , биологичес кой , пс и хологической статисти ке . (См ., например : Суходольский Г.В. Основы математической ста тистики для психологов . Л ., 1972). В этой главе даются простейшие методы статистики для психологов . Все необходимые для их приме нения вычисления можно выполнять на ручном компьютере , а то и на простых счетах . Уместное , грамотное применение этих методов по з волит практику и исследователю , проведя начальную обработку , получить общую картину того , что дают количественные результаты его исследований , оперативно проконт ролировать ход исследований . В дальнейшем , если возникнет такая необходимость , материалы ис следований могут быть переданы для более глубокой разработки специалисту-статистику на большой компьютер.
Статистические шкалы. Применение тех или других статисти ч еских методов опр е деляется тем , к какой статистической шкале относится полученный материал . С . Стивене предложил различать четыре статистические шкалы : шкалу наименований (или номина тивную ), шкалу порядка , шкалу интервалов и шкалу отношений.
Зная типическ ие особенности каждой шкалы , нетрудно устано вить , к какой из шкал следует отнести подлежащий статистической обработке материал.
Шкала наименований. К этой шкале относятся материалы , в которых изучаемые об ъ екты отличаются друг от друга по их каче ству . При обработке таких материалов нет никакой нужды в том , чтобы располагать эти объекты в каком-то п орядке , исходя из их характеристик . В принципе объекты можно располагать в любой послед о вательности . Вот пример : изучается состав международной научной конференции . Среди участников есть французы , англичане , датчане , немцы и русские (рис . 1). Имеет ли зн а чение порядок , в котором будут расположены участники при изучении состава кон ференции ? Можно распо ложить их по алфавиту , это удобно , но ясно , что ника кого принцип и ального зна чения в этом расположении нет . При п е реводе этих ма териалов на другой язык (а значит , и на другой алфа вит ) этот порядок будет нарушен . Можно располо жить национальные группы по числу участников . Но при сравн е нии этого материала с материалом другой конференции найдем , что вряд ли этот порядок ок а жется таким же . Отн е сенные к шкал е на именований объекты можно размещать в любой п о следовательности в з а висимости от цели исследования.
При статистической обработке такого рода материалов нужно считаться с тем , каким числом единиц представлен каждый объект . Имеются весьма эффективные стат истические методы , позволяю щие по этим числовым данным прийти к научно значимым выводам (например , метод хи-квадрат ).
Шкала порядка. Если в шкале наименований порядок следова ния изучаемых объектов практически не играет никакой роли , то в шкале порядка — это видно из ее названия — именно на эту по следовательность переключается все внимание . К этой шкале в ста тистике относят такие исследовательские материалы , в которых рассмотрению подлежат объекты , принадлежащие к одному или не скольким классам , но отли ч ающиеся при сравнении одного с другим : больше— меньше , выше— ниже и т.п.
Проще всего показать типические особенности шкалы порядка , если обратиться к пу б ликуемым итогам любых спортивных соревно ваний . В этих итогах последовательно пер е числяются участники , за нявшие соответственно первое , второе , третье и прочие по поряд ку места . Но в информации об итогах соревнований нередко отсут ствуют или отходят на второй план сведения о фактических дости жениях спортсменов , а на первый план ставятся их п о рядковые места . Допустим , шахматист Д . занял в соревнованиях первое ме сто . Каковы же его достижения ? Оказывается , он набрал 12 очков . Шахматист Е . занял второе место . Его д о стижение — 10 очков.
Третье место занял Ж . с 8 очками , четвертое — З . с 6 очками и т.д . В сообщени ях о с о ревновании разница в достижениях при разме щении шахматистов отходит на второй план , а на первом остаются их порядковые места . В том , что именно порядковому месту отво дится главное значение , есть свой смысл . В самом деле , в нашем примере 3. набрал 6, а Д . — 12 очков . Это абсолютные их дости жения — выигранные ими партии . Если попытаться исто л ковать эту разницу в достижениях чисто арифметически , то пришлось бы признать , что 3. играет вдвое хуже , чем Д . Но с этим нельзя согла ситься . Обстоятельства со ревнований не всегда просты , как не все гда просто и то , как провел их тот или другой участник . Поэтому , воздерживаясь от арифметической абсолютизации , ограничиваются тем , что устанавливают : шахматист 3. отстает от занявшего первое место Д . на три порядко в ых места.
Заметим , что в других соревнованиях расклад абсолютных дос тижений может быть иным : занявший первое место может всего на пол-очка опережать ближайших участников . Важно , что он набрал наибольшее количество очков . Только от этого зависит его порядк о вое место.
Шкала интервалов. К ней относятся такие материалы , в которых дана количественная оценка изучаемого объекта в фиксированных еди ницах . Вернемся к опытам , которые провел психолог с Саней . В опытах учитывалось , сколько точек может поставить , рабо тая с макс и мально доступной ему скоростью , сам Саня и каждый из его сверстников . Оценочными ед и ницами в опытах служило число точек . Подсчитав их , исследователь получил то абсолютное число точек , которое оказалось возможным поставить за отведенное время каж дому учас т нику опытов . Главная трудность при отнесении материалов к шкале интервалов со стоит в том , что нужно располагать такой единицей , которая была бы при всех повторных измерениях тождественной самой себе , т.е . одина ковой и неизменной . В примере с ша хматистами (шкала порядка ) такой единицы вообще не существует.
В самом деле , учитывается число партий , выигранных каждым участником соревнов а ний . Но ясно , что партии далеко не одинако вы . Возможно , что участник соревнований , з а нявший четвертое ме сто — он выиграл шесть партий , — выиграл труднейшую партию у с а мого лидера ! Но в окончательных итогах как бы принимается , что все выигранные партии одинаковы . В действительности же этого нет . Поэтому при работе с подобными материалами уместно их оценивать в соответ ствии с требованиями шкалы порядка , а не шкалы интервалов . Материалы , соответствующие шкале интерва лов , должны иметь единицу измерения.
Шкала отношений. К этой шкале относятся материалы , в ко торых учитываются не только число фиксированных единиц , как в ш кале интервалов , но и отношения полученных суммарных итогов между собой . Чтобы работать с такими отношениями , нужно иметь некую абсолютную точку , от которой и ведется отсчет . При изуче нии психологических объектов эта шкала практически неприменима.
О парам етрических и непараметрических методах стати стики. Приступая к стат и стической обработке своих исследований , психолог должен решить , какие методы ему более подходят по осо бенностям его материала — параметрические или непараметриче ские . Ра з личие между ним и легко понять . Вспомним , что говори лось об измерении двигательной скорости шестиклассников . Как обработать эти данные ? Нужно записать все произведенные изме рения — в данном случае это будет число точек , поставленных ка ждым испытуемым , — затем требуетс я вычислить для каждого ис пытуемого среднее арифметическое по результатам опытов . Далее следует расположить все эти данные в их последовательности , на пример , начиная с наименьших к наибольшим . Для облегчения обо зримости этих данных их обычно объединяют в группы ; в этом слу чае можно объединить по 5 — 9 измерений в группе . Вообще же при таком объединении желательно , если общее число случаев не более ста , чтобы общее число групп было порядка двенадцати . Получи лась такая таблица (с . 249).
Далее нужно установи ть , сколько раз в опытах встретились чи словые значения , соо т ветствующие каждой группе . Сделав это , нужно для каждой группы записать ее численность . Полученные в такой таблице данные носят название распределения численностей . Рекоме н дуется представить это распределение в виде диаграммы — полигона распределения . Ко н туры этого полигона помогут решить вопрос о статистических методах обработки . Нередко они напоми нают контуры колокола , с наивысшей точкой в центре полигона и с симметри ч ными ветвями , отходящими в ту и другую сторону . Такой контур соответствует кривой но р мального распределения . Это поня тие было введено в математическую статистику К.Ф . Гауссом (1777 — 1855), поэтому кривую именуют также кривой Гаусса . Он же дал математ и ческое описание этой кривой . Дл я построения кри вой Гаусса (или кривой нормального ра с пределения ) теоретически требуется очень большое количество случаев . Практически же при ходится довольствоваться тем фактическим материалом , который накоплен в исследов а нии . Если данные , которыми распо лагает ис следователь , при их внимательном рассмотрении или после перено са их на диаграмму , лишь в незначительной степени расходятся с кривой нормального распределения , то это дает право исследовате лю применять в статистической обработке параметрические методы , исходные положения которых основываются на но р мальной ( О математически обоснованных способах определения того , можно ли считать данное распределение нормальным , см ., например , в кн .: Урбах В.Ю. Математиче ская статистика для биологов и медиков . М., 1963. С . 66 ) кривой распределения Гаусса . Нормальное распределение называют пара метрическим потому , что для построения и анализа кривой Гаусса достаточно иметь всего два параметра : среднее арифметическое , значение которого должно соответствовать высоте п ерпендикуляра , восстановленного в центре кривой , и так называемое среднее квад-ратическое , или ста н дартное , отклонение — величины , характери зующей размах колебаний данной кривой ; о способах вычисления той и другой величины будет далее рассказано.
Параметр ические методы обладают для исследователя многими преимуществами , но нельзя забывать о том , что применение их правомерно только тогда , когда обрабатываемые данные показывают распределение , лишь несущественно отличающееся от гауссова.
При невозможности прим енить параметрические методы , надлежит обратиться к неп а раметрическим . Эти методы успешно разрабаты вались в последние 3 — 4 десятилетия , и их разработка была вызва на прежде всего потребностями ряда наук ; в частности , психологии . Они показали свою высокую э ффективность . Вместе с тем они не требуют сложной вычи с лительной работы.
Современному психологу-исследователю нужно исходить из того , что “существует большое количество данных либо вообще не под дающихся анализу с помощью кривой но р мального распределения , либо не удовлетворяющих основным предпосылкам , необходимым для ее использования” (Рунион Р. Справочник по непараметриче ской статистике . М ., 1982. С . 11.).
Генеральная совокупность и выборка. Психологу постоянно придется иметь дело с этими двумя понятиями. Генеральная сово купность , или просто совокупность , — это мн о жество , все элемен ты которого обладают какими-то общими признаками . Так , все под ростки-шестиклассники 12 лет (от 11,5 до 12,5) образуют совокуп ность . Дети того же во з раста , но не обучающиеся в школе , или же обучающиеся , но не в шестых классах , не подлежат включению в эту совокупность.
В ходе конкретизации проблем своего исследования психологу неизбежно придется обозначить границы изучаемой им совокупно сти . Следует ли включать в изучаемую сов о купность детей того же возраста , но обучающихся в колледжах , гимназиях , лицеях и других подобных учебных заведениях ? В ответе на этот и на другие такие же вопросы может помочь статистика.
В подавляющем большинстве случаев исследователь не в состоя нии охва тить в изуч е нии всю совокупность . Приходится , хотя это и связано с некоторой утратой информации , взять для изучения лишь часть совокупности , ее и называют выборкой . Задача исследователя заключается в том , чтобы подобрать такую выборку , которая репре зентир овала бы , пре д ставляла совокупность ; другими словами , при знаки элементов совокупности должны быть представлены в выбор ке . Составить такую выборку , в точности повторяющую все разно образные сочетания признаков , которые имеются в элементах сово купности , в ряд ли во з можно . Поэтому некоторые потери в инфор мации оказываются неизбежными . Важно , чтобы в выборке были сохранены существенные , с точки зрения данного исследования , признаки совокупности . Возможны случаи , и для их обнаружения есть статистические метод ы , когда задачи исследования требуют создания двух выборок одной совокупности ; при этом нужно уста новить , не взяты ли выборки из разных совокупностей . Эти и дру гие подобные казусы нужно иметь в виду психологу при обработке результатов выборочных исследо в аний.
Следует рассмотреть типы задач , с которыми чаще всего имеет дело психолог. Соответственно приводятся и статистиче ские методы , которые приложимы для обработки психологических материалов , направленных на решение этих задач.
Первый тип задач. Психологу нужно дать сжатую и достаточ но информативную х а рактеристику психологических особенностей какой-то выборки , например , школьников определенного класса . Чтобы подойти к решению этой задачи , необходимо располагать ре зультатами диагностических испытаний ; эти испытания , разумеется , следует заранее спл а нировать так , чтобы они давали информацию о тех особенностях группы , которые в этом конкретном случае инте ресуют психолога . Это могут быть особенности умственного разви тия , психофизиологические особенности , дан ные об изменении ра ботоспособности и т.д.
Получив все экспериментальные результаты и материалы наблю дений , следует под у мать о том , как их подать пользователю в ком пактном виде , чтобы при этом свести к мин и муму потерю информа ции . В перечне статистически х методов , используемых при решении подобных задач , обычно находят свое место и параметрические и непараметрические методы , о возможностях применения тех и дру гих , как было сказано выше , судят по полученному материалу . Об этих статистических методах и их использовании пойдет речь ниже.
Второй тип задач. Это , пожалуй , наиболее часто встречающие ся задачи в исследов а тельской и практической деятельности психолога : сравниваются между собой несколько выборок , чтобы установить , являются ли выборки независимыми и ли принадлежат одной и той же совокупности . Так , проведя эксперименты в восьмых классах двух раз личных школ , психолог сравнивает эти выборки между собой.
К этому же типу относятся задачи с определением тесноты связи двух рядов показат е лей , полученных на о дной и той же выборке ; в такой обработке чаще всего применяют метод корреляций.
Третий тип задач — это задачи , в которых обработке подлежат временные ряды , в них расположены показатели , меняющиеся во времени ; их называют также динамическими р я дами . В предш ест вующих типах задач фактор времени не принимался во внимание и ма териал анализировался так , как будто он весь поступил в руки иссле дователя в одно и то же время . Такое допущение можно оправдать тем , что за тот короткий период времени , который был зат р ачен на собира ние материала , он не потерпел существенных изменений . Но психологу приходится работать и с таким материалом , в котором наибольший ин терес представляют как раз его изменения во времени . Допустим , пси холог намерен изучить изменение работосп о собности школьников в те чение учебной четверти . В этом случае информативными будут показа тели , по которым можно судить о динамике работоспособности . Берясь за такой м а териал , психолог должен понимать , что при анализе дина мических рядов нет смысла пол ь зо ваться средним арифметическим ря да , так как оно замаскирует нужную информацию о динамике.
В предыдущих главах упоминалось о лонгитюдинальном исследо вании , т.е . таком , в котором однообразный по содержанию психоло гический материал по одной выборке соб и рае тся в течение дли тельного времени . Показатели лонгитюда — это также динамиче ские ряды , и при их обработке следует пользоваться методами , предназначенными для таких рядов.
Четвертый тип задач — задачи , возникающие перед психоло гом , занимающимся конструир ованием диагностических методик , проверкой и обработкой результатов их пр и менения . Отчасти об этих задачах уже говорилось в других главах , но не уделялось вни мания специально статистике . Психологическая диагностика , в осо бенности тестология , имеет ц е лый ряд канонических правил , при менение которых должно обеспечивать высокое качество информа ции , получаемой посредством диагностических методик . Так , мето дика должна быть надежной , гомогенной , валидной . По упрочив шимся в тестологии правилам , все эти свойс т ва проверяются стати стическими методами.
Здесь уместно высказать некоторые соображения о возможностях статистики в пров е дении психологического исследования.
Статистика как таковая не создает новой научной информации . Эта информация либо содержится , либо н е содержится (к сожале нию , и так бывает ) в полученных исследователем материалах . На значение статистики состоит в том , чтобы извлечь из этих материа лов больше полезной информации . Вместе с тем статистика показы вает , что эта информация не случайна и что добытые данные имеют определенную и значимую вероятность.
Статистические методы раскрывают связи между изучаемыми явле ниями . Однако необходимо твердо знать , что как бы ни была высока вероятность таких связей , они не дают права исследователю признать их пр ичинно-следственными отношениями . Статистика , как о ней пи шут известные английские ученые Д.Э . Юл и М.Дж . Кендэл (Теория статистики . М ., 1960. С . 18 — 19.), “вынуждена принимать к анали зу данные , подверженные влиянию множ е ства причин” . Статистика , например , утверждает , что существует значимая связь между дви гательной скоростью и игрой в теннис . Но отсюда еще не вытекает , будто двигательная ск о рость и есть причина успешной игры . Нель зя , по крайней мере в некоторых случаях , искл ю чить и того , что сама двигат ельная скорость явилась следствием успешной игры.
Чтобы подтвердить или отвергнуть существование причинно-следственных отношений , исследователю зачастую приходится про думывать целые серии экспериментов . Если они будут правильно построены и проведены , то с татистика поможет извлечь из резуль татов этих экспериментов информацию , которая необходима иссле дователю , чтобы либо обосновать и подтвердить свою гипотезу , ли бо признать ее недоказанной.
Вот что нужно знать при использовании статистики.
Итак , были пере числены типы задач , с которыми чаще всего встречаются псих о логи . Теперь перейдем к изложе нию конкретных статистических методов , которые способ ствуют успешному решению перечисленных задач.
Первый тип задач. Статистические методы , примеры их при менения дл я принятия решения.
Допустим , школьному психологу нужно представить краткую ин формацию о развитии психомоторных функций учащихся 6-х классов , в которых обучается 50 учеников . В процессе выполнения своей про граммы психолог провел диагностическое изучение двигательной ско рости , применив методику , которая была описана выше (С . 240).
Для реализации своей программы психологу надлежало получить количественные х а рактеристики , свидетельствующие о состоянии изучаемой функции — ее центральной те н денции , величины , пока зывающей размах - колебаний , в пределах которого находятся все данные отдельных учеников , и то , как распределяются эти данные.
Какими методами вести обработку — параметрическими или непара метрическими ? Визуальное ознакомление с полученными данными по казывает , что возможно применение параметрического метода , т.е . бу дут вычислены среднее арифметическое , выражающее це н тральную тенденцию , и среднее квадратическое отклонение , показывающее раз мах и ос о бенности варьирования экспериментальных результатов.
Н ельзя ограничиться вычислением только среднего арифметиче ского , так как оно не дает полных сведений об изучаемой выборке . Вот пример . В одном купе вагона поместилась бабушка 60 лет с че тырьмя внуками : 4 лет , двое по 5 и 6 лет . Среднее арифметическое воз р аста всех пассажиров этого купе 80/5 = 16.
В другом , купе расположилась компания молодежи : двое 15-летних , 16-летний и двое 17-летних . Средний возраст пассажиров этого купе также равен 16. Таким образом , по сре д ним арифмети ческим пассажиры этих купе как б ы и не различаются . Но если об ратиться к особенностям варьирования , то сразу можно установить , что в одном купе возраст пассажиров варьирует в пределах 56 еди ниц , а во втором — в пределах 2.
Для вычисления среднего арифметического применяется формула :
а для среднего квадратического отклонения формула :
В этих формулах х означает среднее арифметическое , х — каж дую величину изучаемого ряда , Z — сумму ; s — среднее квадрати ческое отклонение ; п — число членов изучаемого ряда.
Вернемся к опыту с проверкой двигательной ско рости учащихся (С . 244).
В опытах участвовали 50 испытуемых . Каждый из них выполнил по 25 проб , по 1 минуте каждая . Вычислена средняя каждого испы туемого . Полученный ряд упорядочен и все инд и видуальные резуль таты представлены в последовательности от мень шего к большему :
85 — 93 — 93 — 99 — 101 — 105 — 109 — 110 — 111 — 115 —
115 — 116 — 116 — 117 — 117 — 117 — 118 — 119 — 121 — 121 —
122 — 124 — 124 — 124 — 124 — 125 — 125 — 125 — 127 — 127 —
127 — 127 — 127 — 128 — 130 — 131 — 132 — 132 — 133 — 134 —
134 — 135 — 138 — 138 — 140 — 143 — 144 — 146 — 150 — 158
Для дальнейшей обработки удобнее эти первичные данные со единить в группы , тогда отчетливее выступает присущее данному ряду распределение величин и их численностей . Отчасти упрощается и вычис ление среднего арифметического и среднего квадратического отклонения . Этим искупается несущественное искажение / информации , неизбежное при вычислениях на сгруппированные данных.
При выборе группового интервала следует принять во внимание такие соображения. Если ряд не очень велик , например содержит до 100 элементов , то и число групп не должно быть очень велико , например порядка 10 — 12. Желательно , чтобы при группировании начальная величина — при соблюдении последовательности от меньшей величины к большей — б ыла меньше самой меньшей ве личины ряда , а самая большая — больше самой большой величины изучаемого ряда . Если ряд , как в данном случае , начинается с 85, группирование нужно начать с меньшей величины , а поскольку ряд за вершается числом 158, то и групп и ров ание должно завершаться большей величиной . В ряду , который нами изучается , с учетом высказанных со ображений можно выбрать групповой интервал в 9 единиц и произвести разбиение ряда на группы , начав с 83. Тогда последняя группа будет за вершаться величиной, превышающей значение последней величины ряда (т.е . 158). Число групп будет равно 9 (табл . 1).
Вычисление среднего арифметического и среднего квадратическо-го отклонения.
Таблица 1
Группы Сре д ние значе ния Р е зуль тат раз носки Итоги разнос ки f• x x – x (х - x ) 2 f • ( x -х ) 2 83 — 91 87
/ 1 87 36 1296 1296 92 — 100 96 u 3 288 27 729 2187 101 — 109 105 LJ 3 315 18 324 972 110 — 118 114 QQ 10 1140 9 81 810 119 — 127 123 1300/ 16 1968 0 0 0 128 — 136 132 Ш 9 1188 9 81 729 137 — 145 141 Я 5 705 18 324 1620 146 — 154 150 L 2 300 27 729 1458 155 — 163 159 / 1 159 36 1296 1296
n = 50
У f • x = 6150
У f • ( x -х ) 2 = =10368
1-й столбец — группы , полученные после разбиения изучаемого ряда.
2-й столбец — средние значения каждой группы ; этот столбец показывает , в каком диапазоне варьируют величины изучаемого ря да , т.е . х.
3-й столбец показывает результаты “ручной” разноски величин ряда или иксов : каждая величина занесена в соответствующую ее значению группу в виде черточки.
4-й столбец — это итог подсчета результатов разноски.
5-й столбец показывает , сколько раз встречалась каждая величи на ряда — это произв е дение величин второго столбца на величины 4-го столбца по строчкам . Итоги 4-го и 5-го столбцов дают суммы , необходимые для вычисления ср еднего арифметического.
6-й столбец показывает разность среднего арифметического и значения x по каждой группе.
7-й столбец — квадрат этих разностей.
8-й столбец показывает , сколько раз встречался каждый квадрат разности ; суммиров а ние величин этого столбц а дает итог , необхо димый для вычисления среднего квадратического отклонения.
В заголовках 5-го и 8-го столбцов указывается , насколько часто встречается та или другая величина . Частота обозначается буквой f (от английского слова frequency ).
Включение буквы f , означающей , насколько часто встречалась та или другая величина , ничего не изменяет в формулах среднего арифметического и среднего квадратического о т клонения.
Поэтому формулы
вполне тождественны.
Рис .2
Остается показать , как вы числяются по формулам сред нее арифметическое и среднее квадратическое отклонение . Обратимся к величинам , полу ченным в таблице :
x = 6150 : 50 = 123. При составлении таблицы это число было заранее вычислено , без него нельзя было бы полу чить числовые значения 6, 7, 8-го столбцов та блицы.
При обработке изучаемого ряда оказалось возможным примене ние параметрического метода , так как визуально в этом ряду рас пределение численностей приближается к нормальному . Это под тверждается и гр а фиком (рис . 2, с . 251).
Нормальное распределение обладает некоторыми весьма полезными для исследователя свойствами . Так , в границах x ± s находится при мерно 68% всего ряда или всей выборки , в границах х ± 2 s — пример но 95%, а в гран ицах x ± 3 s — 97,7% выборки . В практике иссле дований часто берут границы — x ± 2/3 s . В этих границах при нор мальном распределении будут находиться 50% выборки ; распреде ление это симметрично , поэтому 25% окажутся ниже , а 25% выше границ x ± 2/3 s . Все эти р асчеты не требуют никакой дополни тельной проверки при условии , что изучаемый ряд имеет нор мальное распределение , а число эл е ментов в нем велико , поряд ка нескольких сотен или тысяч . Для рядов , которые распределе ны нормально или имеют распределение , мало отличающееся от нормального , вычисляется к о эффициент вариации по такой фор муле :
В примере , который был рассмотрен выше,
V = (100-14,4)/123 = 11,7.
Выполнив все эти вычисления , психолог мо жет представить инфор мацию об изучении двигательной скорости с помощью примененной методики в 6-х классах . Согласно результатам изучения в 6-х классах пол у чены : среднее арифметическое — 123; среднее квадратическое от клонение — 14,4; коэффициент вариативн ости — 11,7.
Непараметрические методы . Ранжирование , медиана , квартиль. Далеко не все м а териалы , получаемые в психологиче ских исследованиях , подлежат обработке параметрич е скими мето дами . Если после ознакомления с изучаемым рядом исследователь убеждается в том , что этот ряд не имеет свойств нормального рас пределения , ему остается перейти на м е тоды непараметрической статистики . С их помощью могут быть получены и центральная тенденция изучаемого ряда — медиана — и величина , позволяющая судить о диапазоне в а рьирования и о строении изучаемого ряда — квартильное отклонение.
Вот пример . После диагностических испытаний уровня умствен ного развития учеников 6-го класса полученные данные были упо рядочены , т.е . расположены в последовательности от меньшей ве личины к большей . Испытания проходили 18 учащихся (табл . 2).
Таблица 2
Учащиеся Баллы Ранги ( R ) Учащиеся Баллы Ранги ( R ) А 25 1 К 68 10 Б 28 2 Л 69 11,5 В 39 4 М 69 11,5 Г 39 4 Н 70 14,5 Д 39 4 О 70 14,5 Е 45 6 П 70 14,5 Ж 50 7 Р 70 14,5 3 52 8,5 С 74 17,5 И 52 8,5 Т 74 17,5
Примечание. Буквами обозначены учащиеся , числами — полученные ими баллы по т е сту.
Процедура ранжирования состоит в следующем . Все числа ряда в их последовательн о сти получают по своим . порядковым местам присваи ваемые им ранги . Ес ли какие-нибудь числа повторяются , то всем по вторяющимся числам присваивается один и тот же ранг — средний из общей суммы занятых ими ранговых мест . Так , числу 28 в изучаемом ряду пр и своен ранг 2. Затем следуют трижды повторяющиеся числа 39. На них приход ятся занятые ими ранговые места 3, 4, 5. Поэтому этим числам присваивается один и тот же средний ранг , в дан ном случае — 4. Поскольку места до 5-го включительно заняты , то следующее число п о лучает ранг 6 и т.д.
При обработке ряда , не имеющего признаков но рмального рас пределения — непар а метрического ряда , — для величины , которая выражала бы его центральную тенденцию , б о лее всего пригодна ме диана , т.е . величина , расположенная в середине ряда . Ее определя ют по срединному рангу по формуле M e = (п + 1)/2, гд е M e — оз начает медиану , п — как в ранее приводившихся формулах — число членов ряда . При нечетном числе членов ряда ранговая медиана — целое число , при нечетном число — с 0,5. Заметим , что числовое значение м е дианы может и не быть в составе самого обрабат ывае мого ряда.
Возьмем к примеру ряд в семь членов : 3 — 5 — 6 — 7 — 9 — 10 — 11.
Проранжировав его , имеем : 1 — 2 — 3 — 4 — 5 — 6 — 7.
Ранговая медиана в таком ряду равна : M e = (7 + 1)/2 = 4, этот ранг приходится на в е личину 7.
Возьмем ряд в восемь членов : 3 — 5 — 6 — 7 — 9 — 10 — 11 — 12.
Про ранжировав его , имеем : 1 — 2 — 3 — 4 — 5 — 6 — 7 — 8.
Ранговая медиана в этом ряду равна : M e = (8 + 1)/2 = 4,5.
Этому рангу соответствует середина между двумя величинами , имеющими ранг 4 и ранг 5, т.е . между 7 и 9. Медиана этого ряда равна : M e = (7 + 9)/2 = 8.
Следует о братить внимание на то , что величины 8 в составе ряда нет , но таково значение медианы этого ряда.
Вернемся к изучаемому ряду . Он состоит из 18 членов . Его ран говая медиана равна : M e = (18 + 1)/2 = 9,5.
Она расположится между 9-й и 10-й величиной ряда . 9-я величи на — 52, 10-я — 68. Медиана занимает срединное место между ними , следовательно , M e = (52 + 68)/2 = 60.
По обе стороны от этой величины находится по 50% величин ряда.
Характеристику распределения численностей в непараметриче ском ряду можно пол у чить из отношения его квартилей . Квартилью называется величина , отграничивающая 1/4 всех величин ряда . Квартиль первая — ее обозначение Q 1 — вычисляется по формуле :
Это полусумма первого и по следнего рангов первой — левой от медианы половины ряда ;
квартиль третья , обозначаемая Q 3 вычисляется по формуле :
т.е . как полусумма первого и последнего рангов второй , правой от ме дианы, половины ряда . Берутся порядковые значения рангов по их по следовательности в ряду . В обрабатыв а емом ряду Q 1 = (1+9)/2 = 5, Q 3 = (10 + 18)/2 = 14.
Рангу 5 в этом ряду соответствует величина 39, а рангу 14 — 70. Следовательно , в данном ряду Q 1 = 39, а Q 3 = 70.
Для характеристики распределения в непараметрическом ряду вычисляется среднее квартильное отклонение , обозначаемое Q . Формула для Q такова : Q = ( Q 3 - Q 1 )/2. Для обр а батываемого ряда Q = (70 - 39)/2 = 15,5. Были рассмотрены статистическая обработка па р а метрического ряда ( x и s ), статистическая обработка непараметрического ряда ( M е и Q ). П а раметрический ряд относится к шкале интервалов , не параметрический — к шкале порядка . Но встречаются также ряды , относящиеся к шкале наименований . Наиболее краткая ха рактери стика такого ряда может быть получена с помощью моды , величи ны , которая выражает наивысшее числовое значение величин дан ного ряда , при п — числе членов ряда . Следует заметить , что моду можно лишь условно считать выражением центральной тенденции в ряду , относящемуся к шкале наименований . Она выражает наибо лее типичную величину ряда.
Рассмотрим подробнее пример , приведенный выше (С . 242). Там речь шла об участниках некой конференции ; в их числе были 3 англичанина , 2 датчанина , 5 немцев , 3 русских и 1 француз . Мода в данном ряду приходится на участников конференции — немцев . Число членов ряда равно — 13, а мода — M o = 5.
Итак , мы рассмотрели статистические методы , применяющиеся для задач первого типа.
Второй тип задач. Психологу в его повседневной пр актической и исследовательской работе приходится искать ответы на различные вопросы . Предположим , что проведены ди а гностические испытания умственного развития у школьников шестых классов городской и сельской школ : можно ли в дальнейшем рассматривать обе шк оль ные выборки как прина д лежащие одной совокупности ? По поводу неодинаковых условий обучения в городской и сельской школах вы сказано немало противоречивых суждений . Психолог в данном слу чае намерен опираться на экспериментальные факты . Чтобы прийти к ка кому-то решению , ц е лесообразно проанализировать полученный экспериментальный материал . Это достаточно часто встречающаяся задача , встречаются и такие , где приходится решать тот же вопрос о т носительно нескольких , а не двух выборок . Это и есть задачи второго типа.
Перед психологом два ряда численностей . Прежде всего нужно установить , на какие статистические методы опираться — на пара метрические или непараметрические ? Применять параметрические методы следует в том случае , если оба ряда имеют распределение , не о т личающееся от нормального . Если же один из рядов не соот ветствует этому требованию , то применение параметрических мето дов противопоказано.
Положим , оба ряда показывают распределение , допускающее применение параметр и ческих методов . Сравнение величин це н тральных тенденций — в данном случае их пре д ставляют средние арифметические — не даст ответа на вопрос о том , относятся ли выборки к одной совокупности . Почти безошибочно можно утвер ждать , что средние арифметические не будут тождественными , но этого явн о недостаточно для ответа на поставленный вопрос , ответ не был бы получен , даже если бы средние арифметические оказа лись равными . Для данного случая более всего подходит сравнение выборок по критерию t Стьюдента.
Перед тем как ознакомиться с техникой вычи слений и интерпре таций результатов , п о лучаемых при работе с критерием t Стьюден та , необходимо остановиться на некоторых ст а тистических терми нах ; они постоянно встречаются в прикладной статистике.
В том разделе статистики , где заходит речь о проверке гип отез , постоянно приходится иметь дело с нуль-гипотезой , или нулевой гипотезой . При сравнении двух выборок нуль-гипотеза формулиру ется следующим образом : между изучаемыми выборками нет ра з ли чия или , иначе , различие между ними несущественно . Все даль нейши е расчеты направлены на то , чтобы прийти к заключению верна ли нуль-гипотеза или от нее нужно отказаться , и в действи тельности существенная разница между выборками имеется . В дру гих случаях в з а висимости от содержания материала меняются формулировки , но вычисления показывают , какова вероятность нуль-гипотезы . Для обозначения нуль-гипотезы используется символ h 0 .
Допустим , что разница между выборками имеется . Исследователь встает перед вопр о сом , насколько существенна эта разница , как часто будет обнаружива ться она в последующем , когда придется работать с подобными же выборками . Самые общие соображения при этом таковы : если разница получена на небольшом материале (числе случаев , охваченных той или другой выборкой ), то при по вторном изучении таких же выборо к разницу , возможно , найти и не удастся . Другое дело , если изучаемые выборки не малы . Далее важно , оказалась ли обн а руженная разница значительной . Это рас суждение и следует иметь в виду , когда в статистике речь идет об уровне значимости полученного коэффиц иента , параметра и пр . Уровни знач и мости представлены в специальных таблицах , которые обычно даются в учебниках стат и стики , есть такие таблицы и в конце этой главы . Какой уровень значимости можно признать удов летворительным ? В психологии и педагогике мини мально допусти мым для отказа от Н 0 уровнем значимости признается 0,95. Это значит , что расчеты , основанные на математической теории вероят ности , дают основание утверждать , что при проведении таких же исследований , по крайней мере в 95% случаев , будет пол учен та кой же результат , возможно , лишь с нес у щественными отклонения ми . В некоторых работах удается получить и более высокие уровни значимости — 0,990 и даже 0,999 (эти же уровни значимости мож но записать : 0,05; 0,01; 0,001. Записывая уровень 0,95, имею т в ви ду , что полученные параметры повторяются в 95% случаев , а запи сывая 0,05, что в 5% случаев они не повторятся ; смысл в том и другом случае один и тот же ).
А если не получен уровень значимости 0,95? Тогда нужно при знать , что нуль-гипотезу не следует отвергать . Впрочем , иногда , по задачам исследования признается достаточным и более низкий уро вень . В некоторых исследованиях цель состоит в том , чтобы прийти к утверждению нуль-гипотезы.
Обращаясь к таблицам уровней значимости , исследователь обна руживае т во многих из них специальный столбец с указанием сте пеней свободы , относящихся к полученному пар а метру или коэф фициенту . Уровень значимости прямо зависит от того , каким чис лом степеней свободы обладает данный коэффициент или параметр . Число независимы х величин , учас т вующих в образовании того или другого параметра , называется числом степеней свободы этого па раметра . Оно равно общему числу величин , по которым вычисляет ся параметр , минус число условий , связывающих эти величины (Урбах В.Ю. Указ . соч . С . 161). Число степеней свободы и способы его определения всегда даются в окончательных формулах , которы ми пользуется исследователь при статистической обработке своих материалов.
Рассмотрим пример с двумя выборками , которые , по мнению ис следователя , можно р ассматривать как подлежащие обработке па раметрическим методом.
Двум группам шестиклассников по 6 человек было дано задание бросать мяч в корзину . Группы обучались по разным программам . Можно ли считать , что разница в программах сказалась на конеч ной резу льтативности школьников ? Для сравнения было взято чис ло п о паданий в корзину . Всего было дано по 10 проб.
Формула вычисления t :
где
Материал , подле жащий обработке :
первая выборка , п = 6 Исп. х x - x ( x - x ) 2 А 2 -1 1 Б 4 1 1 В 6 3 9 Г 4 1 1 Д 1 -2 4 Е 1 -2 4
вторая выборка , п = 6
Исп. х x - x ( x - x ) 2 Ж 5 — — 3 4 -1 1 И 2 -3 9 К 8 3 9 Л 6 1 1 М 5 — —
Ход вычислений показывает :
fd (чи сло степеней свободы ) = n 1 - n 2 -2=6+6-2= 10. По таблице уровней значимости t Стьюдента находим t 0,95 = 2,223. Существенность различия не доказана , хотя полученное значение t = 1,9 очень близко к требуемому уровню . Принимается Н о . Нель зя утверждать , что выбо рки существенно различаются.
Для вычисления t существует несколько формул , различающихся только техникой ра с четов.
Сравниваемые выборки могут быть неодинаковыми по объему . Применять параметр и ческие методы можно лишь к материалу , об ладающему определенными свойствами , о к о торых говорилось ра нее . В других случаях следует обращаться к непараметрическим методам.
Ниже будет рассмотрена техника применения критерия Манна— Уитни , непараметр и ческого метода , часто используемого в психоло гических исследованиях.
Пред положим , что психологу нужно решить такую задачу . Есть ли различия между выборками школьников одного и того же клас са , если одна выборка включает школьников , которые после кон трольной работы проходили дополнительное обучение по коррекционным программам, другая — школьников , такого обучения не про ходивших ? Обе выборки малы , поэтому для проверки гипотез о су ществовании различий между выборками следует взять мощный критерий . Мощность критерия — это вероятность принятия при его применении правильного решен и я для отклонения h o ; чем выше эта вероятность , тем больше мощность критерия . Мощность любого критерия увеличивается вместе с увеличением объема сравн и ваемых выборок , а также со снижением того уровня зна чимости , на который ориентируется исследователь . Друг ими словами , если выборки велики , то принятие правильного реше ния относительно h o увеличивается . Ориентация на высокий уровень значимости , например 0,990 или 0,999, предполагает применение достаточно мощного критерия . В рассматриваемом примере выборки мал ы , а при установлении существенной раз ницы между ними , т.е . при отказе от h o желательно , чтобы уро вень значимости был как можно выше , но не ниже 0,95.
Формула вычисления критерия Манна— Уитни такова :
или :
В примере сравнению подлежат результаты контрольной работы выборки A из 4 школьников , проходивших обучение по коррекционны м программам , и выборки Б, состоящей из 7 школьников , никако го коррекционного обучения не проходивших . Последовательность действий , предусматриваемых вычислением всех нужных для реше ния задачи величин , т а кова.
1. Выписать в любом порядке число успешно ре шенных заданий школьниками сначала выборки А, затем выборки Б.
2. Проранжировать число успешно решенных заданий , объединив обе выборки.
3. Найти сумму рангов выборок А и Б раздельно.
Эти три действия дадут все необходимые для вычисления крите рия данные.
Для проверки расчетов вычисляется :
R A + R B = N /2(1 + N ); т.е . 37 + 29 = 11/2(1 + 11), т.е . 66 = 66.
Имея величины U 1 и U 2 , следует обратиться к таблице уровня значимости . На совм е щение стр оки четвертой со столбцом седьмым находим 3/25. По условиям таблицы , U 1 должно быть меньше верх ней , a U 2 — больше нижней величины . Полученные величины по казывают , что h o отвергается . Можно утверждать , что между вы борками имеется сущ е ственное различие : р езультаты свидетельст вуют о преимуществе выборки A .
Попарное сравнение. В предыдущем материале исследователь имел дело с двумя в ы борками . В обработку они поступают как два ряда чисел ; каждый ряд есть результат эксп е риментов , проведенных с данной выборкой. Однако часто приходится встречаться с мате риалом , в котором даны два числовых ряда , но оба они получены на одной выборке ; сюда относятся исследования , когда эксперименты проводятся до и после какого-то специального воздействия . Цель такого исследования с остоит в том , чтобы установить , есть ли дос таточно существенные изменения и можно ли утверждать , что спе циальное воздействие имело с у щественное значение.
Например , психологу было предложено ответить на такой вопрос :
влияют ли занятия физкультурой на обще е самочувствие занимаю щихся школьников ? Исследование он построил так : школьников просили отмечать на линейной шкале свое с а мочувствие до занятий физкультурой и после них.
Статистической обработке подлежат попарные сравнения показа ния одного и того же исп ытуемого до и после воздействия :
до воздействия после него разность рядов “до” и “после” х х 2 3,2 3,8 +0,6 0,36 1,6 1,0 -0,6 0,36 5,7 8,4 +2,7 7,29 2,8 3,6 +0,8 0,64 5,5 5,0 -0,5 0,25 1,2 3,5 +2,3 5,29 6,1 7,3 +1,2 1,44 2,9 4,8 +1,9 3,61 е x = 8,4; е x 2 = 19,24 ( е x ) 2 = 70,56
Нуль-гипотеза формулируется так : сравнение рядов до и после воздействия не дает о с нований утверждать , что по измеряемому признаку произошли существенные изменения.
Выборка , подвергнутая изучению , состояла из 8 челове к . Начнем с параметрического метода . Будет применен критерий t Стьюдента , его формула для попарного сравнения такова :
Нужно вычислить все величины , входящие в эту формулу . Для получения S использ у ется формула :
Извлекая корень из полученной величины , узнаем значение S. Остается произвести по формуле все вычисления.
Ниже приводятся ряды , полученные в эксперименте (числа заимс т вованы из кн .: Бейли Н. Статистические методы в биологии . М ., 1964).
При вычислении t при попарном сравнении число степеней сво боды равно п -1. По таблице уровней значимости для t нахо дим , что для 7 степеней свободы t 0,95 должно быть не менее 2,36. По скольку получена большая величина , следует признать , что налицо статист и чески значимое влияние занятий физкультурой на самочув ствие школьников.
Из непараметрических методов для попарного сравнения удобен для пользования кр и терий Уилкоксона , правда , на небольших вы борках этот критерий оказывается недостаточно мощным ; его лучше применять на выборках объемом от 12 и более элементов.
Небольшие по объему выборки , однако , удобны для наглядного последовательного и з ложения техники расчетов.
Для использования этого критерия (его называют также знаково-ранговым ) следует проранжировать , сначала не обращая внимания на знаки , весь перечень разностей между р я дами “до” и “после” . Если разность у отдельны х испытуемых и в отдельных случаях ну левая , то она из ранжирования исключается и не входит в сумму рангов . В этом примере таких разностей (равных нулю ) не встреча ется.
Далее нужно суммировать раздельно ранги разностей с положи тельным знаком и ранги разн остей с отрицательным знаком . Значе ние критерия Т равно меньшей по абсолютной в е личине сумме рангов.
В этом примере Т = 3,5.
Ряд разнос тей +0,6 -0,6 +2,7 +0,8 -0,5 +2,3 +1,2 +1,9 Ра н ги 2,5 (2.5) 8 4 (1) 7 5 6 Скобками указаны ранги разностей с отрицате льными значениями . Но прежде чем отыскивать уровень значимости Т, нужно обра тить внимание на то , что в данном случае критерий Уилкоксона — это двусторонний критерий . Как это понимать ? Различают односто ронние и двусторонние критерии . Отвергая нуль-гипотез у , выдвигают альтернативную ей гипотезу . При этом возникает вопрос : в ка кую сторону направлено отличие альтернативной гипотезы от H o — в положительную или отрицательную . Если исследование предпола гает равно возможными и ту , и другую направленности , следу ет принять двусторонний критерий . Возможна вместе с тем такая по становка исследования , когда учитывается лишь одна направлен ность результатов . Так , сравнивая две выборки учащихся по освое нии ими научных химических понятий , исследователь ставит огра нич е нную задачу — рассмотреть только возможность преобладания в этом освоении одной выборки над другой . В этом исследовании применим односторонний критерий.
При описании статистических методов всегда указывается , какого рода критерий по д лежит применению — одно сторонний или двусто ронний . В таблицах уровней значимости обычно значения для односто роннего и для двустороннего критериев даются либо в особых столб цах , либо в таблице указывается , какому значению одностороннего критерия соотве т ствует значение двусторо ннего , и наоборот.
Возвращаясь к рассматриваемому примеру , следует признать , что для него при обр а ботке с помощью критерия Уилкоксона применим двусторонний критерий : различия между показателями “до” и “пос ле” в одних строках положительные , в других отрица тельные , учи тываются те и другие.
В таблице уровней значимости для критерия Т, имея в виду , что критерий двусторонний , находим , что для 0,95 уровня значение Т должно быть не более 3. Поскольку получено зн а чение Т = 3,5, h o не следует отклонять.
Следовател ьно , критерий t Стьюдента свидетельствует о том , что H o подлежит откл о нению , а T -критерий Уилкоксона свидетель ствует о том , что нуль-гипотезу отвергать не следует . Такого ро да расхождения , особенно при работе с небольшими выборками , вполне возможны . То , что критерий Уилкоксона Т всего на 0,5 превысил установленный уровень значимости , говорит о том , что при увеличении объема выборки в 1,5 или в 2 раза критерий Т также окажется значимым . В параграфе , где пойдет речь о пла нировании эксперимента , еще предсто ит рассмотреть вопрос об объеме выборок.
Сравнение нескольких выборок по Уилкоксону. Иногда ис следователю приходится сравнивать не две , а несколько выборок :
три , четыре и более . В таких случаях следует обратиться к просто му и достаточно мощному непарамет рическому критерию , пред ставляющему собой модификацию критерия Уилкоксона . Метод позволяет сравнивать выборку с любой другой — вторую с третьей , первую с четвертой и т.д . Нужно , чтобы выборки были равными по численности.
Допустим , что учащимся 8-х классов четырех различных школ был предложен тест умственного развития . В школах использова лись различные методы обучения и воспитания . Умственное разви тие , как можно полагать , формировалось в каждой выборке в осо бых условиях . Эти условия и могли определить р а зличия между выборками . Взято по 10 учеников из каждой школы . Их результаты и даны в таблице (табл . 3).
Таблица 3
№ Школа I Школа II Школа III Школа IV Р е зуль тат Ранг ( R 1 ) Р е зуль тат Ранг ( R 2 ) Р е зуль тат Ранг ( R 3 ) Р е зуль тат Ранг ( R 4 ) 1 96 36,5 96 36,5 32 9,5 40 15 2 82 30 100 39 27 3,5 38 14 3 80 28,5 93 34 68 23 42 18,5 4 78 25,5 87 33 78 25,5 32 9,5 5 34 11 100 39 54 21 31 8 6 42 18,5 28 5,5 56 22 28 5,5 7 42 18,5 80 28,5 83 31,5 42 18,5 8 69 24 94 35 22 1 30 7 9 79 27 25 2 41 16 36 13 10 100 39 83 31,5 27 3,5 35 12 е R 258 284,5 156,5 121
Объединим результаты четырех школ в один ряд и проранжируем его . Для этого ра с положим ряд в порядке его возрастания и перене сем полученные ранги в таблицу (табл . 4).
Таблица 4
Р е зуль тат Ранг Р е зуль тат Ранг Р е зуль тат Ранг Р е зуль тат Ранг 22 1 34 11 54 21 83 31,5 25 2 35 12 56 22 83 31,5 27 3,5 36 13 68 23 87 33 27 3,5 38 14 69 24 93 34 28 5,5 40 15 78 25,5 94 35 28 5,5 41 16 78 25,5 96 36,5 30 7 42 18,5 79 27 96 36,5 31 8 42 18,5 80 28,5 100 39 32 9,5 42 18,5 80 28,5 100 39 32 9,5 42 18,5 82 30 100 39
Подсчитаем сумму рангов по каждой школе.
е R = 258 + 284,5 + 156,5 + 121 = 820.
Проверочная формула : е R = N /2 ( N + 1 ) = 820, где N — общее число элементов , вкл ю чающее все выборки . В этом примере оно равно 40.
Школа I
е R = 258 Школа II
е R = 284,5 Школа III
е R = 156,5 Школа IV
е R = 121 Шк . I
е R = 258 26,5 101,5 137 Шк . II
е R = 284,5 26,5 156,5 163,5 Шк . III
е R = 156,5 101,5 156,5 35,5 Шк . IV
е R = 121 137 163,5 35,5
Далее суммы рангов по выборкам размещаются в матрице.
На пересечении строк и столбцов указываются разности , показы вающие , насколько отличается сумма рангов каждой выборки от других выборок.
По таблице значимости устанавливается , что при n = 10 (учиты вается объем отд ельной выборки ) и при четырех условиях достига ют уровня значимости 0,95 — величина 134 и более , а уровня зна чимости 0,99 — величина 163 и более . Следовательно , существен ное статист и чески значимое различие имеется между 1-й и 4-й вы борками и между 2-й и 4-й выборками ; в последнем случае на уров не значимости 0,99.
Корреляции. В примере , рассмотренном выше (С . 260), сравни вались два ряда чисел , представляющие два ряда показателей одной и той же выборки ; по смыслу задачи нужно было установить , суще ственн ая ли разница между этими рядами . Это были ряды , взятые из сит у ации “до” и “после” . Есть , однако , и многочисленные ситуа ции , когда исследователь заинт е ресован не в том , чтобы найти сте пень существенности разницы между вариационными р я дами , а в том , чтобы найти , насколько тесно эти ряды связаны между собой , какова напра в ленность этой связи . Так , группе школьников были предложены два теста , задания которых были построены на мате риале школьных дисциплин гуманитарного цикла — литературы и истории . Но в перво м тесте для выполнения заданий требовалась актуализация умственного действия аналогии , а во втором — умст венного действия классификации . Данные тестир о вания представ лены в двух числовых рядах . Исследователю нужно ответить на во прос , насколько тесно связ аны эти два ряда . При строгой постанов ке эксперимента это исследов а ние должно было пролить свет на то , какую роль играют умственные действия , указанные выше , на ус воение знаний в гуманитарном цикле.
Пример . Исследовалась выборка из 15 школьников . Для выч исления коэффициента корреляции , отражающего тесноту связи между двумя рядами , используются как параме т рические , так и непараметрические методы.
До перехода к расчетам полезно рассмотреть любые корре лируемые ряды в их разм е щении в корреляционной решетке . По оси абсцисс размещаются показатели одного , а по оси ординат — дру гого ряда.
Теснота связи между рядами благодаря этой решетке становится легко обозримой . На рис . 3 схематически изображены различные виды соотношения коррелируемых рядов . Как видно , схемы отра жают всего пять различных соотношений.
Рис . 3
На схемах можно усмотреть как тесноту связи , так и ее направлен ность . Схема 3 д е монстрирует полное отсутствие связи между рядами ; на схеме 5 показана нелинейная связь между рядами , та ее форма , ко торая показана на этой схеме лишь одна из возможных.
Коэффициент корреляции принимает значение от -1 (схема 4) до +1 (схема 1). В этих пределах возможны все числовые значения коэф фициента корреляции . Если никакой связи между рядами не суще ствует , то к оэ ф фициент равен 0 (схема 3). В подавляющем боль шинстве случаев коэффициент составляет величину , не дост и гаю щую 1. При положительной корреляции при увеличении числовых значений одного ряда соответственно увеличиваются числовые зна чения другого ряда . При отрицательной корреляции увеличению чи словых знач е ний одного ряда соответствует уменьшение числовых значений другого ряда.
Если исследователь убежден в том , что оба коррелируемых ряда можно рассматривать как ряды параметрические , то для вычисле ния коэфф ициента корреляции применяется п а раметрический метод по формуле Пирсона :
Существует много различных видов этой формулы , представляю щих собой ее прео б разования . Исследователь сам выбирае т удоб ную для себя формулу . Об уровне значимости коэффициента корре ляции судят по табл . 5, причем для г число степеней свободы fd = п - 2, где п — объем выборки.
Вычисление коэффициента корреляции по Пирсону. Ко эффициент показывает те с ноту связи между в ыполнением задач в тестах “Аналогии” и “Классификации” . Данные по тесту “Аналогии” обозначены х, а по тесту “Классификации” — у.
Для упрощения расчетов введены некоторые тождества.
Испыт у емые х y х 2 y 2 ху А 1 3 1 9 3 Б 2 4 4 16 8 В 3 5 9 25 15 Г 3 6 9 36 18 Д 4 6 16 36 24 Е 4 7 16 49 28 Ж 4 7 16 49 28 3 5 8 25 64 40 И 5 8 25 64 40 К 6 8 36 64 48 Л 6 8 36 64 48 М 7 9 49 81 63 Н 8 9 64 81 72 О 9 10 81 100 90 П 10 11 100 121 110 n = 15 77 109 487 859 635
Число степеней свободы fd = п - 2 = 15 - 2 = 13. По таблице уровней значимости находим , что при 13 степенях свободы r 0,999 = = 0,760. Сравниваем это значение с полученным коэ ф фициентом :
0,76 < 0,96.
Полученный коэффицие нт корреляции показывает , что между ре зультатами в тестах “Аналогии” и “Классификации” имеется связь . Высокий уровень значимости свидетельствует о том , что эта связь с высокой вероятностью будет воспроизводиться в таких же экспери ментах.
Вычисление коэфф ициента корреляции по Спирмену (коэффициент ранговой корреляции ).
Исследовательское задание указано на с . 266. Формула ранговой корреляции такова :
где d — разность рангов ряда х и ряда у т.е . ( R x - R y ).
Таблица 6
Испыту емые х R x y R y dR x R y R 2 dRxR y А 1 1 3 1 0 0 Б 2 2 4 2 0 0 В 3 3,5 5 3 0,5 0,25 Г 3 3,5 6 4,5 1 1 Д 4 6 6 4,5 1,5 2,25 Е 4 6 7 6,5 0,5 0,25 Ж 4 6 7 6,5 0,5 0,25 3 5 8,5 8 9,5 1 1 И 5 8,5 8 9,5 1 1 К 6 10,5 8 9,5 1 1 Л 6 10,5 8 9,5 1 1 М 7 12 9 12,5 0,5 0,25 Н 8 13 9 12,5 0,5 0,25 О 9 14 10 14 0 0 П 10 15 11 15 0 0 n = 15
n 2 = 225 У d 2 RxRy = 8,5
fd = п - 2 = 15 - 2 = 13.
Производится раздельное ранжирование ряда х и ряда у . Вычис ляется разность рангов d п опарно . Знак разности не существенен , так как по формуле нужно возвести d в квадрат . Далее действия определяются формулой :
По таблице уровней значимости r > r 0,99 (0,98 > 0,70).
Коэффицие нты , вычисленные двумя разными способами , как и нужно было ожидать , чрезвычайно близки друг к другу ; отличаются они на 0,02, что никакого значения практически не имеет.
Нельзя трактовать коэффициент корреляции как величину , озна чающую процент вза и мозависи мых связей вариант двух коррели руемых рядов , т.е . например , коэффициент 0,50 трактовать как 50% таких связей этих рядов . Это далеко не так . Об этом проценте во обще по коэффициенту корреляции судить нельзя . Возведенный в квадрат коэффициент корреляции на з ывается коэффициентом детерми нации ( r 2 или r 2 ). Он показывает , сколько процентов вариант обоих рядов оказались взаимозависимыми . При коэффициенте 0,50 процент таких взаимозависимых вариант составит 0,50 2 , т.е . 0,25 ( Heinz A ., Ebner С. Grundlagen der Statistik fiir Psychologen , Padagogen und Soziologen . Berlin , 1967. S . 112). Для коэффициента 0,98 к о эффици ент детерминации составит 0,98 2 = 0,9604. Следовательно , взаимо зависимы примерно 96% вариант обоих рядов.
Корреляция как метод статистического анал иза в психологиче ских исследованиях применяется очень часто . Всем , кто работает с применением корреляционного анализа , т.е . выясняет посредством этого метода тесноту связи двух рядов , следует напомнить , что ко эффициент , как бы высок он ни был , нельзя ин т ерпретировать как показатель наличия пр и чинной связи между коррелируемыми ряда ми . Если коэффициент и может быть как-то и с пользован в обсуж дении вопроса о возможных причинных связях , то только в том случае , когда содержательная логика исследования и выдви гаемые при этом теоретические сообр а жения позволяют опереться как на один из аргументов и на значение коэффициента корр е ляции.
В изложении метода корреляции речь шла исключительно о ли нейных корреляциях , которые изображены на схемах № 1,2, 4. Но там же при ведена схема криволинейной корр е ляции (№ 5). Вообще говоря , вероятно , и в психике человека протекают процессы , взаи мосвязь которых не имеет линейного вида . Вычисление нелинейных корреляций и , главное их истолкование не относятся к простейшим статистически м методам , о которых говорится в этой главе . Но об их существовании следует знать.
Наконец , полезно напомнить , что корреляции по Пирсону (с оп ределенными огран и чениями и в определенных сочетаниях ) создают ту базу , на которой открываются возможн о сти перехо да к так назы ваемому факторному анализу . (Наиболее ясное изложение сути фа к торного анализа см .: Теплов Б.М. Типологические особенности в н.д . человека . М ., 1967. Т . 5. С . 239).
Метод определения меры различия между наблюдаемыми и предполагаемыми (теоретич ескими ) численностями — хи-квадрат.
Ранее были рассмотрены различные отношения между выборка ми : количественное преобладание какого-то признака , представлен ного в одной из выборок , теснота связи между выборками . Но есть еще одно важное отношение между ним и : количественная разница ра с пределений , благодаря которой при сопоставлении выборок от крывается возможность прийти к содержательным выводам . Это от ношение обнаруживается при сопоставлении распред е лений численностей . Допустим , что сравниваются две выборк и , выпускников двух школ . Часть выпускников каждой школы сдавали экзамены в вузы . Из первой школы сдавали э к замены 100 человек , из них 82 успешно , не сдали 18. Таково распределение численности в первой выборке . Из второй школы сдавали экзамены в вузы 87 че ловек , выдержали 44 чел о века , не сдали — 43. Таково распределение численностей во второй выборке . Достаточно ли этих данных , чтобы утверждать , что подготовленность к вузовским экзаменам выпуск ников этих школ неодинакова ? На первый взгляд , разница налицо :
лучше подготовлены выпускники первой школы . Однако при таком раскладе числе н ностей возможно влияние случайности . Поэтому встает вопрос , можно ли , считаясь с пре д ставленными распределе ниями , прийти к статистически обоснованному выводу о мере под готовленно сти к экзаменам в вузы той и другой выборки.
Метод , с помощью которого подвергаются статистическому ана лизу описанные ра с пределения численностей , получил название хи-квадрат , его обозначают греческой буквой x 2 с показателем степе ни . Он был разработан мат ематиком Пирсоном . Метод x 2 весьма униве р сален , применим во многих исследованиях , пригоден для ста тистического анализа распред е ления численностей разнообразных количественных материалов , относящихся ко всем ст а тистическим шкалам , в том числе и к шкале наи менований.
Техника вычисления хи-квадрата довольно проста . Рассмотрим пример со сдачей экз а менов в вузы выпускниками первой и второй школ . В условии сказано , что всего намерены были сдавать экзаме ны 187 человек : 100 учащихся (53,5%) из первой школы и 87 ( 46,5%) из второй . Предположим , что выпускники обеих школ под готовлены одинаково , тогда и доли сдавших и не сдавших будут та кие же , как доли их представленности в общем числе сдающих . Всего сдало экзамены 126 выпускников (82 + 44). Согласно выска занному предположению , 53,5% от этого числа должны бы были прийтись на 1-ю школу — это составит 66,9 от 126 — и 46,5% на 2-ю школу , что составит 58,9 от 126. Такое же рассуждение повторяем и относ и тельно несдавших . Их всего 61 человек (18 + 43). На 1-ю школу , как нам известно , должно , по предположению , прийтись 53,5% от этого числа , т.е . 33,0 от 61, а на долю 2-й школы — 46,5%, т.е . 28,1 от 61. Нуль-гипотеза , имеющая в данном раскладе тот смысл , что между выпускн и ками нет различия , при таком соот ношении сдавших и несдавших подтвердилась бы . Однако в услови ях этого исследования показано другое распределение . Количество выпускников 1-й школы , сдавших экзамены , составляет 82, а не 66,9, как можно было бы предположить , исходя из нуль-гипотезы . Соот ветственно количес т во выпускников 2-й школы , сдавших экзамены , составляет в действительности всего 44, а не 58,9. Точно также , сравнивая количество н е сдавших (по условию с предполагаемым распределением ) найдем по 1-й школе 18, а не 33, а по 2-й школе — 43, а не 28,1.
Расхожд ения между действительными распределениями и рас пределениями , которые могли бы иметь место , если исходить из нуль-гипотез , налицо . Они-то и учитываются при вычислении x 2 . Все сказанное удобно представить в виде таблицы-графика распре деления численностей (табл . 7). Количества , которые были бы по лучены при принятии нуль-гипотезы , заключены в скобки . В правом углу буквенное обозначение клетки.
Таблица 7
Школа Число сда в ших Число н е сдавших Всего Долевые о т ноше ния , % Первая 82 А
(66,9) 18 В
(33,0) 100
(100) 53,5 Вторая 44 С
(58,9) 43 Д
(28,1) 87
(87) 46,5 Всего 126 61 187 100
Получены разности по клеткам (знак разности несущественен ). Клетки :
А f A = 82 — 66,9= 15,1;
В f B = 18 — 33 = 15,0;
С f C = 44 — 58,9 = 14,9;
Д f D = 43 — 28,1= 14,9. Формула хи-квадрат :
где f 0 — наблюдаемые численности ; f e — предполагаемые (теоре тические ) численности.
В рассмотренном материал е x 2 = 15,1 2 /66,9 + 15 2 /33 + 14,9 2 /58,9 + 14,9 2 /28,1= 288/66,9 + 225/33 + 222/58,9 + 222/28,1= 3,4 + 6,8 + 3,8 + 7,9 = 21,9
Для получения числа степеней свободы нужно воспользоваться формулой (только для хи-квадрат ): fd = ( k - 1)( с - 1) = (2 - 1) х (2 - 1) = 1 степень свободы , где k — число столбцов , с — число строк в таблице с анализируемым материалом.
Обратимся к таблице уровней значимости для одной степени свободы для хи-квадрат : x 2 0,99 = 6,6. Следовательно , полученная величина вполне достаточна для от клонения h 0 . Есть все основания для содержательного вывода о различной степени подготовленности выпус к ников обеих школ к экзаменам в вузы.
Все вычисления , приводимые в этой главе , ведутся с точно стью до первого знака , т.е . вычисляются целые и десятые . Эти м объясняется та , в общем-то , несущественная разница при вычис лениях одной и той же величины разными способами . Никакого практического знач е ния встречающиеся расхождения в величи нах не имеют.
Полезно знать , что коэффициент хи-квадрат и коэффициент че тыр ехпольной коррел я ции взаимосвязаны и , поскольку известна численность и распределение сопоставляемых выборок , указанные коэффициенты могут быть определены один через другой.
Как показывает само название этого метода , числовой материал , подлежащий стат и стиче скому анализу , может быть распределен в таблице-графике , имеющей четыре поля . Такое расположение мате риала облегчает все последующие действия с ним . Чтобы рассмот реть технику вычисления коэффициента четырехпольной корреля ции — он обозначается символом j (фи ), — можно воспользовать ся тем примером , где речь шла о вычислении к о эффициента x 2 . Вы пускники двух школ сравнивались между собой по подготовленно сти к вузовским экзаменам.
Школы Сдали Не сдали Всего Первая 82 a 18 b 100 a + b Вторая 44 c 43 d 87 c + d Итого : 126 а + с 61 b + d 187
Заменив буквенные обозначения числами , получим :
Для получения коэффициента х 2 нужно воспользоваться форму лой х 2 = j 2 · n. В данном примере х 2 = 0,34 2 · 187 = 0,1156 · 187 = = 21,7. Этот же коэффициент х 2 вычислялся другим приемом . По лучено значение 21,9. Расхождение вызвано разницей в технике вычислений.
Коэффициент четырехпольной корреляции j может принимать значения от 0 до 1, причем знак получаемого j не принимается во внимание.
Психологу , намеренному воспользоваться для статистического анализа своих матери а лов методом хи-квадрат , нужно знать о неко торых обязательных требованиях этого метода ; о них не упомина лось в приведенных примерах . При вычислен ии коэффициента х 2 необходимо брать для анализа только абсолютные численности вы борок , но не относительные , в частн о сти , не проценты . Необходи мость учитывать это свойство объясняется тем , что значение коэф фициента х 2 зависит от абсолютных величин рассма триваемых рас пределений . Так , сравнение выборок с численностями 60 и 40 даст совершенно не тот результат , что сравнение выборок с численно стями 6 и 4, хотя процентное отношение распределений в обоих случаях одинаково (60 и 40%).
Далее , для вычисления коэ ффициента х 2 нужно , чтобы в каждой клетке табл и цы-графика было не менее пяти наблюдений . Наконец , нужно со вниманием относиться к определению числа степеней свободы ; неверное определение этого числа повлечет за собой не верное определение уровня значимости коэффициента по таблице.
Этим заканчивается рассмотрение статистических методов , отно сящихся ко второму типу задач.
В этих задачах независимо от того , будут ли они практического или теоретического содержания , психолог сопоставляет , сравнивает между собой несколько выборок . При этом не следует забывать , что цель исследования не всегда состоит в том , чтобы при сопоставле нии отвергнуть нуль-гипотезу . Иногда конечная или промежуточная цель исследования состоит в том , чтобы , допустим , сравнивая вы борки , под т вердить нуль-гипотезу . Самый простой пр и мер : исследо ватель желает составить большую выборку , для чего необходимо объединить в ней учащихся нескольких школ . Естественно , решаю щее значение имеет доказательство того , что группы учащихся из разных школ относ ятся к одной совокупности , нужно , чтобы при мененные критерии подтвердили это , а значит , статистика должна подтвердить при сравнении групп нуль-гипотезу . Подтвердить или отвергнуть нуль-гипотезу при сопоставлении выборок — в этом и состоит назначение стат и стических критериев ; наиболее простые из них были изложены в предшествующем тексте . Конечно , информа ция , которую выявят статистические методы , может быть противоречи ва утверждениям , которые намерен защищать исследов а тель . В таком случае ему придется внес ти поправки в свои утверждения или отка заться от них.
Переходим к задачам третьего типа — задачам , рассмат ривающим динамические , временные ряды.
Предположим , что психологу дано задание собра ть информацию о состоянии умстве н ной работоспособности школьников 8-х классов , начиная со второй недели учебного года и до девятой недели вклю чительно . Одной из методик , с помощью которых можно фиксиро вать состояние умственной работоспособности , считаетс я тест Кре пелина . Он состоит из большого количества примеров , в каждом из них нужно складывать два двузначных числа ; учитывается общее число правильно решенных примеров . Каждые 3 минуты испытуе мые по сигналу экспериментатора отмечают черточкой сделанное. Общая длительность эксперимента в з а висимости от во з раста со ставит 9, 12 или 15 минут . Этой методикой и во с пользовался пси холог . Он начал с того , что сформировал из учащихся , средние ус пехи которых оценивались за предыдущее полугодие баллами 4 и 5, выб орку из 10 ч е ловек . Все они изъявили желание участвовать в экспер и менте . С этими учащимися психолог в течение первой н е дели учебного года провел по 12 тренировочных занятий ; это было необходимо , иначе рост продуктивности всле д ствие упражняемости замаскиров ал бы изменения в дин а мике работоспо собности . Затем начался эксперимент : по субботам после уроков учащиеся этой выборки в течение 12 минут работали с тестом Крепелина . Эксперимент , как было сказано , продолжался 8 не дель . Были получены следующие данные , с редние по всей выбор ке (рис . 4).
Визуальная оценка полученного динамического ряда свидетельст вует о снижении у м ственной работоспособности , в чем , конечно , нет ничего удивительного . Однако снижение идет не вполне равно мерно . Это ясно видно из графика.
Не дели экспери мента I II III IV V VI VII VIII Средняя продук тивность по тесту Креп е лина 92 94 90 92 81 74 78 70 Основная тенденция измене ния умственной работоспособ ности вполне ясна . Наблюд а е мые , в общем , незначительные отклонения от этой тенденции мо гут быть на графике устра нены методом сглаживания . В этом случае применим метод скользящей средней . Для сгла живания суммируются три по казателя у — в данном приме ре это показатели продуктив ности по тесту , — далее , опус кая по одному показателю , суммир у ются одна за другой триады . Средняя каждой триа ды принимается за показатель сглаженной ломанной , если ори ентироваться по графику . Смысл проводимого действия состоит в том , что основная те н денция выступает более отчетливо.
92 92 88 82 77 74 — средние по тр и адам 92 94 90 92 81 74 78 70 В только что рассмотренном примере сглаживание имеет такой вид :
Результаты сглаживания приобретают большую наглядность при нанесении их на гр а фик . Выступает основная тенденция динамики умственной работоспособности . Судя по п о казателям , полученным после сглаживания , в течение первых трех экспериментальных не дель значительного снижения работоспособности не наблюдается , а далее идет непрерывное и резкое ее снижение . Сглаживание , как видно на графике , устранило колебания в раб отосп о собности , отме ченные на первичном графике после V недели . При сглаживании по триадам общее число точек уменьшается на 2.
Какое значение имеет выделение посредством сглаживания ос новной тенденции ? Если условия , благодаря которым возникла ос новная т енденция , сохранятся , то и эта тенденция с высокой веро ятностью сохранится и , таким образом , по основной тенденции мо жет быть построен прогноз , как будут развиваться изучаемые явле ния . Но такой прогноз возможен только при стабильности опреде ленных усл о вий . Для его построения нужен не только фо р мальный , но и содержательный анализ ; он же позволяет раскрыть значение факторов , в ы звавших отклонения в ту или другую сторону от ос новной тенденции.
е Техника метода скользящей средней дает возможность выбирать р азличные способы объединения показателей для сглаживания . Та ковыми могут быть не только триады , но при достаточно большом числе показателей (порядка 30 — 40 и более ) для выведения сколь зящей средней могут быть выбраны пентады (объединения пяти по казателе й ) и даже септиды (семь показателей ).
Нужно иметь в виду , что наглядный и простой метод скользящей средней малопригоден для сглаживания динамики процессов , развитие которых во времени не имеет линейной формы (см .: рис . 3, схема 5, с . 265). Сглаживание метод ом скользящей средней в таких случаях мо жет привести к искажению действительной тенденции развивающегося процесса . Иссл е дователю следует внимательно всмотреться в материал , подлежащий сглаживанию , чтобы решить , имеет ли он право восполь зоваться этим мето дом . Если криволинейная зависимость отражена в достаточно больших отрезках кривой , то каждый из этих отрезков в отдельности может быть подвергнут сглаживанию . Таково ограничение в использовании метода скол ь зящей средней.
Анализируя выраженную на графике ос новную тенденцию в ее приближении к прямой , можно заметить , что метод не дает меры наклона , угла , который образуется между получе н ной после сгла живания приближающейся к прямой ломаной и осью абсцисс . Ме жду тем , узнав величину этого угла , исследователь по лучит инфор мацию о том , с какой скоростью изменяются изучаемые явления во времени : чем круче наклон и соответственно чем меньше внешний угол сглаженной кривой с осью абсцисс , тем больший путь проходит за единицу времени изменяющийся процесс . Это хорошо в и дно на рис . 5.
Рис .5
Точные сведения о мере наклона отрезка прямой , полученного после сглаживания , да ет метод наименьших квадратов.
Для получения пара метров отрезка прямой нужно обратиться к от ношению единиц време ни (х ) и показа телей раз вивающего процесса (у ).
Для нахождения па раметров отрезка прямой , который после сглаживания представит основную тенденцию изменяющегося ряда , проделываются вычисле ния по определенным формулам.
Формула прямой : у = а + bх, где у означает показате ли ряда , х — единицы времени , по которым прослеживаются изменения изучае мого ряда . Надлежит узнать величины а и b. В е личина а необходи ма для установления точки , с которой берет свое начало отрезок прямой , b — необходимо для установления степени наклона о трезка прямой по отношению к оси аб с цисс (оси иксов ).
Для вычисления вышеуказанных параметров а и b имеется сис тема двух уравнений с двумя неизвестными :
па + е xb = е у ;
е xa + е x 2 b = е ху ;
х и у в этой формуле рассчитываются из фактических данных изу чаемого ряда.
Порядок вычислений . Шестиклассники Саня и Толя в течение пяти дней упражнялись в бросках мяча в корзину . Показатели Сани приведены в таблице ( х — единица времени , у число попаданий мячом в корзину . В таблице приведены вычисления и других , тре буемых форм у лой , величин ; п = 5).
х у х 2 ху 1 3 1 3 2 4 4 8 3 6 9 18 4 5 16 20 5 8 25 40
е x = 15; е у = 26; е x 2 = 55; е ху = 89 5 a + 15b = 26;
15 a + 55 b = 89.
Нахождение неизвестных а и b производится обычным способом исключения одного неизвестного . Члены п ервого уравнения для этого умножаются на 3
15 a + 45 b = 78.
Из второго уравнения вычитается первое , вычисляем b:
10 b = 11; b = 1,1.
Подставив числовое значение b в первое уравнение , можно полу чить числовое значение а :
5 a + 16,5 = 26;
5 a = 9,5; a = 1,9.
Пос кольку известны оба параметра отрезка прямой , можно опре делить все значения параметров по пяти точкам , по формуле у = 1,9 + 1,1 х.
y 1 = 1,9 + 1,1 =3,0;
y 2 = 1,9 + 2,2=4,1;
y 3 = 1,9 + 3,3=5,2;
y 4 = 1.9 + 4,4 = 6,3;
y 5 =1,9 + 5,5=7,4.
Как было сказано ранее, сверстник Сани Толя упражнялся в том же умении . Так же , как и у Сани , количество дней упражнения бы ло равно 5. Ниже приводятся результаты Толи и п о казаны все дру гие величины , которые необходимы для вычисления величин , тре буемых формулой.
х у х 2 ху 1 3 1 3 2 6 4 12 3 5 9 15 4 8 16 32 5 10 25 50
е x = 15; е y = 32; е x 2 = 55; е xy =112.
Обозначения здесь такие же , что и в предыдущем примере . Бук вы заменяются их чи с ловыми значениями.
5 a + 15 b = 32;
15 a + 55 b = 112.
Члены первого уравнения умножаются на 3
15 a + 45 b = 96.
Из второго уравнения вычитается первое , получим значение b:
10 b = 16; b = 1,6.
Из первого уравнения получаем значение а :
5 a + 24 = 32;
5 a = 8; a = 1,6.
Можно получить сглаженные показатели по дням упражнений у Толи . y 1 = 1,6 + 1,6=3,2;
y 2 = 1,6+3,2=4,8;
y 3 = 1,6 + 4,8 = 6,4;
y 4 = 1,6 + 6,4 = 8,0;
y 5 = 1,6+ 8,0=9,6.
На рис . 6 показаны только результаты сглаживания . Следует о б ратить внимание на то , как различаются отрезки прямой по их наклону по отношению к оси абсцисс . Дан ные Толи изображены пунктирной пр я мой.
Таковы способы обработки задач третьего типа.
Задачи , встающие перед психологом , который работает в области психологи ческой диагностики , составляют четвер тый тип задач.
Они относятся к конструиров анию диагностических методик , к их применению и о б работке . Американская психологическая ассоциация (АПА ) периодически издает “Ста н дартные требования к педагогическим и психологическим тестам” , специальный кодекс требований к диагностическим методикам ; это пособие полезно как для авторов методик , так и для тех , кто методиками пользуется.
Некоторые из этих требований могут считаться дискуссионными , но полезность кодекса в целом несомненна . Его выполнение , с одной сто роны , обеспечивает объективность методик и их обоснованность , а с другой — препятствует проникновению в арсенал методик псих о логи ческой диагностики дилетантских поделок , произвольных наборов все возможных зад а ний , заимствованных из популярных журналов или со чиненных самим автором . Самые общие и самые необходимые к испол нению требования можно было бы свести всего к двум : ди а гностиче ские методики должны быть надежными и валидными . Значение этих терминов было дано в предыдущих главах . Реализация этих требований осуществляется посредством прочно во шедших в психологическую ди агностику статистических методов ( Как было показано в гл . XI, при работе с критериально-ориентированными методиками при их конструировании и проверке возможны другие подходы ).
Чтобы получить коэффициент надежности , характеризующ ий го могенность методики , ее внутреннюю согласованность , прибегают к приему , называемому расщеплением . Эксп е римент проводится с вы боркой желательно порядка 100, но не менее 50 испытуемых . Полу ченные от каждого участника выборки ответы на вопросы или ре шения заданий делятся на четные и нечетные — по их нумерации в методике . По каждой половинке методики вып и сывается число пра вильно выполненных каждым испытуемым заданий . Два эти ряда корр е лируют между собой.
Допустим , что методика состоит из 24 заданий . Т огда максимальное число выполненных заданий в каждой половинке будет равно 12. Приводим результаты первых 16 испытуемых и технику вычисления коэффициента надежности (гомогенности ) r (табл . 8).
Таблица 8
ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТА НАДЕЖНОСТИ МЕТОДИКИ А (ГОМОГЕ ННОСТЬ )
Исп ы ту емые Правильно решены зад а ния Ранг заданий d d 2 четные нечетные четных нечетных А 10 11 10,5 13,5 3 9 Б 8 8 8 8,5 0,5 0,25 В 3 7 3 6,5 3,5 12,25 Г 3 3 3 2 1 1 Д 11 12 12,5 15,5 3 9 Е 12 10 15 11 4 16 Ж 12 12 15 15,5 0,5 0,25 3 9 8 9 8,5 0,5 0,25 И 7 7 6,5 6,5 0 0 К 6 6 6 6 0 0 Л 7 5 6,5 4 2,5 6,25 M 11 10 12,5 11 1,5 2,25 Н 3 4 3 3 1 1 О 2 2 1 1 0 0 П 10 11 10,5 13,5 3 9 Р 12 10 15 11 4 16 е d 2 = 82,5
Проделана обычная ранговая корреляция . По таблице уровней значимости r 0,99 = 0,64; полученный коэффициент превышает эту величину . Принято считать , что коэффициент надежности не дол жен быть ниже 0,8. Полученный коэффицие нт удовлетворяет этому тр е бованию ( Применение коэффициента корреляции для нахождения коэффициента на дежности-гомогенности путем сопоставления числа правильных решений по четным заданиям и числа правильных решений по нечетным заданиям некото рые авторы нах одят недостаточно корректным , поскольку порядок , в котором представлены коррелируемые ряды , может быть случайным , он может быть произвольно изменен . Однако никакого другого приема для установления этого вида надежности в “Стандартных требованиях к педагог и ческим и психолог и че ским тестам” не дается . Нахождение коэффициента надежности-стабильности указанной недостаточной ко р ректностью не грешит ).
Есть поправочная формула Спирмена— Брауна к коэффициенту на дежности-гомогенности , получаемому путем расщепления . Поскольку при прочих равных условиях получаемый коэффициент будет тем вы ше , чем больше заданий содержится в м е тодике , следует принять во внимание , что прием расщепления уменьшает число заданий вдвое — на этом основывается данный прием . Поправочная формула
в нашем примере
где r SB — коэффициент с учетом поправки , а — коэффициент , вычисленный при коррелировании двух половинок методики . Если этот последний равен 0,88, то после поправки Спирмена— Брауна коэффициент будет равен 0,94.
Поправочную формулу Спирмена— Брауна можно применять только в тех случаях , когда методика д е лится на половинки (расщепление ). Если же в методике в процессе обработки не меня ют число заданий , то п о правочная формула не применяе тся.
Величина коэффициента надежности-гомогенности зависит от со циально-психологических особенностей той выборки , по результа там испытания которой этот коэффициент устанавливался . Поэтому при опубликовании методики , приводя ее основные характеристики , ав тору следует указать , на каком контингенте проводилась проверка надежности.
При вычислении коэффициента надежности методики , характери зующего стабильность данных , получаемых с помощью этой мето дики , первый коррелируемый ряд представляет собой результаты первого , а второй — повторного испытания : его рекомендуют про водить примерно через шесть недель после первого . При необходи мости этот срок может изменяться . Эти два ряда коррелируют меж ду собой . Корреляция проводится по обычным правилам , о них со общал о сь выше . Это прием “тест-ретест”.
Для установления надежности методики существуют и некоторые другие приемы . Так , для получения коэффициента надежности практикуется прием параллельных форм . Авторы , конструирующие методику , создают две ее формы ; условно наз овем их формой А и формой Б. Обе формы должны быть однородны по психологической направленности , по доступности содержания заданий и по их труд ности . В одном варианте формы Л и Б предъявляются и с пытуемым одна за другой , причем в одной половине выборки испы туемым сна чала предл а гается форма А, а за ней форма Б , а в другой половине выборки , наоборот , сначала форма Б, а затем А. Результаты , полу ченные по той и другой форме , коррелируют между собой , и полу ченный коэффициент трактуется как коэффициент надежнос ти . Не трудно заметить , что этот прием близок приему расщепления с той разницей , что методика как бы удвоена и сравн и ваются не четные и нечетные задания , а две половины этой удвоенной методики . Это дает право трактовать получаемый коэффициент скорее как ко эффициент надежн о сти-гомогенности , а не надежности-стабильности . Поскольку проверке подвергается набор заданий в целом , поправочную формулу Спирмена— Брауна применять не следует.
Другой вариант использования приема параллельных форм состо ит - в том , что одн а из форм предлагается испытуемым через какой-то интервал времени после другой , что сближает этот прием с приемом “тест-ретест” . При проведении этого приема необходимо убедиться в том , что обе формы высоко коррелируют между собой , согласно только что изло ж енному приему по надежности-Гомоген ности . Результаты обоих испытаний затем коррелируют . Получен ный коэффициент может трактоваться как коэффициент надежно сти-стабильности . Выше указывалось , что в приеме “тест-ретест” рекомендуется интервал между испытан и ями шесть недель . Для этого варианта приема параллельных форм этот интервал может быть уменьшен , так как испытуемый при выполнении заданий не сможет опираться на память.
Из предшествующего изложения явствует , что в приемах уста новления надежности главную роль играет статистический метод корреляций . Несколько по-иному обстоят дела при проверке валид ности методики.
Если показатели того критерия , который взят для получения ко эффициента внешней валидности , имеют примерно ту же меру рас сеяния , меру вариативн ости , что и мера рассеяния показателей са мой методики , то применение корреляции правомерно . Допустим , автор м е тодики намерен установить ее валидность , сравнивая ус пешность выполнения методики с учебной деятельностью . Валид ность устанавливается на выборк е школьников . В этом случае , как показывает практика , суммарные оценки за одну учебную четверть или за полугодие п о кажут примерно тот же размах колебаний , что и размах колебаний по методике ; методика состоит из 20 заданий , и при ее выполнении показан разма х колебаний от 3 до 20. Суммар ные оценки успеваемости , после того как они подсчитаны за полго да , имеют размах колебаний порядка от 14 до 36. Такие ряды впол не возможно коррелировать.
Но в некоторых случаях для получения коэффициента валидно сти приходит ся сравн и вать успешность выполнения диагностиче ской методики , допустим , в тех же пределах кол е баний — от 3 до 20, и производственные достижения , которые имеют всего три сту пени оценок : ниже средних , средние и выше средних . Корреляцией в этом случае воспо льзоваться нельзя , если иметь в виду линейную корреляцию , о которой идет речь в этой главе . Однако могут быть использованы некоторые другие статистические методы , показы вающие сущ е ствование или отсутствие связи между распределени ем двух рядов численносте й . Просте й ший способ получения коэф фициента валидности в описываемом случае и в других подобных случаях — метод “хи-квадрат” . Всех испытуемых , прошедших диагностический эксперимент , делят на три равные группы — их и со поставляют с тремя группами , на кото рые были под е лены испытуе мые при оценке их профессиональной успеваемости.
В изучаемой выборке — 90 человек . Они делятся по профессио нальным достижениям на три группы : первая — в ней 30 испытуе мых — лица с профессиональными достижениями ниже среднего уро вня ; вторая — 40 испытуемых — это лица со средними дости жениями , и третья — 20 испытуемых , их достижения выше средне го уровня . Первая группа составляет 33,3% выборки , вторая — 44,4 и третья — 22,2%.
Приводим технику вычисления (табл . 9).
Таблица 9
Психол ог и ческая оценка Оценка профессиональных достижений Всего Ниже сре д него Средняя Выше среднего Ниже сре д него А
20
(10) В
5
(13,3) С
5
(6,7) 30 Средняя D
5
(10) Е
15
(13,3) F
10
(6,7) 30 Выше сре д него G
5
(10) Н
20
(13,3) J
5
(6,7) 30 Итого : 30 40 20 90
Эксперимент , данные которого представлены в табл . 8, предпри нимался , чтобы уст а новить валидность психологической оценки . Нуль-гипотеза формулируется так : психолог и ческая оценка не име ет никакого значения для профессиональных достижений ; поэтому она никак не скажется на распределении численностей в таблице-графике “хи-квадрат” ;
Принятие нуль-гипотезы может произойти в том случае , если в каждой из групп по профессиональной успешности испытуемые бу дут распределены независимо от их психологической оценк и . Тогда испытуемые , получившие психологическую оценку “ниже среднего” , распределятся по всем трем группам в тех же пр о центных отноше ниях , в каких они распределились и по профессиональным дости жениям . Напомним эти отн о шения : 33,3 — 44,4 — 22,2. Психоло г ическую оценку “ниже среднего” получили всего 30 испытуемых . 33,3% этого числа (10 человек ) должны были бы попасть в группу с профессиональными достижениями ниже среднего уровня , с дос тижениями среднего уровня — 44,4% (в среднем 13,3), с достиже ниями вы ш е среднего уровня — 22,2% (6,7).
Те же рассуждения повторяются и относительно испытуемых , имеющих психологич е ские оценки “среднюю” и “выше среднего” . Однако наблюдается иное распределение . Во з никает вопрос : можно ли , учитывая фактическое распределение , отв ергнуть нуль-гипотезу и признать , что психологическая оценка влияет на профессиональ ные достижения ? Это ра с кроет методика “хи-квадрат”.
В клетках таблицы представлены как фактически наблюдаемые численности , так и предполагаемые согласно нуль-гипотезе ; они за ключены в скобки.
Как известно , формула хи-квадрат такова :
где f 0 — фактически наблюденные численности , f e — предполагае мые численности.
Для получения значения хи-квадрат нужно сумми ровать по клет кам :
Клетки
x 2 = 10 + 5,2 + 0,4 + 2,5 + 0,2 + 1,6 + 2,5 + 3,7 + 0,4 = 26,5, fd — число степеней свобод ы.
В этом примере c = (к - 1)( с - 1) = (3 - 1)(3 - 1) = 4.
x 2 0,99 при 4 степенях свободы равно 11,34.
Сравнивая полученную в эксперименте величину x 2 с величиной x 2 0,99 , указанной в таблице значимостей , можно заключить : полу ченная в эксперименте величина ( x 2 = 26,5) свидетельствует о ва лидности примененной психологической методики.
Величина хи-квадрат с указанием ее значимости служит в подоб ных случаях показат е лем или коэффициентом валидности . Этот же метод применяется , если оценка дается не по трем ступе ням , как в рассмотренном примере , а по пяти (значительно ниже средней , ни же средней , средняя , выше средней , значительно выше средней и т.д .). Техника вычислений при такой дифференциации оценок ана логична показанной выше.
Были изложены четыре типа задач и показаны статистические методы , применяемые для каждого типа . В современной диагности ке применяются не только перечисленные в этой главе статистиче ские методы , но и многие другие . Однако можно полагать , что , ог раничив свою цель изложением простейших с т атистических мето дов , нет необходимости обращаться к сложным и сложнейшим . Чи татели , заинтересовавшиеся проблемами статистических методов в диагностике , могут обратиться к другим пособиям и источникам.
Элементы планирования в психологических исследова ни ях. Нельзя начинать и с следование , не уяснив его цель . Это ак сиома . Однако наблюдения показывают , что не все ее принимают . Нередко можно обнаружить смешение двух категорий целей : цель исследования и цель исследователя . Но полное доминирование цели исследов ателя и безразличное отн о шение к цели исследования не должны иметь места . Планирование должно исходить из цели ис следования.
Есть два главных источника , стимулирующих возникновение ис следований : либо они отвечают на запросы , выдвигаемые практи кой , котор ую обслуживает данная наука , либо они возникают из нужд самой науки и имеют целью совершенствовать познание тех сфер жизни , которым посвящена данная наука . Стоит отметить , что детальное планирование необходимо и в том , и в другом случае . Мнение , будто пра к тические исследования могут проводиться без за ранее продуманного плана , безусловно , ошибочно ; только правильно спланированное и с следование может в своих выводах дать ответ на те вопросы , ради решения которых оно и задумывалось.
Различают планирование иссл едований , не нуждающихся в экс перименте , и исслед о ваний , включающих эксперимент как необхо димую часть . Что касается первых , то их планы в принципе не от личаются от планов исследований в других науках . В вводной части (она будет примерно такой же и в экс периментальных исследовани ях ) очерчивается место данного и с следования в потоке современной науки , кратко реферируются работы , затрагивающие ту же пробле матику , указываются источники и формулируется замысел исследо вания и его цель . Далее планируется само исследование . Все без исключения исследования вообще могут рассматриваться как сис тема доказательств , обосновывающих выводы , в которых содержит ся и цель , поставленная автором.
Этот план не должен рассматриваться как обязательный . Особенно сти работы мог ут заставить автора в той или иной степени отойти от него , дополнить его или сократить . В и с следованиях , включающих экс перимент , во вводной части должно быть показано , зачем оказался нужным эксперимент и каковы принципы его построения.
Планирование экспер имента в психологическом исследовании пред полагает предвар и тельное обсуждение следующих пяти пунктов.
А . Каков планируемый объект эксперимента , другими словами , какова та выборка и с пытуемых , которых намерен привлечь автор ? В зависимости от того , каких исп ытуемых возьмет автор , ему придет ся обдумать и следующий пункт.
Б . Если необходимо работать со школьниками , то эксперимент должен быть согласован со школьными режимами — годовым , еже недельным и ежедневным , с учетом умственной нагрузки школьни ков . Необхо димо считаться и с периодом подготовки к экзаменам и их сдачей . С первыми двумя пунктами тесно связан третий.
В . Нужны методики , которые , с одной стороны , учитывали бы особенности исследу е мого контингента , а с другой — непосредст венно вели бы к цели иссле дования . Когда нам е чены методики и время их проведения , возникает следующий пункт плана.
Г . Материалы эксперимента нуждаются в адекватной обработке и почти всегда в пр и влечении статистики . Планируются такие стати стические методы , результаты которых непоср едственно направлены на достижение цели исследования . Все перечисленные пункты под готавливают планирование последнего пункта.
Д . Сколько и какой квалификации работников нужно для прове дения эксперимента , какая понадобится аппаратура и каких средств потре бует эксперимент ?
Цель исследователя (а не исследования ) должна подсказать , в каком виде нужно пре д ставить полученный материал : это может быть отчет , статья , часть книги или диссертация и т.д . Исследова тель , обдумывая предстоящий эксперимент , должен иметь в виду , что пол у ченные выводы будут относиться не только к выборке ис пытуемых , непосредственно учас т вующих в эксперименте , но и к той совокупности , к которой принадлежит эта выборка . Чтобы этот расчет оправдался , нужно с достаточной определенностью предс та вить , что же это за совокупность . Поэтому важно вести экспери мент не со случайным набором испытуемых , а с испытуемыми , об разующими репрезентативную выборку , воспроизводящую все характерные психологические признаки совокупности . С этих же позиций репр е зентативности нужно рассмотреть вопрос об объ еме выборки . Не всегда целесообразно планировать участие боль шой выборки в несколько сотен или тысяч испытуемых . В такой выборке почти неизбежно утратится репрезентативность , в ней , возможно , будет представле н о несколько совокупн о стей , каждая из которых так или иначе повлияет на результаты эксперимента : их интерпр е тация потеряет ясность . Поэтому предпочтительнее рабо тать с малыми и средними выбо р ками , объемом до 30 — 100 испы туемых . Чтобы решить , сколько же кон кретно следует взять участ ников эксперимента , придется провести пилотажный , или подгото вительный , м и ни-эксперимент . Проведение такого эксперимента по может выявить два необходимых м о мента : гомогенность выборки , ее сравнительно малую вариативность по тем признакам , к о торые , при прочих равных условиях , изучаются в эксперименте , и такой ее объем , который обеспечит получение всех показателей как внутри выборки , так и в ее сопоставлениях на должном уровне статистиче ской значимости . О последнем моменте свидете льствует след у ющее наблюдение : допустим , что в пилотажном эксперименте на выборке 10 испытуемых получен коэффициент корреляции между двумя признаками , равный 0,55. Этот коэффициент свидетельствует о том , что коррелируемые ряды связаны между собой , однако о н ниже уровня 0,95 значимости , который принят в психологических иссле дованиях . При увеличении в ы борки до 12 человек коэффициент окажется на приемлемом уровне значимости — несколько выше ко эффициента общепринятого уровня , а он равен 0,576. Вывод , кото рый придется сделать исследователю : выборка должна состоять не из 10 испытуемых , а минимум из 12-15. Этот объем позволит по лучить значимый коэффициент . Но определить объем выборки без пилотажного эксперимента не представляется возможным . Если ав тор претенд у ет на более высокий уровень значимости , то по табли це уровней значимости он установит и объем в ы борки . Чем выше гомогенность выборки , тем яснее ее отнесенность к той или дру гой сов о купности . Вместе с тем высокая гомогенность может рассматриваться как пре дпосылка того , что желательные уровни статистической значимости действительно могут быть достиг нуты с увеличением выборки.
При планировании эксперимента исследователю надлежит обра тить внимание на то , чтобы в подборе испытуемых для своей вы борки он избе жал ошибок , порождаемых стре м лением работать с выборкой , обеспечивающей получение желательных результатов . Надежным заслоном против таких ошибок является обращение к Таблице случайных чисел . Так , исследователю предстоит отобрать из двух классов одну выборк у : число учеников в обоих классах со ставляет 60 человек , а выборку исследователь намерен составить из 15 ч е ловек . Возможно , что ему посоветуют взять лучших , или дис циплинированных , или усердных и т.п . Но те признаки , которыми советуют руководствоваться и сследователю , несущественны для его цели . Допустим , что он намерен изучить наиболее яркие проявле ния гуманитарных способностей . Чем руководствоваться исследова телю при отборе испытуемых в свою в ы борку ? Ему следует обра титься к Таблице случайных чисел.
Ч тобы воспользоваться этой таблицей , сначала нужно выписать подряд , одну за другой , в любой последовательности фамилии уче ников , из числа которых исследователь намерен образовать нужную ему выборку . Далее , открыв Таблицу случайных чисел на любой стр а нице , следует взять , например , два первых двузначных числа из любого из десяти столбцов , напечатанных на этой станице . Идя сверху вниз , нужно последовательно приписывать эти двузначные числа к фа милиям учеников . В выборку попадут ученики , к чьим фамилиям будут приписаны первые пятнадцать чисел , начиная с наименьшего . Исследо ватель волен взять не первые два числа , а два последних или два сред них и идти не сверху вниз , а снизу вверх . Необходимо только сохра нять тот порядок , который был избран для работы с Табл и цей сл у чай ных чисел в данном конкретном исследовании.
Вот фрагмент одной из страниц Таблицы случайных чисел :
5489 5583 3156 0835 1988 3912 0938 7460 0869 4420 3522 0935 7877 5665 7020 9555 7379 7124 7878 5544 7555 7579 2550 2487 9477 0864 2349 1012 8250 2633 5759 3564 5080 9074 7001 6249 3294 6368 9102 2672
и т.д.
Допустим , исследователь решил , идя сверху вниз , воспользовать ся первыми двумя числами третьего столбца . Тогда идущий первым по порядку ученик получит приписанное к своей фамилии число 31, в торой по порядку — число 78, третий — 25, четвертый — 50 и да лее , следуя вниз по столбцу . После того как числа будут приписаны всем 60 ученикам , будут отобраны те , кто получил первые по по рядку 15 чисел . Эта несложная процедура исключает произволь ность в отборе испытуемых.
Рекомендации , содержащиеся выше , помогут спланировать пило тажный эксперимент , а затем и исследование в его окончательном варианте ( Вопрос о конструировании эксперимента как такового в этой главе не затрагивается ).
Такое построение рабо ты поможет сэкономить силы , средства и время и в конечном счете прийти к поставленной цели , либо дока зав и подтвердив гипотезу автора , либо отк а заться от нее . В том и другом случае прояснится дальнейший путь развития исследований , уточняющих и углубляющих разработку проблемы.
Дело , однако , не только в этом . Неточно спланированное иссле дование , сколько бы сил в него ни вложили , вряд ли продвинет вперед науку и поможет практике . Всегда останется сомнение в действенности его выводов . А это приведет к тому , ч то возникнет необходимость в новых , тождественных по целям исследованиях , станут вероятными противоречивые в ы воды.
Поэтому умение планировать экспериментальное исследование составляет важное и необходимое звено в профессиональной подго товке и надлежащей к валификации психолога.