Вход

Эксперимент в социологии

Контрольная работа по социологии
Дата добавления: 08 января 2007
Язык контрольной: Русский
Word, rtf, 655 кб
Контрольную можно скачать бесплатно
Скачать
Данная работа не подходит - план Б:
Создаете заказ
Выбираете исполнителя
Готовый результат
Исполнители предлагают свои условия
Автор работает
Заказать
Не подходит данная работа?
Вы можете заказать написание любой учебной работы на любую тему.
Заказать новую работу

Содержание.


Введение………………………………………………………………………….. 3 Определение и виды эксперимента…………………………………………..…4 Основные принципы экспериментирования в социальных науках……………4 Основные экспериментальные планы с контрольной группой . и рандомизацией…………………………………………………………………13 Многомерные и факторные эксперименты: общий обзор…………………… 31

Краткий справочник терминов………………………………………………….40

Заключение……………………………………………………………………….42

Список используемых источников и дополнительной литературы………….44
































Введение.

К числу самых своеобразных и трудноосваиваемых методов сбора социологической информации относится эксперимент. Уже одно название этого метода, имеющего весьма громкое звучание, завораживает и вызывает особое уважение.

Эксперимент — это опытное исследование воздействия отдельного фактора (или нескольких факторов) на интересующую исследователя переменную. Экспери­ментальное исследование строится в соответствии с правилами индуктивного вывода о наличии причинно-следственной связи между событиями, во-первых, демонстрируя регулярный характер появления события-«отклика» после пред­шествующего по времени события-воздействия и, во-вторых, исключая посред­ством особых приемов экспериментальной изоляции и контроля альтернативные объяснения появления «отклика» с помощью посторонних влияний и кон­курирующих каузальных гипотез1. Соответственно данные экспериментального исследования представляют собой наилучшее приближение к модели статистического вывода о наличии причинной взаимосвязи между воздействием и «откликом» или, в более привычных терминах, между независимой и зависи­мой переменными.





Определение и виды эксперимента.


Основные принципы экспериментирования в социальных науках.


Экспериментальный метод пришел в социальные науки из естественных наук, где он примерно с XVII века стал основным способом опытной проверки научных теорий2. Самым популярным видом эксперимента в точных науках был и остается лабораторный эксперимент, получивший распространение также в науках о человеческом поведении.

Лабораторный, или истинный, эксперимент нацелен на проверку теоретичес­кой гипотезы и осуществляется в условиях максимального контроля над уров­нем воздействия независимой переменной и очищения (изоляции) этого воз­действия от посторонних влияний, оказываемых внешними, т. е. иррелевантными с точки зрения проверяемой гипотезы, переменными. Экспериментальный контроль и изоляция позволяют отвергнуть иные возможные объяснения на­блюдаемого эффекта — конкурентные гипотезы. Немаловажным условием обо­снованности, валидности результатов, получаемых в лабораторном эксперимен­те, является возможность достаточно надежного измерения зависимой переменной. В этом случае при бесконечном количестве испытаний результаты неизбежных случайных возмущений в зависимой переменной «погасят» друг друга и исследователь получит точную оценку интересующего его воздействия.

На практике описанные требования к истинному эксперименту могут быть пол­ностью воплощены лишь в бесконечном идеальном эксперименте, при прове­дении которого внешние, так называемые экзогенные переменные остаются неизменными, и изменяется лишь независимая переменная, что обеспечивает полную валидность выводов о изучаемом соотношении между независимой и зависимой переменными3.

Идеальный эксперимент — это эталон, относитель­но которого могут оцениваться и сопоставляться эксперименты реальные, од­нако буквальное выполнение всех его требований обычно невозможно или даже бессмысленно с точки зрения конкретной научной задачи, стоящей перед ис­следователем.

Дональд Кэмпбелл приводит в качестве примера эксперимент Николсона и Карлслайла, которые продемонстрировали явление гидролиза, всего лишь «взяв в мае 1880 г. образец воды в районе Сохо (образец очень частный, характерный для местных условий и данного периода) и опустив в него весьма специфичный кусок медной проволоки, по которой пропускался электрический ток...» Влиянием посторонних факторов (прежде всего примесей) на протекание гидролиза в данном эксперименте можно было пренебречь, так как целью было подтверждение теоретически предсказанной закономерности, а не измерение скорости гидролиза или изучение особенностей его протекания в различных средах4.

В социальных науках от лабораторного эксперимента принято отличать поле­вой эксперимент, проводимый в естественных условиях и в большинстве слу­чаев имеющий своей целью не столько проверку научной гипотезы о причинной связи между переменными, сколько оценку эффективности различных про­грамм или методов воздействия.

Для многих прикладных социологических исследований, ориентированных на разработку и оценку социальных программ, социальное экспериментирование столь же типично, сколь типичны лабораторные эксперименты для социальной психологии или социологии малых групп. Социальное экспериментирование позволяет ответить на самые разнообразные вопросы, относящиеся преимуще­ственно к сфере практической политики и администрирования — например, как влияет отмена смертной казни на показатели преступности, растет ли посе­щаемость музеев при снижении цен на входные билеты, во всех ли случаях повышение размера вознаграждения ведет к росту производительности тру­да и т. п.

Например, в исследовании воздействия детского сериала «Улица Сезам» на культурное и интеллектуальное развитие американских дошкольников5 полевой эксперимент охватил детей и родителей, проживавших в городах(Бостон, Дарэм, Феникс), а также в сельских районах Калифорнии и Филадельфии. В ходе эксперимента детей и их родителей побуждали к просмотру сериала (независимая переменная), фиксируя изменения в когнитивном развитии дошкольников с помощью тестов достижений и тестов общего развития (зависимые переменные). Двухлетний полевой экспери­мент позволил продемонстрировать заметный обучающий эффект, связан­ный с просмотром сериала, особенно очевидный в группе детей из небла­гополучных семей.

Полевой эксперимент — ведущий метод ориентированных на практику оценоч­ных исследований (evaluative research) .

Однако далеко не всегда оценка эффек­тивности новой, компьютеризованной системы обучения или, скажем, нового танкового прицела происходит в реальных полевых условиях. Иногда исследо­ватели проводят эксперимент в условиях, имитирующих реальность или даже представляющих некоторые особенности реальной ситуации — обучения, вож­дения танка и т. п. — в преувеличенном, «очищенном» виде. Р. Готтсданкер пред­ложил различать два типа полевых экспериментов — эксперименты, дублирую­щие реальный мир (т. е. уже описанные «натурные» эксперименты), и экспери­менты, улучшающие реальный мир6. Эксперименты, улучшающие реальный мир, прежде всего позволяют повысить валидность и надежность данных. Так, данные «натурного» эксперимента по эффективности нового метода обучения вождению автомобиля будут подвержены влиянию множества трудноконтро­лируемых различий в условиях видимости, ландшафте, состоянии дорог и ис­пользуемых автомобилей, тогда как данные тренажерных испытаний будут мень­ше подвержены такого рода смещениям. Кроме того, надежность эксперимента в «улучшенных» условиях также повысится за счет возможности контролиро­вать частоту «встречного движения» на экране тренажера, соблюдать четкий временной режим, исключающий утомление оператора, и т. д.

Для того чтобы понять, чем руководствуются социологи, осуществляя выбор одного из перечисленных видов эксперимента и конкретного плана построения экспериментального исследования, нам следует сначала рассмотреть ключевые понятия и принципы, лежащие в основе современного подхода к социальному экспериментированию.

Суммируя вышеизложенное, можно сказать, что в лабораторном эксперименте обоснованность выводов экспериментального исследования, т.е. их валидность и надежность, обеспечиваются благодаря трем принципам планирования экс­перимента: 1) контролю над уровнем независимой переменной, 2) изоляции основного эффекта (т. е. собственно воздействия независимой переменной на зависимую переменную) от влияния посторонних, смешивающих факторов, а также 3) многократному воспроизведению полученных результатов, которое позволяет нивелировать случайные изменения результата7 отдельных испыта­ний, связанные с несистематическими колебаниями фона, случайными ошиб­ками, усталостью и т. п. При этом первые два принципа планирования лабора­торного эксперимента позволяют обеспечить валидность как соответствие эксперимента его цели, измерение именно того эффекта, который предполага­лось измерить. Идеальный, т. е. совершенно валидный эксперимент, фиксирует лишь то отношение между переменными, которое и планирует изучить экспе­риментатор, и «отсекает» любые другие источники систематической вариации результатов. Валидность эксперимента, следовательно, определяет достовер­ность выводов о наличии либо отсутствии предполагаемой причинной связи и о подтверждении либо неподтверждении проверяемой в эксперименте теорети­ческой гипотезы (рис. 1). Третий принцип обеспечивает надежность результа­тов — защиту от случайной ошибки, являющуюся, как говорилось выше, необ­ходимым условием валидности.

Однако большая часть экспериментов в социальных науках (как, впрочем, и в ряде инженерных дисциплин или агробиологии) происходит в условиях, когда перечисленные принципы не могут быть реализованы полностью. Возникаю­щие здесь ограничения имеют технический, а иногда — скорее принципиаль­ный характер. Если, например, в социологическом эксперименте независимы­ми переменными служат раса или социальное происхождение, то мы даже тех­нически — не говоря уже о соображениях морали — не можем осуществлять полный контроль над этими переменными, т. е. совершенно произвольно опре­делять их значение для каждого отдельного случая (субъекта). И даже если бы эту трудность можно было бы каким-то образом преодолеть на время проведе­ния испытаний, нам было бы трудно изолировать интересующий нас основной эффект от влияния сопутствующих, «закоррелированных» с независимой пере­менной факторов, — связанного с расой или происхождением специфического социального опыта, соответствующих социальных навыков и т. п. (Со схожими трудностями сталкивается и агробиолог, оценивающий урожайность нового сорта пшеницы и пытающийся отделить главный фактор от прочих, также вли­яющих на урожайность: различий в освещенности опытных участков, в соста­ве почвы и т. п.).



Рис. 1. Типы экспериментов


Знаменитый английский статистик Р. Фишер первым обосновал возможность применения несколько иного подхода к планированию полевых экспериментов, лабораторных экспериментов с неполным контролем, а также квазиэкспе­риментов. Этот подход основан на целе­направленном использовании законов случая и теории вероятности. Он требует введения в планирование эксперимента принципа рандомизации.

Рандомизация — это стратегия случайного распределения субъектов по раз­личным условиям (режимам) эксперимента и экспериментальным группам.

Воспользуемся в качестве иллюстрации тем же простым примером психофизи­ческого опыта, которым пользуется сам Фишер при обсуждении роли принципа рандомизации в планировании эксперимента8.

Представим себе, что некая леди взялась угадать, в какие четыре из восьми чашек чая с молоком сначала налили молоко, а в какие — чай. Эксперименталь­ная гипотеза состоит, таким образом, в том, что испытуемая обладает описан­ной способностью различения. Если воспользоваться простейшей формулой из комбинаторики, то общее число способов выбрать четыре чашки из восьми равно числу размещений А:


Иными словами, если бы испытуемая не обладала способностью отличать «молочно-чайные» чашки от «чайно-молочных» и прибегла к случайному угадыва­нию, то вероятность правильно определить 4 чашки составила бы /70 (из 70 существующих различных способов выбрать 4 чашки из 8 лишь один является правильным). Говоря точнее, при достаточно длинной серии испытаний частота правильных ответов приближалась бы к 11/70. Если же частота правильных ответов существенно, с точки зрения избранного статистического критерия, превышает частоту случайного угадывания, то мы вправе сделать вывод о том, что интересующая нас специальная способность действительно существует.

Однако описанная схема испытания явно не соответствует тем требованиям, которые предъявляются к уровню контроля над переменными и изоляции основного эффекта в лабораторном эксперименте. Возможные угрозы валидности наших статистических выводов носят довольно очевидный характер. Во-первых, мы не обладаем никакими средствами прямого измерения зависимой переменной — способности вкусового различения. Правильные угадывания — это лишь косвенные индикаторы такой способности и могут отражать влияние «посторонних» переменных, даже превосходящее основной эффект. Если, на­пример, во все чашки, в которые сначала было налито молоко, был добавлен сахар, ясно, что все они будут безошибочно опознаны. Статистические выводы о значимости окажутся, таким образом, невалидными, т. е. не имеющими отно­шения к нашей экспериментальной гипотезе (хотя и подтверждающими конкурентную гипотезу о способности распознавать сладкий вкус). Систематическое постороннее влияние, составляющее угрозу валидности статистического выво­да, может носить и другой характер: «молочные» и «чайные» чашки могут от­личаться друг от друга толщиной, температурой, цветом. Чтобы устранить пе­речисленные угрозы валидности и нивелировать возникающие систематичес­кие смещения, экспериментатор должен использовать принцип рандомизации, т. е. обеспечить случайный порядок предъявления стимулов-чашек и их оценки, определяемый, например, с помощью таблицы случайных чисел или жре­бия. В идеале и отбор испытуемых для каждой серии опытов, и распределение уровней независимой переменной между чашками («молоко-чай» или «чай-молоко») должны основываться на законах случая.

При планировании конкретного экспериментального исследования описанные принципы находят воплощение при разработке плана, или схемы, эксперимен­та, определяющего порядок предъявления испытуемым (или их группам) раз­личных уровней (условий) независимой переменной для адекватной проверки экспериментальной гипотезы9.


Основные экспериментальные планы с контрольной

группой и рандомизацией.

В социологии, психологии и других поведенческих науках особую роль играет использование принципа рандомизации при распределении испытуемых по груп­пам. В эксперименте с неполным контролем или в полевом эксперименте, про­исходящем в естественных условиях (т. е. в условиях школьного класса, про­мышленной организации, городского района и т. д.) часто нужно доказать не только наличие ожидаемого эффекта в результате некоторого воздействия Х, но и отсутствие того же эффекта в тех случаях, когда воздействия не было. Например, исследователь, изучающий воздействие просмотра антивоенных фильмов на изменения установок студентов, случайным образом отбирает из некоторой совокупности студентов экспериментальную группу, которой будет показан антивоенный фильм, а также контрольную группу, которой он продемонстрирует нейтральный фильм, никак не связанный с изучаемыми установ­ками. План этого простейшего рандомизированного эксперимента с предва­рительным и итоговым тестированием и контрольной группой (RT1-2C) будет выглядеть таким образом:

R О1 Х О2

R О3 О4


где Rпроцедура рандомизации (случайного распределения по группам), О1,2 — уровни установок в экспериментальной группе до и после просмотра фильма X, O3,4 — уровни установок в контрольной группе, не смотревшей фильма. Ис­пользование контрольной группы позволяет устранить некоторые важнейшие угрозы валидности эксперимента. Во-первых, если бы исследователь отказался от использования контрольной группы и ограничился тестированием, т. е. из­мерением установок «до-после» просмотра, то обнаруженные изменения в уров­не установок можно было бы приписать влиянию на испытуемых самого по себе факта участия в эксперименте.

Испытуемые, возможно, осознавали, что они отобраны для важного исследования и стремились некоторым образом со­ответствовать своей роли и оправдать некие гипотетические «ожидания» экспериментатора. Описанная угроза валидности широко известна и для нее суще­ствует несколько обозначений.

В психологическом тестировании и эксперимен­тальной психологии это называют «эффектом морской свинки» или «мотивом экспертизы». Иногда применяют термин, возникший в медицине, где при кли­нических испытаниях новых фармакологических средств и методов лечения часто наблюдают «эффект плацебо», т. е. заметное улучшение статуса у многих участников контрольной группы, в которой вместо реального воздействия ис­пользовались индифферентные средства и нейтральные врачебные манипуля­ции. В социологии самое популярное обозначение систематического смещения, возникающего из-за реакции испытуемых на ситуацию эксперимента — это «хоуторнский эффект».

В так называемых хоуторнских экспериментах (по названию промышлен­ного предприятия в Чикаго) исследовались организационные и социаль­но-психологические факторы, влияющие на производительность труда.

Исследователи обнаружили, что эффект роста производительности труда в бригадах сохранялся даже при отсутствии собственно экспериментального воздействия. Предположительной причиной этого явления был рост группового самосознания у участников эксперимента10.

«Хоуторнский эффект»11 — это угроза валидности, связанная с особенностями экспериментальной группы.

Еще одна угроза валидности выводов, которую позволяет преодолеть описыва­емый план эксперимента, также связана с особенностями групп, а именно — с процессом отбора для участия в эксперименте. Если бы мы отказались от предварительного тестирования и случайного распределения испытуемых по экспериментальной и контрольной группам, мы совершили бы методическую ошибку, весьма характерную для любых экспериментов с добровольцами. Очень часто исследователи отбирают испытуемых для участия в специальной программе обучения или в новаторском организационном проекте, основываясь на изъявленном ими желании, а затем сравнивают результаты, показанные участниками оцениваемой программы, с результатами какой-либо другой доступной группы (или даже случайной выборки из соответствующей генеральной сово­купности), не участвовавшей в такого рода программе. Однако такое сравнение некорректно: само по себе желание участвовать в эксперименте часто свидетельствует о изначально более высокой мотивации, осведомленности или ин­теллекте. Эти факторы сами по себе, или взаимодействуя с главной независи­мой переменной Х, могут объяснить значимые различия в результатах, показан­ных экспериментальной группой. В только что описанном примере сравнение группы добровольцев, пожелавших посмотреть антивоенный фильм, с прочи­ми студентами, может вести к завышенной оценке воздействия просмотра, если добровольцы изначально проявляют больший интерес к политическим пробле­мам. Лишь случайное распределение добровольцев по контрольной и экспери­ментальной группам при соблюдении «непрозрачности» такого распределения для всех испытуемых (участники обеих групп должны считать, что они подвергаются некоторому экспериментальному воздействию) позволяет судить о роли независимой переменной X возникновении



межгрупповых различий12.

Вышеописанные угрозы валидности связаны преимущественно с особенностя­ми групп, проявляющимися на стадии отбора или в ходе эксперимента. Однако рандомизация позволяет справиться и с некоторыми угрозами валидности, ис­ходящими от переменных внешнего окружения, фона. К фоновым относятся, в частности, «возможные влияния времени года или событий, возникающих на институциональном уровне», а также факторы естественного развития — «все те биологические или психологические процессы, которые независимо от кон­кретных внешних событий систематически изменяются с течением времени»13. Испытуемые взрослеют, обучаются, устают, улучшают свои результаты при повторных тестированиях и т. п., что может сказываться на их результатах.

Од­нако если такие посторонние влияния не оказывают избирательного воздей­ствия только на членов экспериментальной группы, они будут вносить вклад лишь в случайную ошибку, а не в систематическое смещение. Иными словами, они будут с равной вероятностью распределены между случайным образом ото­бранными участниками контрольной и экспериментальной групп. План типа RT1-2C позволяет обеспечить случайный и равновероятный характер внешних, фоновых воздействий на контрольную и экспериментальную группу. Более того, он позволяет «вычесть» величину фонового влияния и оценить чистый основ­ной эффект: если внешнее влияние все же имело место, оно в равной степени подействовало на показатели и экспериментальной, и контрольной групп; следовательно, разность между средними значениями первого и второго замеров уровня зависимой переменной в контрольной группе (О4  О3) нужно вычесть из аналогичной разности значений зависимой переменной, зафиксированной в экспериментальной группе 2  O1), т. е.:


Х    О2  O1   О4  О3


при этом предварительное и послеэкспериментальное тестирование в экспери­ментальной и контрольной группах должны проводиться практически одновре­менно.

Систематическая угроза валидности, связанная с фоновыми факторами, может все же возникнуть и при использовании рандомизации и контрольной группы. Это происходит тогда, когда фоновые факторы взаимодействуют с независи­мой переменной (или некоторыми ее уровнями). Природу такого взаимодей­ствия легко понять на примере исследования, в котором изучается влияние тре­вожности, возникающей в ситуации неопределенности, на успешность реше­ния сложных задач. В такого рода экспериментах для создания ситуации неопределенности и повышения реактивной тревожности (независимые пере­менные) часто используют неясные инструкции, косвенные негативные оцен­ки действий испытуемого, высказываемые лицами, проводящими эксперимент (типа «Ну-ну, посмотрим, как Вы сможете это использовать»), а также предварительные серии, где испытуемому приходится решать заведомо неразреши­мые задачи. Разумеется, всем этим воздействиям (X) подвергаются лишь члены экспериментальной группы. Если испытуемые — это студенты, которым в силу случайного стечения обстоятельств через неделю предстоит сдавать экзамены, или сотрудники подразделения фирмы, ожидающие скорой переаттестации, то эти факторы «фона» будут взаимодействовать с независимыми переменными, не только суммируясь с ними, но и усиливая их эффект. Негативные подкрепле­ния, получаемые в ходе эксперимента, будут восприниматься значительно ост­рее накануне экзаменационной сессии или переаттестации, а связанная с этими событиями фоновая тревожность и неопределенность будет взаимодействовать с тревожностью и неопределенностью, создаваемыми преднамеренно.

Оценить чистый эффект взаимодействия с помощью сравнения с результатами контрольной группы вышеописанным способом в данном случае невозможно, так как взаимодействие фоновых смещений с основным эффектом происходит лишь там, где имеет место экспериментальное воздействие X. В контрольной группе приближающееся неприятное событие также может повлиять на резуль­таты итогового замера или даже обоих замеров, но оно не будет взаимодейство­вать, «перемножаться» с воздействием независимой переменной (такое взаимо­действие можно описать в более точных терминах, однако это требует введения некоторых статистических понятий). Для оценки величины взаимодействия фоновых смешивающих переменных с основным эф­фектом нужны более сложные экспериментальные планы. Некоторые из них будут обсуждаться ниже.

Иногда имеет смысл воспользоваться упрощенным вариантом описанного пла­на с рандомизацией и контрольной группой, а именно планом с рандомизаци­ей без предварительного тестирования (RTC), который схематически выгля­дит следующим образом:

R Х О1

R О2


Привлекательность этого плана заключается прежде всего в его экономичнос­ти. Если при распределении испытуемых между группами и уровнями воздействия использовалась истинная вероятностная процедура14, то проведение пред­варительного тестирования — как в плане КТ1-2С — лишь увеличивает стоимость эксперимента, не оказывая существенного влияния на качество получаемых данных. По сути, правильно осуществленная рандомизация (R) — это наилуч­шая гарантия отсутствия изначального смещения между группами (т. е. равен­ства исходных среднегрупповых значений зависимой переменной О в конт­рольной и экспериментальной группах). Кроме того, в широкомасштабных социологических исследованиях, а также в прикладных исследованиях в области педагогики и социальной работы, проведение и предварительных, и повтор­ных измерений зависимой переменной (политических установок, криминаль­ного поведения и т. п.) часто неосуществимо либо ведет к возникновению реак­ции на саму процедуру тестирования. Если, к примеру, мы изучаем влияние участия в предвыборной групповой дискуссии на последующую поддержку политических партий, то предварительное измерение политических установок может повлиять на активность опрошенных в ходе самой дискуссии и их пос­ледующие установки.

Можно заключить, что план RTC предпочтителен всегда, когда нежелательно повторное предъявление весьма специфичных по содержанию и схожих по форме тестов, вопросов, измерительных процедур. Иными словами, этот план заслуживает широкого применения в социологических и оценочных исследо­ваниях. Кроме того, он является самым приемлемым средством проведения так называемых методических экспериментов, в которых оценивается эффектив­ность различных видов опроса, способов заполнения и форматов анкет и т. п. (примером такого методического эксперимента является описанное в главе «Массовые опросы» исследование Бредберна и Судмана, в котором эффектив­ность метода «случайного ответа» сравнивалась с эффективностью использо­вания данных административной статистики). План RTC использовался, в час­тности, в одном из практически ориентированных социальных экспериментов по совершенствованию системы правоохранительных и пенитенциарных уч­реждений, проводившихся в США в 196070-е гг.

В 1961 г. Федеральное бюро пенитенциарных учреждений США начало трехлетний эксперимент, целью которого было изучить воздействие под­держивающего консультирования и специальных реабилитационных про­грамм на поведение мальчиков-подростков, находящихся в исправительных учреждениях. Местом проведения эксперимента стала специальная школа-колония для несовершеннолетних правонарушителей.

При проведении рандомизации мальчиков случайным образом распреде­ляли между отрядами, где проводился эксперимент, и отрядами, служившими контрольными (каждый отряд жил в отдельно расположенном корпусе). В экспериментальных отрядах было увеличено количество воспитателей, проводились специальные индивидуальные и групповые консуль­тации, использовалась система вознаграждений за хорошее поведение. В контрольных группах применялись обычные методы воспитания и обу­чения, а также традиционные наказания за нарушение внутреннего распорядка.

Результаты эксперимента показали, что мальчики из экспериментальных групп раньше покидали спецшколу, лучше успевали в учебе, вели себя адаптивнее. Не было обнаружено значимых различий в показателях рецидивной преступности для подростков из экспериментальных и конт­рольных групп, освобожденных из школы-колонии, однако ребята из экс­периментальных групп значительно отличались от ребят из контрольных групп по показателю тяжести вновь совершенных преступлений (первые, в случае рецидива, совершали менее тяжкие преступления). По результатам эксперимента было принято решение о внедрении эксперименталь­ной коррекционной программы во всех подразделениях школы15.

Еще один популярный план с рандомизацией и контрольной группой — это план Соломона16. План Соломона — это расширенный вариант плана RT1-2C, позво­ляющий проконтролировать и оценить эффекты естественного развития и фона, а также определить взаимодействие эффекта тестирования с основ­ным воздействием X. Здесь наряду с экспериментальной и контрольной груп­пами с предварительным тестированием используются экспериментальная и контрольная группы без предварительного тестирования (как в плане RTC). Схематически это выглядит следующим образом:

R O1 X О2

R О3 О4

R X О5

R О6


Очевидно, что если главный эффект X реален, то даже при наличии существен­ного эффекта тестирования («хоуторнского эффекта») будут выполняться четы­ре неравенства: O2>O1; О24; О56; О53. Оценкой сравнительной вели­чины эффекта предварительного тестирования (без взаимодействия с X) может служить величина разности О6О3. Сравнение О6 с О1 и О3 позволяет оценить влияние фоновых факторов и факторов естественного развития17.

До сих пор мы обсуждали содержательные аспекты проверки эксперименталь­ной гипотезы о наличии главного эффекта X с помощью различных планов эк­сперимента, а также преимущества разных планов для обеспечения разных ас­пектов валидности. Очевидно, однако, что в каждом конкретном эксперименте величина главного эффекта, т. е. наблюдаемого различия результатов экспери­ментальной и контрольной группы, будет варьировать не только под воздей­ствием независимой переменной, но и просто в результате действия различных случайных возмущений. Конечно, если бы наш эксперимент был идеален и аб­солютно надежен (см. выше), то при каком угодно числе повторений мы бы всегда получали одну и ту же истинную оценку величины воздействия (при отсутствии или контроле смешивающего влияния дополнительных переменных). Однако реальные эксперименты — особенно, как уже говорилось, эксперимен­ты в социальных науках — не бывают и не могут быть идеальными и безупреч­но надежными. Следовательно, перед исследователем всегда стоит задача статистической оценки значимости полученных результатов.

Вероятностным «воплощением» содержательной экспериментальной гипоте­зы является статистическая гипотеза. Принятие или непринятие статисти­ческой гипотезы — необходимое, но недостаточное условие принятия или от­вержения содержательной гипотезы, проверяемой в эксперименте. Проверяе­мая в конкретном эксперименте статистическая гипотеза всегда формулируется как гипотеза о том, что при бесконечном количестве повторений этого экспери­мента среднее различие между экспериментальной и контрольной группами (или между воздействием разных уровней независимой переменной) равнялось бы нулю. Такую статистическую гипотезу, фактически сводящуюся к утверж­дению о случайном характере наблюдаемых в реальном эксперименте разли­чий, называют нулевой гипотезой, или нуль-гипотезой 0). Отвержение или неотвержение нуль-гипотезы позволяет говорить о том, что в данном экспери­менте содержательная гипотеза подтвердилась, либо подтвердилась противо­положная ей альтернативная гипотеза, либо не было получено подтверждения ни одной из них.

Вспомним воображаемый эксперимент Фишера с чаем и молоком, описанный в начале главы. Мы отмечали, что при использовании тактики случайного угады­вания испытуемая смогла бы правильно определить последовательность напол­нения чашки примерно в 1 случае из 70. Следовательно, 2 «попадания» из 100 даже при очень большом количестве испытаний едва ли могут считаться значи­мым результатом. Куда достовернее выглядят 90 или даже 95 «попаданий» из 100 (оставшиеся «ошибки» можно отнести на счет действия случайных факто­ров).

Вообще, критерии значимости и статистические методы, используемые при проверке статистической гипотезы для конкретного плана эксперимента, назы­вают статистическими моделями. Для планов с контрольной группой основ­ная статистическая модель — это использование t-критерия, о чем подробнее говорится чуть ниже. Для более сложных планов многомерных или факторных экспериментов, общий обзор которых дается в следующем разделе главы, веду­щие статистические модели — это дисперсионный анализ и использование F-критерия Фишера.

Итак, для того чтобы оценить статистическую значимость в элементарных ран­домизированных планах, описанных выше, нам необходимо проверить стати­стическую гипотезу о разности средних значений зависимой переменной в кон­трольной и экспериментальной группах. Конкретное значение разности сред­них значений зависимой переменной в экспериментальной и контрольной группе, обнаруженное в отдельном эксперименте (скажем, 4 балла по некото­рой «шкале пацифизма»), нужно соотнести с определенным интервалом, в ко­торый это значение «укладывается» с заданной (доверительной) вероятностью. Иными словами, нужно решить задачу интервального оценивания, подобную задаче оценки отдельного параметра совокупности в выборочном обследова­нии. Разница в том, что, проводя эксперимент, мы интересуемся не вероятными пределами, в которых лежит некая характеристи­ка выборки из реально существующей совокупности, а пределами, в которых лежит полученный нами в эксперименте результат относительно результата во­ображаемой бесконечной совокупности идентичных экспериментов. Нулевая гипотеза утверждает, что истинное значение различия средних равно нулю, ва­рьируя в каких-то пределах от эксперимента к эксперименту (т. е. . Если удается показать, что полученное в эксперименте зна­чение разности групповых средних не позволяет принять нулевую гипотезу, то делается вывод о подтверждении гипотезы, противоположной нулевой (т.е. — о статистической значимости различий между груп­пами — и, значит, о подтверждении экспериментальной гипотезы (или о под­тверждении гипотезы, противоположной экспериментальной, — если различие между экспериментальной и контрольной группой оказалось с обратным зна­ком). Заметьте, что нулевая гипотеза всегда формулируется как гипотеза о том, что истинное значение разности средних (или, скажем, величины взаимосвязи между двумя переменными) равно нулю, а полученные в эксперименте величи­ны отличаются от нуля исключительно из-за случайной ошибки выборки. Чем дальше от нуля — в ту или другую сторону — расположено наблюдаемое значе­ние, тем больше его статистическая значимость и меньше вероятность того, что оно явилось результатом ошибки выборки.

Для того чтобы сравнить полученное в эксперименте с контрольной и экспери­ментальной группами значение разности между средними с гипотетическим выборочным распределением этой величины для бесконечного числа испыта­ний (такие распределения имеются не только для разности средних, но и для средних величин, стандартных отклонений и т. д.), нужно выс­читать стандартную ошибку разности между средними18. Формула для стандарт­ной ошибки разности между средними — SМэ-Мk немного отличается от фор­мулы стандартной ошибки средней SM, приведенной в главе 8. Тем не менее она весьма проста:



где Sэ и SK величины стандартного отклонения, рассчитанные для экспери­ментальной и контрольной групп, nэ и пk число наблюдений (испытуемых) в экспериментальной и контрольной группах.

После этого нужно определить, на сколько единиц стандартной ошибки отсто­ит полученная разность средних от нуля, представляю- щего собой — в согласии с нуль-гипотезой — среднее гипотетического распре­деления разностей средних, t-распределения. Для этого полученную в экспери­менте разность групповых средних нужно перевести в t-единицы (т. е. единицы стандартного отклонения для t-распределения). Для данной разности средних величину t можно высчитать по формуле:

Полученное значение t нужно сравнить с соответствующим значением из таблицы t-распределения для избранного уровня значимости = 0,05 или 0,01) и числа сте­пеней свободы, соответствующего количеству наблюдений в каждой группе (или подвыборке).

На практике число степеней свободы можно рассматривать как величину, равную числу наблюдений (испытуемых, опрошенных, баллов и т. п.) минус число оцениваемых параметров. Для разности средних двух групп это со­ставит число наблюдений в экспериментальной группе минус один (nэ  1) плюс число наблюдений в контрольной группе минус один (пk  1):

Nст.своб. = (nэ  1) + (пk  1)

Таблицы t-распределения можно найти в любом учебнике или справочнике по статистике. Здесь мы приводим лишь фрагмент такой таблицы.


Таблица 4.1

Сокращенная таблица t-распределения

Стьюдента (W. Gosset, 1908)


Число степеней свободы

Р = 0,05

Р = 0,01

1

t = 12,706

t = 63,657

2

t = 4,303

t = 9,925

5

t = 2,571

t = 4,032

8

t = 2,306

t = 3,355

10

t = 2,228

t = 3,169

14

t = 2,145

t = 2,977

16

t = 2,120

t = 2,921

20

t = 2,086

t = 2,845

30

t = 2,042

t = 2,750

60

t = 2,000

t = 2,660

120

t = 1,980

t = 2,617



t = 1,960

t = 2,576


Рассмотрим пример вычисления t для описанного выше эксперимента, в кото­ром изучалось воздействие антивоенного фильма на изменение установок сту­дентов. Пусть для контрольной и экспериментальной групп при итоговом тес­тировании по шкале пацифистских установок были получены следующие ре­зультаты:


Контрольная группа

Экспериментальная группа

nk = 28 чел.

Nэ = 34 чел.

Sk = 5,6

Sэ= 3,4


Наша статистическая задача заключается в том, чтобы определить, отличаются ли средние двух групп настолько, чтобы можно было отвергнуть нулевую гипо­тезу о том, что эти средние взяты из одной генеральной совокупности. Вос­пользуемся приведенной выше формулой для вычисления значения t20:


Число степеней свободы в приведенном примере: (28  1) + (34  1) = 60.

Полученное значение t = 3,4760 заведомо превосходит табличные значения и для p < 0,05, и для р < 0,01 (на 5%-м уровне значение t для 60 степеней свободы составит 2,00, а на 1%-м — 2,660). Следовательно, мы можем отклонить нуле­вую гипотезу и сделать вывод, что существует статистически значимая разница между средними уровнями пацифизма в группе студентов, посмотревших ан­тивоенный фильм, и в контрольной группе.

Важно, однако, всегда помнить о том, что статистическая значимость результа­тов совершенно отлична от их содержательной значимости! Даже высокая ста­тистическая значимость результатов эксперимента не гарантирует, что эти результаты будут иметь сколько-нибудь интересную интерпретацию и повлияют на состояние современного социологического знания. Содержательная значимость зависит прежде всего от нашей способности увязать экспериментальную гипотезу с существующими социологическими теориями.


Многомерные и факторные эксперименты:

общий обзор


В описанных выше экспериментах с контрольной группой каждый раз используются лишь два типа условий — «есть воздействие» либо «нет воздействия». Эти два типа условий по сути можно рассматривать как два уровня независимой переменной, которым можно присвоить условные числовые значения — например, «1» и «0». Иными словами, с точки зрения уровня измерения незави­симая переменная является номинальной, качественной. В контрольной группе ее значение равно нулю, в экспериментальной — единице. Однако исследователь часто располагает значительно большей информацией о независимой переменной и способен измерить и проконтролировать ее по крайней мере на трех-четырех уровнях значений. Соответственно экспериментальная гипотеза может быть сформулирована в терминах более или менее интенсивного воздей­ствия либо наличия-отсутствия «отклика» зависимой переменной при конкрет­ных уровнях независимой переменной.

В психологии хорошо известен закон «оптимума мотивации», так называ­емый закон Йеркса-Додсона.

В начале нашего века Р. Йеркс изучал, как влияет негативное подкрепле­ние в форме удара электрическим током на выработку элементарных на­выков у животных. В частности, в опытах с «танцующими мышами» (раз­новидность домашней мыши, имеющая генетический дефект, который заставляет ее двигаться по кругу или по восьмерке) он использовал три уровня силы тока — «сильный» (500 усл. ед.), «средний» (300 усл. ед.) и «слабый» (125 усл. ед.). Мышь должна была научиться выбирать один из двух туннелей. В конце туннеля ее в любом случае ожидало «вознаграждение» — мышь противоположного пола. При ошибочном выборе (белый туннель) мышь испытывала удар током, при правильном выборе (черный туннель) негативное подкрепление отсутствовало. Местоположение туннелей (слева-справа) менялось случайным образом от пробы к пробе. Выяснилось, что быстрее всего обучение происходит при «средней» вели­чине стимуляции. Обнаруженный в этом эксперименте нелинейный ха­рактер связи между величиной стимула к решению определенной задачи и успешностью решения был затем неоднократно подтвержден и во многих других экспериментах, в том числе с испытуемыми-людьми и с пози­тивной стимуляцией. Чрезмерная мотивация и чрезмерная величина под­крепления, как и слабая мотивация, всякий раз оказывали меньшее воз­действие на успешность выполнения различных задач.

Эксперименты, в которых используется несколько (более двух) уровней незави­симой переменной, называются многоуровневыми. Схема вышеописанного эксперимента с рандомизацией и тремя уровнями независимой переменной 1 Х2, Х3 ) такова:


R

X1

O1

R

X2

O2

R

X3

O3


Экспериментальная гипотеза в этом случае формулируется как гипотеза об от­ношениях значений О1, О2 и О3 (в рассмотренном примере О1 < О2 и O2 > O3). Независимая переменная в многомерном эксперименте может иметь и более трех уровней. Иначе говоря, она может быть «нормальной» количественной переменной, измеренной на интервальном или абсолютном уровне. Соответ­ственно гипотеза многомерного эксперимента может формулироваться в более точных терминах — как гипотеза об «относительно-абсолютных» или даже «аб­солютно-абсолютных» отношениях переменных. Например, в эксперименте может изучаться влияние привлекательности лектора на частоту посещения занятий студентами, воздействие количества доступных источников информации о продукте на формирование потребительских предпочтений либо характер вза­имосвязи между размером денежного вознаграждения испытуемых и успешно­стью решения ими однотипных задач. Таким образом, многомерные экспери­менты позволяют проверять более тонкие и точные содержательные гипоте­зы о механизмах индивидуального и группового поведения.

Статистические гипотезы, проверяемые в многомерных экспериментах, — это гипотезы о различиях между значениями зависимой переменной для разных уровней независимой переменной. Нулевая гипотеза формулируется как гипотеза о том, что разброс индивидуальных значений внутри одного уровня независимой переменной (внутри соответствующей экспериментальной группы) идентичен разбросу индивидуальных значений между различными уровнями (группами), т. е. отношение дисперсии межгрупповых оценок к дисперсии внутригрупповых оценок равно 1. Последнее отношение обозначается как F-критерий. Для того чтобы определить, не превышает ли полученная в конкретном 8 эксперименте величина F пороговое значение статистического F-распределения для заданного уровня значимости, используют статистическую технику однофакторного дисперсионного анализа. Термин «однофакторный» в данном случае означает, что в эксперименте использовалась лишь одна независимая переменная (фактор воздействия). Рассмотрение техники дисперсионного ана­лиза и статистического оценивания получаемой в результате величины F вы­ходит за пределы данного обзора (детальные описания и рекомендации при необходимости можно найти в книгах из списка дополнительной литерату­ры к главе).

В тех областях социологии и социальной психологии, которые имеют сравни­тельно развитую традицию экспериментальных исследований (межличностное и межгрупповое восприятие, исследования динамики установок, социальные процессы в малых группах, оценивание эффективности образовательных программ и т. д.) часто используют более сложные схемы экспериментирования, объединяемые термином «факторные эксперименты».

Факторный экспериментальный план включает в себя две и более, независи­мые переменные (именуемые также «факторами»), каждая из которых име­ет несколько уровней воздействия. Так как при увеличении числа независимых переменных очень быстро возрастает число групп, в каждой из которых приме­няется одна из возможных комбинаций этих переменных и их уровней19 (в пол­ном факторном плане число групп равно произведению числа уровней, задава­емых для каждой независимой переменной), в целях экономии ресурсов и ра­ционального распределения исследовательских усилий были разработаны многочисленные планы, где каждый из «уровней» переменных реализуется один раз, а обобщение и статистический анализ взаимодействия различных факто­ров и их изолированного и совместного влияния на зависимую переменную проводится на групповом уровне20.

Всякий факторный эксперимент — это, в сущности, несколько экспериментов, объединенных в одном плане. Обобщенные данные факторного эксперимента позволяют ответить на два типа вопросов: 1) имеется ли эффект воздействия для каждой отдельно взятой независимой переменной; 2) зависит ли величина этого эффекта воздействия от величины значений других независимых пере­менных? Изолированный эффект воздействия одной независимой переменной называют главным эффектом, а изменение величины этого эффекта под влия­нием другой независимой переменной называют взаимодействием.

В таблице 4.2 представлен план простейшего факторного эксперимента «два на два» («2 X 2»), в котором изучалось влияние новизны и типа изображения на интерес, проявляемый к этому изображению 4-месячными младенцами. В ка­честве индикатора интереса использовалась длительность разглядывания. Каж­дая из независимых переменных была представлена только двумя уровнями: для новизны — новое или старое, предъявлявшееся в предыдущих сериях изоб­ражение; для типа изображения — геометрический контур либо схематическое изображение человеческого лица (схематические рисунки использовались для уравнивания изображений по визуальной сложности, так как время фиксации взора обычно зависит от сложности и количества деталей). Как видно из приве­денных в таблице 4.2 данных, налицо оба главных эффекта. Влияние новизны на интерес становится очевидным при сравнении средних по строкам — сред­няя длительность разглядывания изображений (и геометрических, и «физиономий») заметно выше в случае предъявления новых рисунков (55 сек против 20). Сравнение по столбцам показывает, что при усреднении данных по двум груп­пам (новые и старые рисунки) изображения человеческого лица вызывают зна­чительно больший интерес, проявляющийся в более длительном разглядыва­нии (45 сек). Налицо также взаимодействие между типом изображения и но­визной. Результаты предъявления разных типов изображений различны для «старой» и «новой» группы. Различаются и значения разностей по столбцам для каждой строки (60 50 = 10 сравнительно с 30 10 = 20), и соответствую­щие показатели по строкам (60 30 = 30 сравнительно с 50 10 = 40). Иными словами, большая привлекательность человеческих лиц сильнее проявляется при предъявлении старых рисунков (различие в 10 сек при предъявлении но­вых картинок увеличивается до 20 для старых изображений), а различие между предъявлением старых и новых рисунков при использовании геометрических контуров возрастало до 40 сек.

Таблица 4.2

Факторный эксперимент 2x2






Новизна изображения




Тип изображения


Средняя длительность разглядывания, сек.

Лицо

Геометрическое


Новое

Старое

60

30

50

10

55

20

Средняя длительность, cек.

45

30



При обработке результатов многофакторных экспериментов основной статис­тической моделью является многофакторный дисперсионный анализ.

Многофакторные эксперименты в социологии — это очень часто полевые экс­перименты, моделирующие сложные взаимосвязи реального мира. Преимуще­ство полевых многофакторных экспериментов — в их «жизнеподобии», т. е. внешней, лицевой валидности. Но здесь же кроется и главный недостаток таких экспериментов — более низкие надежность и внутренняя валидность. Кри­тики полевых многофакторных экспериментов часто отмечают, что приближе­ние эксперимента к реальному миру здесь нередко достигается за счет замены экспериментального контроля чисто статистическим. В последнем случае возрастают угрозы валидности, связанные с неправильной спецификацией модели измерения, с «закоррелированностью» отдельных уровней независимых пере­менных с неконтролируемыми внешними переменными. Кроме того, в многофакторных экспериментах острее, чем в индивидуальных и межгрупповых, стоит проблема агрегирования данных — практически всегда суще­ствует вероятность того, что отношения, выявленные при анализе сводных груп­повых данных, в точности не соблюдаются ни для одного отдельно взятого ис­пытуемого (так же, как среднее некоторой выборки может не относиться ни к одному конкретному выборочному наблюдению), К неоспоримым достоинствам факторных экспериментов следует отнести значительно большие возможности статистического анализа, в том числе анализа различных эффектов взаимодей­ствия переменных-«факторов».

В социальных науках часто употребляют также понятие квазиэксперимента, или квазиэкспериментального исследовательского плана. Речь идет о панель­ных, трендовых и т. п. планах выборочных обследований. Выборочные обследования, особенно продолжающиеся или проводимые как сравнительные «срезовые» исследования для подвыборок, испытавших либо не испытавших определенное, локализованное во времени воздействие (например, социальную революцию, реформу образования или крах фондового рынка), действительно позволяют делать выводы о взаимоотношениях между интересующими исследователя независимыми и зависимыми переменными, а значит — проверять гипотезы о предполагаемых причинно-следственных связях, однако экспериментальную рандомизацию и контроль в выборочных исследованиях, как показано в соответствующих главах, здесь заменяет использование случайных выборок и специальных методов статистического анализа данных.







































Краткий справочник терминов.


Эксперимент - общенаучный метод получения в контролируемых и управляемых условиях новых знаний о причинно-следственных отношениях между явлениями и процессами.

Социальный эксперимент - метод изучения социальных явлений и процессов, осуществляемый путем наблюдения за изменением социального объекта под воздействием факторов, которые контролируют и направляют его развитие. Социальный эксперимент предполагает:

- внесение изменений в сложившиеся отношения;

- контроль за влиянием изменений на деятельность и поведение личности и социальных групп;

- анализ и оценку результатов этого влияния.

Контрольная группа - группа индивидов, в которую не вводятся экспериментальные стимулы. При проведении эксперимента контрольная группа используется для сравнения.

Лабораторное наблюдение - тип наблюдения, при котором сбор информации проводится в искусственно созданных для изучаемой группы условиях, контролируемых исследователем.

Полевой эксперимент - в социологии - эксперимент, в котором воздействие экспериментального фактора происходит в реальной социальной ситуации. По степени активности исследователя различают:

- естественные эксперименты, в которых исследователь принимает позицию наблюдателя, не вмешивается в ход событий; и

- активно направленные эксперименты, в которых исследователь вводит в действие экспериментальный фактор.

Реактивность - в социологии - способность изучаемых субъектов реагировать на те или иные обстоятельства, сопутствующие исследовательскому процессу.

Управляемая ассоциация - экспериментальный метод, заключающийся в том, что испытуемому предлагается слово-стимул, на которое он должен реагировать словом, состоящим в определенной логико-семантической связи с предыдущим.

Хоторнский эксперимент - ряд исследований, выполненных в США в 1920-1930 гг. на хоторнских предприятиях (Чикаго) под руководством Э.Мэйо. В результате этих исследований была пересмотрена роль человеческого фактора в производстве и открыто явление неформальной организации, регулирующей различные стороны социальной жизни производственного коллектива.
Экспериментальная группа - группа индивидов, в которую вводятся определенные стимулы при проведении эксперимента.

Эффект большинства - изменение мнения испытуемого под влиянием мнения, высказанного большинством той же группы испытуемых.

Эффект бумеранга в эксперименте - отрицательная реакция испытуемого на воздействие, имеющее целью изменить его представление о каком-либо предмете или событии. Испытуемый отказывается принять навязываемое представление и энергично отстаивает собственную точку зрения. Если попытки воздействия становятся слишком настойчивыми, испытуемый вообще отказывается от коммуникации.


















Заключение.


Эксперимент это метод, обеспечивающий наилучшие эмпирические данные для проверки гипотез о наличии причинной связи между явлениями, а также самое надежное средство решения многих практических задач, связанных с оценкой эффективности социальных и политических программ.

Многомерный контролируемый эксперимент соответствует са­мым строгим стандартам научного вывода и незаменим при сравнении объяс­нительных возможностей разных теорий. В некоторых отношениях процедура экспериментальной проверки гипотез даже превосходит эталоны «традиционного образа науки», так как возникающая при планировании эксперимента необходимость в формализации теоретической модели, операционализации переменных, определяющих «главный эффект», а также в нахож­дении инструментов контроля посторонних, смешивающих влияний, ведет не только к прояснению основной гипотезы, но и к анализу всех тех внешних ус­ловий и факторов окружения, для которых соблюдаются постулируемые теори­ей соотношения (такой анализ призван гарантировать внешнюю валидность эксперимента). Недостатки экспериментального метода являются продолжением его достоинств (что, впрочем, верно и приме­нительно ко всем остальным методам). Возникнув в натуралистической тради­ции социологического исследования, экспериментальный метод был изначаль­но ориентирован на лабораторный или квазилабораторный исследовательский контекст, высокий уровень формализации проверяемых теорий и максималь­ные возможности измерения и контроля всех существенных переменных. Кро­ме того, сторонники экспериментального метода с самого начала отдавали предпочтение скорее абстрактным и общим понятиям научной теории в ущерб спе­цифическим и уникальным понятиям, используемым при описании социального взаимодействия его непосредственными участниками или «непрофессиональ­ными» наблюдателями. Иными словами, эксперимент оказался методом, при­годным скорее для проверки наиболее «сложившихся» и развитых социологических и социально-психологических теорий, чем для поисковых исследова­ний, направленных на выработку адекватного теоретического языка и форму­лировку пробных гипотез, описывающих закономерности естественного про­текания социальных процессов. Кроме того, следует помнить об этических про­блемах, иногда возникающих при экспериментальном манипулировании переменными социального окружения.

Эти проблемы могут касаться не столько гипотетического влияния нежелательных факторов, сколько возможного соци­ального неравенства, возникающего в крупномасштабных полевых эксперимен­тах при распределении участников по экспериментальным и контрольным груп­пам, так как в результате члены контрольных групп не получают «позитивно­го» экспериментального воздействия (на оценку эффективности которого и направлен эксперимент), например, социального пособия, нового прогрессив­ного метода обучения и т. п. Наконец, экспериментальный метод мало пригоден для получения результатов, которые можно было бы распространить на обще­ство в целом или на большие социальные группы, он не позволяет увидеть «срез» широкомасштабных социальных процессов.

Результаты хороших лабораторных экспериментов обладают высокой надежностью, однако они довольно далеки от «реального мира» (справедливости ради нужно отметить, что социальным наукам далеко не всегда следует стремиться к отражению многообразия «жи­вой жизни»).

Результаты полевых экспериментов в целом характеризуются боль­шей близостью к «реальному миру», однако это преимущество достигается це­ной несколько меньшей надежности и большей подверженности всяческим смещениям. Качество данных, получаемых в широкомасштабных социальных экспериментах, далеко не всегда оправдывает их чрезвычайно высокую сто­имость.



Литература

  1. Вознесенский В.А. Статистические метода планирования эксперимента в технико- экономических исследованиях. Изд. 2-е, перераб. и доп. М.: Финансы и статистика, 1981. Гл.2, 3.

  2. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии / Пер. с англ. Общ.ред. Ю.П.Адлера. М.: Прогресс, 1976. Гл.15-19.

  1. Девятко И.Ф. Методы социологического исследования. Екатеринбург: Изд-во Урал. ун-та, 1998. Сс.57-75.

  2. Дружинин Н.К. Выборочное наблюдение и эксперимент. М.: Статистика, 1977.

  1. Кэмпбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях / Пер. с англ. Сост. и общ.ред. М.И.Бобневой. М.: Прогресс, 1980.

  2. Готтсданкер Р. Основы психологического эксперимента/ Пер. с англ. М.: Изд-во МГУ, 1982.

  3. Ядов В.А. Социологическое исследование: методология, программа, методы. М.: Наука, 1987. Гл.5.



1 Эти общие правила индуктивного вывода были сформулированы еще Дж. С. Миллем в «Системе логики» (1843).

2 Справедливости ради следует отметить, что торжеству экспериментального метода в естественных науках немало способствовало совершенство некоторых технических приемов и устройств, позаимствованных из донаучной традиции алхимиков. После­дняя также уделяла большое внимание опытному знанию (как манифестации сверхчув­ственного знания) и активно использовала эксперименты-демонстрации или экспери­менты, ориентированные на практические цели, если можно считать практической це­лью получение гомункулуса или философского камня.

3 См.: Петухов В. В. Словарь экспериментатора //Готтсданкер Р. Основы психологического эксперимента. М.: Изд-во МГУ, 1982. С. 454.

4 Кэмпбелл Д.. Модели экспериментов в социальной психологии и прикладных исследованиях: Пер. с англ. / Сост. и общ. ред. М. И. Бобневой. М.: Прогресс, 1980. С. 207—208.

5 Цит. по: Bogatz G. A., Ball S. (eds.). The Second Year of Sesam Street: A Continuing Evaluation. Princeton(N. J.): Educational Testing Service, 1971. Vol. 1—2.11RieckenH. W., Boruch R. F. (eds.) Social Experimentation: A Method for Planning and Evaluating Social Intervention. N. Y., 1974. P. 306—307.

Об оценочных исследованиях см. в частности: Стародубцев С. П. Оценочные исследования: первое знакомство // Социологические исследования. 1992. № 7. С. 60—62.

6 Готтсданкер Р. Основы психологического эксперимента. М.: Изд-во МГУ, 1982.

7 Случайные изменения результата, т. е. фиксируемое в конкретном испытании значе­ние зависимой переменной, которое собственно и характеризует основной эффект, — воздействие независимой переменной на зависимую (или отсутствие такового).

8 Fisher R. A. The Design of Experiment. 3rd ed. L.: Oliver and Boyd, 1942. P. 17—19.

9 Петухов В.В. Указ. соч. С. 46.

10 См.: Roethlisberger F. G., Dickson W. J. Management and the Worker. Cambridge: Harvard University Press, 1939.

11 «Хоуторнский эффект», который, следуя выработанному в естественных науках об­разцу разрешения споров о приоритете, можно было бы именовать «хоуторнским эф­фектом плацебо, данного морской свинке при проведении экспертизы»...

12 Сама процедура случайного распределения может быть осуществлена аналогично процедуре построения простой вероятностной выборки с использованием таблицы слу­чайных чисел. Если единицы отбора — отдельные испытуемые, классы, городские районы — имеют тенденцию к естественной группировке, либо эксперимента­тор особенно заинтересован в сравнении малочисленных подгрупп, то можно исполь­зовать вероятностные процедуры с кластеризацией и стратификацией.


13 Кэмпбелл Д. Указ. соч. С. 51.

14 Самая распространенная ошибка, совершаемая исследователями при проведении рандомизации в эксперименте,— замена случайного распределения попарным уравниванием, когда, скажем, к двум пожилым домохозяйкам со средним образованием в экспе­риментальной группе подбирают двух пожилых домохозяек в контрольной группе и т. д. Попарное уравнивание может вести к таким же неконтролируемым смещениям, как и использование квотной выборки. Иногда в случаях, когда отбор производит­ся внутри команд, школьных классов и других естественных группировок, попарное уравнивание после разбиения группы пополам допустимо, если приписывание групп к контрольным или экспериментальным условиям будет проводиться случайно. Однако в двумерном эксперименте (типа «есть воздействие — нет воздействия») такой под­ход неприемлем, т.к. ведет к резкому снижению статистических свойств получае­мых оценок.


15 Federal Bureau of Prisons. Rational Innovation: An Account of Changes in the Program of the National Training School for Boys from 1961—1964. Washington (D. C.), 1964. Цит. по: H. W. Riecken, R. F. Boruch (eds.) Social Experimentation. N. Y.: Academic Press, 1974

16 Впервые описан в статье Р. Соломона. См.: Solomon R. L. An Extension of Control Group Design // Psychological Bulletin. 1949. Vol. 46. № 1. P. 137—150.

17 См.: Кэмпбелл Д. Указ. соч. С. 88—89.

18 Напомним, что стандартная ошибка среднего равна стандартному отклонению теоретического распределения выборочных средних. Эта величина используется как мера, ошибки выборки. Выборочные средние (т. е. средние значения множества вы­борок из гипотетической генеральной совокупности) распределены приблизительно нор­мально. А вот распределение разностей выборочных средних (t-распределение) выгля­дит как «уплощенное» нормальное распределение, причем чем меньше размер выбор­ки, тем более плоским и «размазанным» выглядит t-распределение. Это распределение было впервые описано У. Госсетом (опубликовавшим свои результаты под псевдони­мом Стьюдент). Госсет показал, что для малых выборок вероятностное оценивание выборочных средних дает надежные результаты лишь в том случае, если вместо самого распределения средних мы рассматриваем распределение их разностей.

20 Используемая нами формула основана на некоторых важных предположениях: о том, что группы отбирались независимо и случайно; что дисперсии соответствующих гене­ральных совокупностей неравны; что параметры совокупностей распределены нормаль­но. Существуют и иные, несколько отличные формулы для расчета t, которые применя­ются в тех случаях, когда сравниваемые подвыборки-группы невелики и получаемые для них данные каким-то образом «связаны», скоррелированы (например, если мы срав­ниваем групповые средние братьев и сестер или средние оценки одних и тех же школь­ников в первом классе и на выпускных экзаменах). Соответствующие формулы и пояс­нения можно найти в любом статистическом руководстве, а также в книгах, включен­ных в список дополнительной литературы по теме.

19 Такие комбинации называют еще «обработками». Источник последнего термина — сельскохозяйственные опыты, для которых Р. Фишер разработал первые факторные планы, сочетавшие различные способы ухода за растениями, условия освещенности, типы почвы и режимы полива.


20 Многочисленные примеры таких планов и описания соответствующих методов ана­лиза результатов см. в: Дружинин Н. К. Выборочное наблюдение и эксперимент. М.: Статистика, 1977; Готтсданкер Р. Основы психологического эксперимента. М.: Изд-во МГУ, 1982; Вознесенский В. А. Статистические методы планирования эксперимента в технико-экономических исследованиях. 2-е изд., испр. и доп. М.: Финансы и статис­тика, 1981.Гл. 2,3.

14



© Рефератбанк, 2002 - 2017