сделать домашней  добавить в избранное  карта сайта RSS
 

Вебинары HRM.RU

Прогноз эффективности кандидатов на основе тестов
Начало 26.05.2017 12.00 (по московскому времени)

Полный список вебинаров

События

полный список

Последние обсуждения

  26.04.2018 18:17:06
Компания 3M объявила о финансовых результатах I квартала 2018 года
  16.04.2018 15:01:39
Охрана труда: за автоматизацией будущее
  13.04.2018 11:27:28
20 лет Coleman Services в России!
  06.04.2018 10:04:12
Резюме специалист с&b (Москва)
  29.03.2018 16:47:10
Новый сервис для размещения вакансий и стажировок


Опросы
  Актуальные направления работы HR вашей организации 2017
Все опросы


Методы математической обработки в психологии. глава 3. оценка достоверности сдвига в значениях исследуемого признака

      Тематические разделы:
      Психология, теории HR
      Психология, теории HR : Социальная психология
      Общий менеджмент : Аналитика
      Книги

      Дата публикации: 01.07.2017






      ГЛАВА 3. ОЦЕНКА ДОСТОВЕРНОСТИ СДВИГА В ЗНАЧЕНИЯХ ИССЛЕДУЕМОГО ПРИЗНАКА

      3.1. Обоснование задачи исследований изменений

      В психологических исследованиях часто бывает важно доказать, что в результате

      действия каких-либо факторов произошли достоверные изменения ("сдвиги") в

      измеряемых показателях. К числу таких факторов должен быть отнесен прежде всего

      фактор времени. Сопоставление показателей, полученных у одних и тех же испытуемых

      по одним и тем же методикам, но в разное время, дает нам временной сдвиг.

      Многократные обследования одних и тех же лиц на протяжении достаточно

      длительного отрезка их жизненного пути, измеряемого иногда десятками лет,

      представляет собой так называемое лонгитюдинальное исследование, суть которого

      хорошо известна любому представителю Ленинградской-Петербургской школы

      психологии. Этот метод позволяет определить генетические связи между фазами

      психического развития и дать научно обоснованный прогноз дальнейшего психического

      развития (Ананьев Б.Г., 1976, с. 26-27).

      Сопоставление показателей, полученных по одним и тем же методикам, но в разных

      условиях измерения (например, "покоя" и "стресса"), дает нам ситуационный сдвиг.

      Условия измерения могут изменяться не только реально, но и умозрительно. Например,

      мы можем попросить испытуемого "представить себе", что он оказался в других условиях

      измерения: в будущем, в позиции других людей, которые оценивают его как бы со

      стороны, в состоянии разгневанного отца и т. п. Сопоставляя показатели, измеренные в

      обычных и воображаемых условиях, мы получаем умозрительный сдвиг.

      Мы можем создать специальные экспериментальные условия, предположительно

      влияющие на те или иные показатели, и сопоставить замеры, произведенные до и после

      экспериментального воздействия. Если сдвиги окажутся статистически достоверными, это

      позволит нам утверждать, что экспериментальные воздействия были существенными, или

      эффективными.

      Например, мы можем сделать вывод о том, что данная программа тренинга

      действительно способствует развитию уверенности, или что данный способ внушающего

      воздействия влияет на изменение отношения испытуемых к той или иной проблеме, или

      что психодраматическая замена ролей подтверждает постулат Дж.Л. Морено о сближении

      позиций спорщиков после того, как им пришлось играть роль своего оппонента и т.п.

      Во всех этих случаях мы говорим о сдвиге под влиянием контролируемых или не

      контролируемых воздействий. И здесь мы наталкиваемся на методическую трудность,

      которую оказывается возможным преодолеть только путем введения контрольной группы,

      которая не испытывала бы на себе воздействия данного экспериментального фактора.

      Если нет контрольной группы, то сдвиг в экспериментальной группе может объясняться

      действием самых разных причин: временем суток, в которое производились замеры,

      важным для испытуемых событием, которое произошло между 1-м и 2-м замерами и по

      мощности воздействия значительно перекрыло экспериментальный фактор и т. п. Мы

      никогда не сможем исключить той возможности, что изменения, достигнутые, как нам

      кажется, в результате наших воздействий, на самом деле объясняются неучтенными

      причинами. Вот если в экспериментальной группе сдвиги окажутся достоверными, а в

      контрольной группе - недостоверными, то это, действительно, может свидетельствовать

      об эффективности воздействий. При отсутствии контрольной группы мы констатируем,

      что сдвиг произошел, но не имеем права приписать его именно данным, изучаемым нами,

      факторам воздействия.

      Допустим, мы установили, что после того, как двум конфликтующим подгруппам

      пришлось играть роль своих оппонентов в споре, усилилось ощущение понимания этих

      оппонентов "изнутри" (см. Задачу 1). Но мы не можем исключить возможности, что если

      бы мы не проводили психодраматической замены ролей, взаимопонимание все-таки бы

      улучшилось просто в силу того, что обе подгруппы какое-то время учились и работали

      вместе.

      Бывают случаи, когда мы не располагаем контрольной группой, но зато в нашем

      распоряжении есть 2 или более экспериментальных групп, различающихся по условиям и

      способам воздействия на них. Это могут быть, помимо экспериментальных, и

      разнообразные естественные условия жизни, обучения, работы, общения и даже питания,

      водоснабжения, географического расположения и т. д. Сопоставление групп,

      различающихся по этим признакам, позволит нам уточнить' специфическое действие

      экспериментальных или естественно действующих факторов, хотя при этом нам следует

      помнить, что воздействие неучтенных факторов может оказаться еще более мощным.

      В выводах мы все-таки будет ограничены, если не проверили свои результаты на

      контрольной труппе, в которой измерения производились параллельно.

      Помимо рассмотренных сдвигов: временных, ситуационных, умозрительных и

      сдвигов под влиянием, - можно рассмотреть еще особую категорию структурных

      сдвигов.

      Мы можем сопоставлять между собой разные показатели одних и тех же

      испытуемых, если они измерены в одних и тех же единицах, по одной и той же шкале.

      Например, мы можем исследовать перепад между вербальным и невербальным

      интеллектом, измеренными по методике Д. Векслера, или сопоставлять экспертные

      оценки эмпатичности и наблюдательности, измеренные по одинаковой 10-балльной

      шкале, или время решения двух задач, измеренное в секундах, или экзаменационную

      успешность по разным дисциплинам и т.п.

      В принципе, мы могли бы для такого рода "перепадов" использовать критерии

      оценки достоверности в средних тенденциях для независимых выборок: U - критерий, Q -

      критерий и угловое преобразование Фишера. Однако, строго говоря, перед нами -

      зависимые ряды значений, поскольку они измерены на одних и тех же испытуемых,

      поэтому будет более обоснованным использовать критерии оценки достоверности сдвигов

      для связанных выборок. Исключение представляют случаи, когда мы сопоставляем

      величины сдвигов в двух независимых группах испытуемых, например

      экспериментальной и контрольной (см. Табл. 3.1). Допустим, если мы установили, что

      положительный сдвиг в сторону улучшения взаимопонимания наблюдается и в

      экспериментальной, и в контрольной группах, мы можем попробовать доказать, что в

      экспериментальной группе этот сдвиг достоверно больше, чем в контрольной, и что,

      следовательно, экспериментальное воздействие все-таки существенно.

      Последний важный вопрос касается того, должны ли мы всегда производить оба

      замера на одной и той же выборке, или "сдвиг" можно изучать на сходных, так

      называемых "уравновешенных" выборках, совпадающих друг с другом по полу, возрасту,

      профессии и другим значимым для исследователя характеристикам.

      В сущности, допускается сопоставление показателей разных выборок,

      уравновешенных по всем значимым для исследования признакам. Иными словами, можно

      уровень тревоги или объем внимания до экзамена измерять у одной подгруппы, а после

      экзамена - у другой подгруппы, если они "уравновешены". Опыт показывает, однако, что

      создать "уравновешенные" подгруппы практически невозможно. Мы всегда упираемся в

      факт существования различий между выделенными подгруппами, которые могут в

      значительной степени повлиять на результат. В итоге окажется, что мы исследовали не

      влияние экзаменационного стресса на уровень тревоги или объем внимания, а различия по

      этому показателю между двумя выделенными подгруппами. К сожалению, в значительной

      степени это относится и к проблеме сопоставления экспериментальной и контрольной

      групп: мы почти никогда не можем быть уверены, что выявленные различия объясняются

      действием исследуемых факторов, а не различиями между двумя выборками.

      Многие исследователи обходят эту проблему самым простым образом: они вообще

      не заботятся о контрольной группе. Сдвиг есть -значит, воздействие эффективно! И

      действительно, при отсутствии контрольной выборки тоже можно порассуждать на тему о

      том, какими же причинами, кроме предполагаемой, могут объясняться полученные

      сдвиги...

      Другой вариант "уравновешивания" - введение параллельных форм теста. В тех

      случаях, когда на результатах повторных замеров могут сказаться эффекты научения,

      приходится "до" измерять реакции испытуемого с помощью одного инструмента, а

      "после" - с помощью другого. В результате на измерениях может отразиться и действие

      фактора времени, и различия в параллельных формах теста, и непонятно что еще. Создать

      параллельную форму методики не менее трудно, чем подобрать "уравновешенную"

      группу испытуемых. И все же, в тех случаях, когда у нас нет другого выхода, приходится

      прибегать к этому способу.

      Суммируем сказанное. В Табл. 3.1 приведена классификация сдвигов и указаны

      статистические методы, позволяющие оценить их достоверность.

      Таблица ЗА

      Классификация сдвигов и критериев оценки их статистической достоверности

      Виды сдвигов

      Объект сопоставлений

      Условия Критерии оценки

      достоверности

      сдвига

      Количество

      замеров

      Количество

      групп

      1. Временные,

      ситуационные,

      умозрительные,

      измерительные

      Одни и те же пок-

      затели, измеренные у

      одних и тех же

      испытуемых в разное

      время, в разных

      ситуациях

      в разных

      представляемых

      условиях или

      разными способами

      2

      1

      G - критерий знаков;

      Т - критерий

      Вилкоксона

      Зи

      более

      1

      L - критерий

      тенденций Пей-

      джа;

      ·2

      r - критерий

      Фридмана

      2. Сдвига под

      влиянием

      эксперименталь-

      ных воздействий

      Одни и те же

      показатели,

      измеренные у

      одних и тех же

      испытуемых до и после

      воздействия:

      а) при отсутствии

      контрольной группы

      2

      1

      G - критерий знаков;

      Т - критерий

      Вилкоксона

      3 и

      более

      1

      L - критерий

      тенденций Пей-

      джа;

      ·2

      r- критерий

      Фридмана

      6) при наличии

      контрольной группы

      2

      2

      Вариант 1 -

      сопоставление

      значений "до" и

      "после" отдельно по

      экспериментальной

      и контрольной

      группам:

      G - критерий знаков;

      Т - критерий

      Вилкоксона

      Вариант 2 -

      сопоставление

      сдвигов в двух

      группах:

      Q - критерий;

      U - критерий Манна-

      Уитни;

      ·* - критерий Фишера

      З и

      более

      2

      Сопоставление

      значений отдельно по

      экспериментальной

      и контрольной

      группам:

      L, - критерий

      тенденций Пейджа;

      ·2, - критерий

      Фридмана

      3. Структурные

      сдвиги

      Разные показатели

      одних и тех же

      испытуемых

      2

      1

      G - критерий знаков;

      Т - критерий

      Вилкоксона

      З и

      более

      1

      L - критерий

      тенденций Пейджа;

      ·2

      r - критерий

      Фридмана

      Как следует из Табл. 3.1, при сопоставлении двух, замеров, произведенных на одной

      и той же (экспериментальной) выборке, применяются критерии знаков G и критерий Т

      Вилкоксона. При сопоставлении трех и более замеров, произведенных на одной и той же

      выборке, применяются критерий тенденций L Пейджа, а если он неприменим из-за

      большого объема выборок - критерий ·2

      r Фридмана.

      В тех случаях, когда мы хотим оценить различия в интенсивности сдвига в двух

      группах испытуемых (контрольной и экспериментальной или двух экспериментальных),

      мы можем использовать различные варианты сопоставлений: 1) производить

      сопоставления отдельно в двух группах, используя критерии L и ·2

      r; 2) сопоставлять

      показатели сдвига8 в двух группах. Поскольку группы независимы, значения сдвигов

      также независимы, и мы можем применять по отношению к ним уже известные нам

      критерии Q Розенбаума, U Манна-Уитни и ·* -угловое преобразование Фишера.

      3.2. G- критерий знаков

      Назначение критерия G

      Критерий знаков9 G предназначен для установления общего направления сдвига

      исследуемого признака.

      Он позволяет установить, в какую сторону в выборке в целом изменяются значения

      признака при переходе от первого измерения ко второму: изменяются ли показатели в

      сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения,

      понижения или ослабления.

      Описание критерия G

      Критерий знаков применим и к тем сдвигам, которые можно определить лишь

      качественно (например, изменение отрицательного отношения к чему-либо на

      положительное), так и к тем сдвигам, которые могут быть измерены количественно

      (например, сокращение времени работы над заданием после экспериментального

      воздействия).

      8 Сдвиг - это разность между вторым и первым замерами. Сначала вычисляются разности отдельно для каждой из групп,

      а уж затем проводятся сопоставления двух рядов разностей (сдвигов), полученных в разных группах. Примером такого

      сопоставления сдвигов в ощущении психологической дистанции является Задача 1.

      9 Критерий знаков с математической точки зрения является частным случаем биномиального критерий для двух

      равновероятных альтернатив. При вероятности каждой из альтернатив P=Q=0,50 критерий знаков является зеркальным

      отражением биномиального критерия (см. параграф 5.3). В некоторых руководствах критерий знаков называют

      критерием Мак-Немара (McCall R., 1970; Рунион Р., 1982).

      Во втором случае, однако, если сдвиги варьируют в достаточно широком диапазоне,

      лучше применять критерий Т Вилкоксона. Он учитывает не только направление, но и

      интенсивность сдвигов и может оказаться более мощным в определении достоверности

      сдвигов, чем критерий знаков.

      Как правило, исследователь уже в процессе эксперимента может заметить, что у

      большинства испытуемых показатели во втором замере имеют тенденцию, скажем,

      повышаться. Однако ему еще требуется доказать, что положительный сдвиг является

      преобладающим.

      Для начала мы назовем сдвиги, которые нам кажутся преобладающими, типичными

      сдвигами, а сдвиги более редкого, противоположного направления, нетипичными. Если

      значения показателя повышаются у большего количества испытуемых, то этот сдвиг мы

      будем считать типичным. Если мы исследуем отношение испытуемых к какому-либо

      событию или предложению, и после экспериментальных воздействий у большинства

      испытуемых отрицательное отношение сменилось на положительное, то этот сдвиг мы

      назовем типичным.

      Есть еще, правда, возможность "нулевых" сдвигов, когда реакция не изменяется или

      показатели не повышаются и не понижаются, а остаются на прежнем уровне. Однако

      такие "нулевые" сдвиги в критерии знаков исключаются из рассмотрения. При этом

      количество сопоставляемых пар уменьшается на число таких "нулевых" сдвигов.

      Суть критерия знаков состоит в том, что он определяет, не слишком ли много

      наблюдается "нетипичных сдвигов", чтобы сдвиг в "типичном" направлении считать

      преобладающим? Ясно, что чем меньше "нетипичных сдвигов", тем более вероятно, что

      преобладание "типичного" сдвига является преобладающим. Gэмп - это количество

      "нетипичных" сдвигов. Чем меньше Gэмп, тем более вероятно, что сдвиг в "типичном"

      направлении статистически достоверен.

      Гипотезы

      Н0: Преобладание типичного направления сдвига является случайным.

      H1: Преобладание типичного направления сдвига не является случайным.

      Графическое представление критерия знаков

      На Рис. 3.1 "типичные" сдвиги изображены в виде светлого облака, а нетипичные

      сдвиги - темного облака. Мы видим, что на рисунке темное облако значительное меньше.

      Допустим, после выступления оратора большинство слушателей изменили свое

      отрицательное отношение к какому-то предложению на положительное. Вместе с тем,

      часть слушателей изменила свое положительное отношение на отрицательное, проявив

      "нетипичную" реакцию. Критерий знаков позволяет определить, не слишком ли

      значительная часть слушателей нетипично прореагировала на выступление оратора?

      Поглощает ли масса светлого облака небольшое темное облако?

      В Таблице V Приложения 1 даны критические значения критерия знаков для разных

      п. Поскольку критерий знаков представляет собой одно из трех исключений из общего

      правила, представим обобщенную "ось значимости" для этого критерия графически (Рис.

      3.2)

      Зона значимости простирается влево, в сторону более низких значений, поскольку

      чем меньше "нетипичных" знаков, тем достовернее "типичный" сдвиг. Зона незначимости,

      напротив, простирается вправо, в сторону более высоких значений G. Постепенно

      "нетипичных" сдвигов становится так много, что теряется само ощущение какого-то

      преобладания в направленности сдвигов. Зона незначимости характеризует ситуацию,

      когда сдвиги обоих направлений перемешаны.

      Ограничения критерия знаков

      Количество наблюдений в обоих замерах - не менее 5 и не более 300.

      Пример

      В исследовании Г.А. Бадасовой (1994) изучались личностные факторы суггестора,

      способствующие его внушающему воздействию на аудиторию. В эксперименте

      участвовало 39 слушателей колледжа и спецфакультета практической психологии Санкт-

      Петербургского университета 9 мужчин и 30 женщин в возрасте от 18 до 39 лет, средний

      возраст 23,5 года. Испытуемые выступали в качестве суггерендов, т.е. лиц, по отношению

      к которым оказывалось внушающее воздействие.

      В экспериментальной группе (n1=16) испытуемые просматривали видеозапись речи

      суггестора о целесообразности применения физических наказаний в воспитании детей, а в

      контрольной группе (n2=23) испытуемые просто читали про себя письменный текст.

      Содержание речи суггестора и текста полностью совпадали.

      До и после предъявления видеозаписи (в экспериментальной группе) и текста (в

      контрольной группе) испытуемые отвечали на 4 вопроса, оценивая степень согласия с их

      содержанием по 7-балльной шкале:

      1. Я считаю возможным иногда шлепнуть своего ребенка за дело, если

      он этого заслужил:

      Несогласен 1 2 3 4 5 6 7 Согласен

      2. Если, придя домой, я узнаю, что кто-то из близких, бабушка или дедушка,

      шлепнул моего ребенка за дело, то я буду считать, что это нормально:

      Несогласен 1 2 3 4 5 6 7 Согласен

      3. Если мне станет известно, что воспитательница детского сада или учительница в

      школе шлепнула моего ребенка за дело, то я восприму это как должное:

      Несогласен 1 2 3 4 5 6 7 Согласен

      4. Я бы согласился отдать своего ребенка в школу, где применяется

      система физических наказаний по итогам недели:

      Несогласен 1 2 3 4 5 6 7 Согласен

      Суггестор был подобран по признакам, которые были выявлены в пилотажном

      исследовании (Бадасова Г. А., 1994). Результаты двух замеров по обеим группам

      представлены в Табл. 3.2 и Табл. 3 3

      Таблица 3.2

      Оценки степени согласия с утверждениями о допустимости телесных наказаний до и

      после предъявления видеозаписи в экспериментальной группе (n1=16)

      Оценки и сдвиги оценок ("после" - "до") по шкалам

      № "Я сам" "Бабушке" "Воспитатель" Школа

      п/п до после сдви до посл сдвиг до после сдвиг до после сдвиг

      г е

      1 4 4 0 2 4 +2 1 1 0 1 1 0

      2 1 1 0 1 1 0 1 1 0 1 1 0

      3 5 5 0 4 4 0 4 4 0 1 1 0

      4 4 5 +1 3 3 0 2 3 +1 1 2 +1

      5 3 3 0 3 4 +1 2 3 +1 1 1 0

      6 4 5 +1 5 5 0 1 1 0 1 1 0

      7 3 3 0 3 3 0 1 1 0 1 1 0

      8 5 6 +1 5 6 +1 3 3 0 2 1 -1

      9 6 7 +1 5 7 +2 3 3 0 1 2 +1

      10 2 3 +1 2 3 +1 2 1 -1 1 1 0

      11 6 6 0 3 3 0 2 1 -1 1 1 0

      12 5 5 0 3 5 +2 4 4 0 1 1 0

      13 7 7 0 5 5 0 4 4 0 1 1 0

      14 5 6 +1 5 6 +1 2 2 0 1 2 +1

      15 5 6 +1 5 6 +1 4 3 -1 2 2 0

      16 6 7 +1 6 7 +1 4 4 0 2 2 0

      Таблица 3.3

      Оценки степени согласия с утверждениями о допустимости телесных наказаний до и

      после предъявления письменного текста в контрольной группе (n2=23)

      Оценки и сдвиги оценок (после - "до") по шкалам

      № "Я сам" "Бабушка "Воспитатель" Школа

      п/п до после сдвиг ДО после сдвиг до после сдвиг до после сдвиг

      1 4 4 0 5 5 0 1 1 0 1 1 0

      2 7 7 0 7 7 0 7 7 0 4 4 0

      3 2 2 0 1 1 0 3 1 -2 1 1 0

      4 4 3 -1 3 2 -1 1 1 0 1 1 0

      5 3 5 +2 5 5 0 3 3 0 1 1 0

      6 2 1 -1 2 1 -1 1 1 0 1 1 0

      7 5 5 0 3 3 0 1 1 0 1 1 0

      8 2 2 0 2 3 +1 1 3 +2 1 3 +2

      9 3 4 +1 3 4 +1 1 1 0 1 6 +5

      10 5 5 0 5 5 0 1 1 0 1 1 0

      11 5 5 0 1 1 0 1 1 0 1 1 0

      12 2 2 0 1 1 0 1 1 0 1 1 0

      13 1 1 0 1 1 0 1 2 +1 6 7 +1

      14 4 3 -1 7 5 -2 2 4 +2 1 1 0

      15 3 4 +1 2 3 +1 1 2 +1 1 1 0

      16 4 4 0 3 3 0 1 1 0 1 1 0

      17 3 3 0 2 2 0 1 1 0 1 1 0

      18 6 6 0 6 6 0 6 6 0 1 3 +2

      19 2 2 0 2 1 -1 1 1 0 1 1 0

      20 1 2 +1 1 1 0 1 1 0 1 1 0

      21 2 2 0 2 2 0 2 1 -1 1 1 0

      22 6 6 0 6 6 0 3 3 0 1 1 0

      23 3 2 -1 1 2 +1 1 1 0 1 1 0

      Вопросы:

      1. Можно ли утверждать, что после просмотра видеозаписи о пользе телесных

      наказаний наблюдается достоверный сдвиг в сторону большего принятия их в

      экспериментальной группе?

      2. Достоверны ли различия по выраженности положительного сдвига между

      экспериментальной и контрольной группами?

      3. Является ли достоверным сдвиг оценок в контрольной группе?

      Решение

      Подсчитаем сначала количество положительных, отрицательных и нулевых сдвигов

      по каждой шкале в каждой из выборок. Это необходимо для выявления "типичных" знаков

      изменения оценок и значительно облегчит нам дальнейшие расчеты и рассуждения.

      Таблица 3.4

      Расчет количества положительных, отрицательных и нулевых сдвигов в двух

      группах суггерендов

      Кол-во сдвигов Шкалы

      в группах "Я сам" "Бабушка" "Воспитатель" "Школа" Суммы

      1. Экспериментальная группа

      а) положительных

      б) отрицательных

      в) нулевых

      8

      0

      8

      9

      0

      7

      2

      3

      11

      3

      1

      12

      22

      4

      38

      Суммы 16 16 16 16 64

      2. Контрольная группа

      а) положительных

      6) отрицательных

      в) нулевых

      4

      4

      15

      4

      4

      15

      4

      2

      17

      4

      0

      19

      16

      10

      66

      Суммы 23 23 23 23 92

      Из Табл. 3.4. мы видим, что наиболее типичными являются "нулевые" сдвиги, то

      есть отсутствие сдвига в оценках после предъявления видеозаписи или письменного

      текста. И все же, в экспериментальной группе по шкале "Я сам наказываю" и "Бабушка

      наказывает" положительные сдвиги наблюдаются примерно в половине случаев.

      Нам необходимо учитывать только положительные и отрицательные сдвиги, а

      нулевые отбрасывать. Количество сопоставляемых пар значений при этом уменьшается на

      количество этих нулевых сдвигов. Теперь для шкалы "Я сам" n=8; для шкалы "Бабушка"

      n=9; шкалы "Воспитатель" n=5 и шкалы "Школа" n=4. Мы видим, что по отношению к

      последней шкале критерий знаков вообще неприменим, так как количество

      сопоставляемых пар значений меньше 5.

      Мы можем сразу же проверить и гипотезу о преобладании положительного сдвига в

      ответах по сумме 4 шкал. Сумма положительных и отрицательных сдвигов по 4 шкалам

      составляет: n=8+9+5+4=26.

      Сформулируем гипотезы.

      Н0: Сдвиг в сторону более снисходительного отношения к телесным наказаниям

      после внушения является случайным.

      H1: Сдвиг в сторону более снисходительного отношения к телесным наказаниям

      после внушения является неслучайным.

      По Табл. V Приложения 1 определяем критические значения критерия знаков G. Это

      максимальные количества "нетипичных", менее часто встречающихся, знаков, при

      которых сдвиг в "типичную" сторону еще можно считать существенным.

      1) Шкала "Я сам наказываю"

      n=8

      Типичный сдвиг - положительный.

      Отрицательных сдвигов нет.

      Н0 отклоняется. Принимается H1 (p<0,01).

      2) Шкала "Бабушка наказывает"

      n=9

      Типичный сдвиг - положительный.

      Отрицательных сдвигов нет.

      Н0 отклоняется. Принимается H1 (p<0,01).

      3) Шкала "Воспитательница наказывает"

      n=5

      Типичный сдвиг - отрицательный.

      Ответ: Сдвиг в сторону более снисходительного отношения к телесным наказаниям

      в экспериментальной группе после просмотра видеозаписи является неслучайным для

      шкал "Я сам наказываю", "Бабушка наказывает" и по сумме четырех шкал (р<0,01 во всех

      случаях).

      Сформулируем гипотезы для контрольной группы.

      Н0: Сдвиг в сторону более снисходительного отношения к телесным наказаниям

      после прочтения текста является случайным.

      H1: Сдвиг в сторону более снисходительного отношения к телесным наказаниям

      после прочтения текста не является случайным.

      Далее действуем по тому же принципу: вначале определяем количество сдвигов в ту

      или иную сторону (n), выявляем типичный сдвиг и количество нетипичных сдвигов (Gэмп)

      сопоставляем с критическими значениям G, определяемыми по Табл. V Приложения 1.

      1) Шкала "Я сам наказываю"

      n=8

      Положительных сдвигов - 4, отрицательных сдвигов - 4.

      Типичный сдвиг установить невозможно, т.к. положительных и отрицательных

      сдвигов поровну.

      Н0 принимается.

      2) Шкала "Бабушка наказывает"

      n=8

      Положительных сдвигов - 4, отрицательных сдвигов - 4.

      Н0 принимается по тем же основаниям, что ··········и для предыдущей шкалы.

      3) Шкала "Воспитательница наказывает"

      n=6

      Типичный сдвиг - положительный.

      Отрицательных сдвигов - 2.

      Gкp=0 (p·0,05)

      Gкр(p·0,01) при данном п определить невозможно.

      Gэмп=2

      Gэмn>Gкp

      Н0 принимается.

      4) Шкала "Школа наказывает"

      Поскольку n<5, критерий знаков неприменим.

      5) Сумма по 4-м шкалам n=26

      Типичный сдвиг - положительный. Количество отрицательных сдвигов - 10.

      Ответ: Сдвиг в сторону более снисходительного отношения к телесным наказаниям

      в контрольной группе является случайным - и по каждой из шкал в отдельности, и по

      сумме шкал.

      Мы можем определенно ответить на 1-ый вопрос задачи: да, можно утверждать, что

      после просмотра видеозаписи о пользе телесных наказаний наблюдается достоверный

      сдвиг в пользу большего принятия их в экспериментальной группе. Мы можем ответить и

      на 3-й вопрос задачи: нет, сдвиг оценок в контрольной группе недостоверен. Однако мы

      пока не ответили на 2-й вопрос - о том, достоверны ли различия по выраженности

      положительного сдвига между экспериментальной и контрольной группами?

      Дело в том, что нами был избран вариант сопоставлений, предполагающий

      сравнение значений "после" и "до" экспериментального воздействия отдельно в

      экспериментальной и контрольной выборках. Для того, чтобы ответить на вопрос 2,

      необходимо выбрать второй вариант сопоставлений, предусматривающий сравнение

      сдвигов в двух группах с помощью критериев для сравнения независимых выборок -Q -

      критерия Розенбаума, U - критерия Манна-Уитни и критерия ·* Фишера (см. Табл. 3.1).

      Однако такого рода сопоставления, как правило, проводятся только в том случае, если и в

      экспериментальной, и в контрольной группах выявлен достоверный однонаправленный

      эффект, и нужно доказать, что в экспериментальной выборке он достоверно больше,

      выраженнее (см. Задачу 1). В данном же случае нами доказано, что в контрольной

      выборке не произошло сколько-нибудь значимых изменений, и мы можем этим

      удовлетвориться.

      Казалось бы, мы доказали все, что необходимо: в экспериментальной группе

      испытуемые стали снисходительнее относиться к телесным наказаниям, а в контрольной

      группе достоверных сдвигов не обнаружено. Похоже, суггестор, отобранный по

      выявленным Г. А. Бадасо-вой качествам, действительно повлиял на изменение оценок, и

      притом именно он, что-то в его личности оказало это воздействие, потому что

      контрольной группе предъявлялся тот же по содержанию текст, но без суггестора. Однако,

      на самом деле мы установили лишь то, что в тех случаях, когда наблюдался какой-то

      сдвиг в оценках, он был скорее положительным, чем отрицательным в экспериментальной

      группе и скорее случайным в контрольной группе. Все нулевые сдвиги мы отбросили, а

      ведь они составляют от 43,8 до 50% по тем шкалам, где обнаружен положительный

      достоверный сдвиг в экспериментальной выборке. Похоже, что многие, очень многие

      испытуемые экспериментальной выборки просто проигнорировали выступление

      суггестора... Однако статистический критерий свидетельствует: положительный сдвиг в

      оценках достоверен, по крайней мере для первых двух шкал и для тех испытуемых,

      которые хоть как-то прореагировали на выступление суггестора.

      АЛГОРИТМ 8

      Расчет критерия знаков G

      1. Подсчитать количество нулевых реакций и исключить их из рассмотрения.

      В результате п уменьшится на количество нулевых реакций.

      2. Определить преобладающее направление изменений. Считать сдвиги в

      преобладающем направлении "типичными".

      3. Определить количество "нетипичных" сдвигов. Считать это число эмпирическим

      значением G.

      4. По Табл. V Приложения 1 определить критические значения G для данного п.

      5. Сопоставить Gэмп с Gкр. Если Gэмп меньше Gкр или по крайней мере равен ему,

      сдвиг в типичную сторону может считаться достоверным.

      3.3. Т - критерий Вилкоксона

      Назначение критерия

      Критерий применяется для сопоставления показателей,, измеренных в двух разных

      условиях на одной и той же выборке испытуемых.

      Он позволяет установить не только направленность изменений, но и их

      выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то

      одном направлении более интенсивным, чем в другом.

      Описание критерия Т

      Этот критерий применим в тех случаях, когда признаки измерены по крайней мере

      по шкале порядка; и сдвиги между вторым и первым замерами тоже могут быть

      упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В

      принципе, можно применять критерий Т и в тех случаях, когда сдвиги принимают только

      три значения: —1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем

      выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги

      изменяются, скажем, от —30 до +45, тогда имеет смысл их ранжировать и потом

      суммировать ранги.

      Суть метода состоит в том, что мы сопоставляем выраженность сдвигов в том и

      ином направлениях по абсолютной величине. Для этого мы сначала ранжируем все

      абсолютные величины сдвигов, а потом суммируем ранги. Если сдвиги в положительную

      и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений

      их будут примерно равны. Если же интенсивность сдвига в одном из направлений

      перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную

      сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

      Первоначально мы исходим из предположения о том, что типичным сдвигом будет

      сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом -

      сдвиг в более редко встречающемся направлении.

      Гипотезы

      Н0: Интенсивность сдвигов в типичном направлении не превосходит

      интенсивности сдвигов в нетипичном направлении.

      H1: Интенсивность сдвигов в типичном направлении превышает интенсивность

      сдвигов в нетипичном направлении.

      Графическое представление критерия Т

      Сдвиги в противоположные стороны мы можем представить себе в виде двух

      облаков, как и в критерии знаков. Величина облака зависит не только от количества

      соответствующих сдвигов, но и от их интенсивности, отраженной в длине стрелок (Рис.

      3.3). В сущности, облака: противостоят друг пруту, как два воздушных фронта: они не

      просто соревнуются по величине, они меряются силами! При определенных п, а именно

      при n·18, мы вообще можем отказаться от понятия типичного сдвига. Сдвигов в ту и

      другую сторону может оказаться поровну, но если 9 меньших сдвигов будут относиться к

      одному направлению, а 9 больших сдвигов - к противоположному, то мы можем

      констатировать достоверное преобладание этого противоположного направления сдвигов.

      Вспомним, что критерий знаков в этом случае не выявил бы никаких достоверных

      различий.

      На Рис. З.З(а) "светлый фронт" преобладает над "темным фронтом" и по количеству

      сдвигов, и по их интенсивности. На Рис. 3.3(6) "светлый фронт* преобладает только по

      интенсивности сдвигов, но не по их количеству; на Рис. З.З(в) в "светлом фронте"

      наблюдаются более интенсивные сдвиги, но их меньше, чем в "темном фронте". Здесь

      критерий знаков мог бы констатировать преобладание изменений, соот-етствующих

      "темному фронту". Между тем, интенсивность противопо-|жнь1х, хотя и редких, сдвигов,

      столь велика, что делать какие-то од-ачные выводы было бы опрометчиво.

      Ограничения в врнменеанн критерия Т Ввлкоксона

      1. Минимальное количество испытуемых, прошедших измерения в двух условиях - 5

      человек. Максимальное количество испытуемых - 50 человек, что диктуется верхней

      границей имеющихся таблиц. Крити-чесхие значения Т приведены в Табл. VI Приложения

      2. Нулевые сдвиги из рассмотрения исключаются, и количество наблюдений п

      уменьшается на количество этих нулевых сдвигов (McCall R., 1970, р. 36). Можно обойти

      это ограничение, сформулировав гипотезы, включающие отсутствие изменений,

      например: "Сдвиг в сторону увеличения значений превышает сдвиг в сторону уменьшения

      значений и тенденцию сохранения их на прежнем уровне".

      Пример

      В выборке курсантов военного училища (юноши в возрасте от 18 до 20 лет)

      измерялась способность к удержанию физического волевого усилия на динамометре.

      Сначала у испытуемых измерялась максимальная мышечная сила каждой из рук, а на

      следующий день им предлагалось выдерживать, на динамометре с подвижной стрелкой

      мышечное усилие, равное 1/2 максимальной мышечной силы данной руки. Почувствовав

      усталость, испытуемый должен был сообщить об этом экспериментатору, но не

      прекращать опыт, преодолевая усталость и неприятные ощущения - "бороться, пока воля

      не иссякнет". Опыт проводился дважды; вначале с обычной инструкцией, а затем, после

      того, как испытуемый заполнял опросник самооценки волевых качеств по методике А.Ц.

      Пуни (Пуни А.Ц., 1977), ему предлагалось представить себе, что он уже добился идеала в

      развитии волевых качеств, и продемонстрировать соответствующее идеалу волевое

      усилие. Подтвердилась ли гипотеза экспериментатора о том, что обращение к идеалу

      способствует возрастанию волевого усилия? Данные представлены в Табл. 3.5.

      Таблица 3.5

      Расчет критерия Т при сопоставлении замеров физического волевого усилия

      Код имени

      испытуемого

      Длительность удержания усилия на динамометре (с) Разность

      (fпосле- fдо)

      Абсолютное

      значение

      разности

      Ранговый

      номер разности

      До измерения волевых

      качеств и обращения к

      идеалу (fдо)

      После измерения волевых

      качеств и обращения к идеалу

      (fпосле)

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      11

      Г.

      Кос.

      Крив.

      Кур.

      Л.

      М.

      Р.

      С.

      Т.

      X.

      Ю.

      64

      77

      74

      95

      105

      83

      73

      75

      101

      97

      78

      25

      50

      77

      76

      67

      75

      77

      71

      63

      122

      60

      - 39

      - 27

      + 3

      - 19

      - 38

      - 8

      + 4

      - 4

      - 38

      + 25

      - 18

      39

      27

      5

      19

      38

      8

      4

      4

      38

      25

      18

      11

      8

      1

      6

      9,5

      4

      2,5

      2,5

      9,5

      7

      5

      Сумма 66

      Для подсчета этого критерия нет необходимости упорядочивать ряды значений по

      нарастанию признака. Мы можем использовать алфавитный список испытуемых, как в

      данном случае.

      Первый шаг в подсчете критерия Т - вычитание каждого индивидуального значения

      "до" из значения "после"10. Мы видим из Табл. 3.5, что 8 полученных разностей -

      отрицательные и лишь 3 - положительные. Это означает, что у 8 испытуемых

      длительность удержания мышечного усилия во втором замере уменьшилась, а у 3 -

      увеличилась. Мы столкнулись с тем случаем, когда уже сейчас мы не можем сфор-

      мулировать статистическую гипотезу, соответствующую первоначальному

      предположению исследователя. Предполагалось, что обращение к идеалу будет

      увеличивать длительность мышечного усилия, а экспериментальные данные

      свидетельствуют, что лишь в 3 случаях из 11 этот показатель действительно увеличился.

      Мы можем сформулировать лишь гипотезу, предполагающую несущественность сдвига

      этого показателя в сторону снижения.

      Сформулируем гипотезы.

      Н0: Интенсивность сдвигов в сторону уменьшения длительности мышечного

      усилия не превышает интенсивности сдвигов в сторону ее увеличения.

      H1: Интенсивность сдвигов в сторону уменьшения длительности мышечного

      усилия превышает интенсивность сдвигов в сторону ее увеличения.

      На следующем шаге все сдвиги, независимо от их знака, должны быть

      проранжированы по выраженности. В Табл. 3.5 в четвертом слева столбце приведены

      абсолютные величины сдвигов, а в последнем столбце (справа) - ранги этих абсолютных

      величин. Меньшему значению соответствует меньший ранг. При этом сумма рангов равна

      66, что соответствует расчетной:

      10 Можно вычитать значения "после" из значений "до", это никак не повлияет на расчет критерия. Но лучше во всех

      случаях придерживаться одной системы, чтобы не запутаться самим.

      Теперь отметим те сдвиги, которые являются нетипичными, в данном случае -

      положительными. В Табл. 3.5 эти сдвиги и соответствующие им ранги выделены цветом.

      Сумма рангов этих "редких" сдвигов и составляет эмпирическое значение критерия Т:

      где Rr - ранговые значения сдвигов с более редким знаком.

      Итак, в данном случае,

      Тэмn=1+2,5+7=10,5

      По Таблице VI Приложения 1 определяем критические значения Т для n=11:

      Зона значимости в данном случае простирается влево. Действительно, если бы

      "редких", в данном случае положительных, сдвигов не было совсем, то и сумма их рангов

      равнялась бы нулю. В данном же случае эмпирическое значение Т попадает в зону

      неопределенности:

      Тэмп<Ткр (0,05)

      Ответ: Н0 отвергается. Интенсивность отрицательного сдвига показателя

      физического волевого усилия превышает интенсивность положительного сдвига (р<0,05).

      Попытаемся графически отобразить интенсивность отрицательных и положительных

      сдвигов. На Рис. 3.4 слева сдвиги представлены в секундах, а справа - в своих ранговых

      значениях. Мы видим, что ранжирование несколько уменьшает площади сопоставляемых

      облаков, или "фронтов".

      Таким образом, исследователю придется признать, что продолжительность

      удержания мышечного волевого усилия во втором замере снижается, и этот сдвиг

      неслучаен. Инструкция, ориентирующая испытуемого на соответствие идеалу в развитии

      воли, оказалась гораздо менее мощным фактором, чем какая-то иная сила - возможно,

      мышечное утомление, может быть, разочарование в себе или в возможностях данного

      психологического эксперимента. А может быть, в момент второго замера просто перестает

      действовать какой-то мощный фактор, который был активен вначале? На все эти вопросы

      статистические методы не могут ответить, если в схему эксперимента не включена

      контрольная группа - в данном случае, выборка, уравновешенная с экспериментальной

      группой по всем значимым характеристикам (полу, возрасту, профессии, месту обучения),

      у которой просто измерили бы вторично волевое усилие через такой же промежуток

      времени, не призывая соответствовать идеалу в развитии воли.

      Представим выполненные действия в виде алгоритма:

      АЛГОРИТМ 9

      Подсчет критерия Т Вилкоксона

      1. Составить список испытуемых в любом порядке, например, алфавит-

      ном.

      2. Вычислить разность между индивидуальными значениями во втором и первом

      замерах ("после" - "до"). Определить, что будет считаться "типичным" сдвигом и

      сформулировать соответствующие гипотезы.

      3. Перевести разности в абсолютные величины и записать их отдельным столбцом

      (иначе трудно отвлечься от знака разности).

      4. Проранжировать абсолютные величины разностей, начисляя меньшему значению

      меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.

      5. Отметить кружками или другими знаками ранги, соответствующие сдвигам в

      "нетипичном" направлении.

      6. Подсчитать сумму этих рангов по формуле:

      где Rr - ранговые значения сдвигов с более редким знаком.

      7. Определить критические значения Т для данного п по Табл. VI Приложения 1.

      Если Тэмп меньше или равен Ткр, сдвиг в "типичную" сторону по интенсивности

      достоверно преобладает.

      3.4. Критерий ·2

      r Фридмана

      Назначение критерия

      Критерий ·2

      r применяется для сопоставления показателей, измеренных в трех или

      более условиях на одной и той же выборке испытуемых.

      Критерий позволяет установить, что величины показателей от условия к условию

      изменяются, но при этом не указывает на направление изменений.

      Описание критерия

      Данный критерий является распространением критерия Т Вилкоксона на большее,

      чем 2, количество условий измерения. Однако здесь мы ранжируем не абсолютные

      величины сдвигов, а сами индивидуальные значения, полученные данным испытуемым в

      1, 2, 3 и т. д. замерах.

      Например, если у испытуемого в первом замере определена скорость прохождения

      графического лабиринта 54 сек, во втором замере -42 сек, а в третьем замере - 63 сек, то

      эти показатели получат ранги, соответственно, 2, 1, 3, поскольку меньшему значению,

      полученному во втором замере, мы начислим ранг 1, среднему значению, полученному в

      первом замере - ранг 2, а наибольшему значению, полученному в третьем замере - ранг 3.

      После того, как все значения будут проранжированы, подсчитыва-ются суммы

      рангов по столбцам для каждого из произведенных замеров.

      Если различия между значениями признака, полученными в разных условиях,

      случайны, то суммы рангов по разным условиям будут приблизительно равны. Но если

      значения признака изменяются в разных условиях каким-то закономерным образом, то в

      одних условиях будут преобладать высокие ранги, а в других - низкие. Суммы рангов

      будут достоверно различаться между собой. Эмпирическое значение критерия ·2

      r и

      указывает на то, насколько различаются суммы рангов. Чем больше эмпирическое

      значение ·2

      r, тем более существенные расхождения сумм рангов оно отражает.

      Если ·2

      r равняется критическому значению или превышает его, различия

      статистически Достоверны.

      Гипотезы

      Н0: Между показателями, полученными (измеренными) в разных условиях,

      существуют лишь случайные различия.

      H1: Между показателями, полученными в разных условиях, существуют

      неслучайные различия.

      Графическое представление критерия

      Графически это будет выглядеть как "пучок" ломаных линий с изломами в одних и

      тех же местах. На Рис. 3.5 представлены графики изменения времени решения анаграмм' в

      ходе эксперимента по исследованию интеллектуальной настойчивости. Мы видим, что

      "сырые" значения пяти испытуемых дают довольно-таки "рассыпающийся" пучок, хотя и

      с заметной тенденцией к излому в одной и той же точке - на анаграмме № 2. На Рис. 3.6

      представлены графики, построенные по ранжированным данным того же исследования.

      Мы видим, что здесь "пучок" собран практически в одну жирную линию, с единственной

      выбивающейся из него кривой. В сущности, критерий ·2

      r позволяет нам оценить,

      достаточно ли согласованно изгибается пучок при переходе от условия к условию. ·2

      r тем

      больше, чем более выраженными являются различия.

      Ограничения критерия

      1. Нижний порог: не менее 2-х испытуемых (n·2), каждый из которых прошел не

      менее 3-х замеров (с·3).

      2. При с=3, n·9, уровень значимости полученного эмпирического значения ·2

      r

      определяется по Таблице VII-A Приложения 1; при с=4, n·4, уровень значимости

      полученного эмпирического значения ·2

      r определяется по Таблице VII-Б Приложения 1;

      при больших количествах испытуемых или условий полученные эмпирические значения

      ·2

      r сопоставляются с критическими значениями ·2

      r, определяемыми по Таблице IX

      Приложения 1. Это объясняется тем, что ·2

      r имеет распределение, сходное с

      распределением ·2

      r. Число степеней свободы v определяется по формуле:

      v=c—1,

      где с - количество условий измерения (замеров).

      Пример

      На Рис. 3.5. представлены графики изменения времени решения анаграмм в

      эксперименте по исследованию интеллектуальной настойчивости (Сидоренко Е. В., 1984).

      Анаграммы нужно было подобрать таким образом, чтобы постепенно подготовить

      испытуемого к самой трудной - а фактически неразрешимой - задаче. Иными словами,

      испытуемый должен был постепенно привыкнуть к тому, что задачи становятся все более

      и более трудными, и что над каждой последующей анаграммой ему приходится проводить

      больше времени. Достоверны ли различия во времени решения испытуемыми анаграмм?

      Таблица 3.5

      Показатели времени решения анаграмм (сек.)

      Код имени испытуемого Анаграмма 1:

      КРУА (РУКА)

      Анаграмма 2:

      АЛСТЬ (СТАЛЬ)

      Анаграмма 3:

      ИНААМШ (МАШИНА)

      1. Л-в

      2. П-о

      3. К-в

      4. Ю-ч

      5. Р-о

      5

      7

      2

      2

      35

      235*11

      604

      93

      171

      141

      7

      20

      5

      8

      7

      Суммы 51 1244 47

      | Средние 10,2 248,8 9,4

      Проранжируем значения, полученные по трем анаграммам каждым испытуемым.

      Например, испытуемый К-в меньше всего времени провел над анаграммой 1 -

      следовательно, она получает ранг 1. На втором месте у него стоит анаграмма 3 - она

      получает ранг 2. Наконец, анаграмма 2 получает ранг 3, потому что она решалась им

      дольше двух других.

      Сумма рангов по каждому испытуемому должна составлять 6.

      Расчетная общая сумма рангов в критерии определяется по формуле:

      где n - количество испытуемых

      с - количество условий измерения (замеров).

      В данном случае,

      Таблица 3.6

      Показатели времени решения анаграмм 1, 2, 3 и их ранги (n=5)

      Код имени

      испытуемого

      Анаграмма 1 Анаграмма 2 Анаграмма 3

      Время (сек) Ранг Время (сек) Ранг Время (сек) Ранг

      1. Л-в 5 1 235 3 7 2

      2. П-о 7 1 604 3 20 2

      3. К-в 2 1 93 3 5 2

      4. Ю-ч 2 1 171 3 8 2

      5. Р-о 35 2 141 3 7 1

      Суммы 6 15 9

      Общая сумма рангов составляет: 6+15+9—30, что совпадает с расчетной величиной.

      11 *Испытуемый Л-в так и не смог правильно решить анаграмму 2. |4 Е. В. Сидоренко

      Мы помним, что испытуемый Л-в провел 3 минуты и 55 сек над решением второй

      анаграммы, но так и не решил ее. Поскольку он решал ее дольше остальных двух

      анаграмм, мы имеем право присвоить ей ранг 3. Ведь назначение трех первых анаграмм -

      подготовить испытуемого к тому, что над следующей анаграммой ему, возможно,

      придется думать еще дольше, в то время как сам факт нахождения правильного ответа не

      так существен.

      Сформулируем гипотезы.

      Н0: Различия во времени, которое испытуемые проводят над решением трех

      различных анаграмм, являются случайными.

      H1: Различия во времени, которое испытуемые проводят над решением трех

      различных анаграмм, не являются случайными.

      Теперь нам нужно определить эмпирическое значение ·2

      r по формуле:

      где с - количество условии;

      п - количество испытуемых;

      Тi - суммы рангов по каждому из условий.

      Определим ·2

      r для данного случая:

      Поскольку в данном примере рассматриваются три задачи, то есть 3 условия, с=3.

      Количество испытуемых n=5. Это позволяет нам воспользоваться специальной таблицей

      ·2

      r, а именно Табл. VII-A Приложения 1. Эмпирическое значение ·2

      r=8,4 при с=3, n=5

      точно соответствует уровню значимости р=0,0085.

      Ответ: Но отклоняется. Принимается H1. Различия во времени, которое

      испытуемые проводят над решением трех различных анаграмм, неслучайны (р=0,0085).

      Теперь мы можем сформулировать общий алгоритм действий по применению

      критерия ·2

      r.

      АЛГОРИТМ 10

      Подсчет критерия ·2

      r Фридмана

      1. Проранжировать индивидуальные значения первого испытуемого, полученные им

      в 1-м, 2-м, 3-м и т. д. замерах.

      2. Проделать то же самое по отношению ко всем другим испытуемым.

      3. Просуммировать ранги по условиям, в которых осуществлялись замеры.

      Проверить совпадение общей суммы рангов с расчетной суммой.

      4. Определить эмпирическое значение ·2

      r по формуле:

      где с - количество условии;

      п - количество испытуемых;

      Ti - суммы рангов по каждому из условий.

      5. Определить уровни статистической значимости для ·2

      r

      а) при с=3, n<9 - по Табл. VII-A Приложения 1;

      б) при с=4, n<4 - по Табл. VII-Б Приложения 1.

      6. При большем количестве условий и/или испытуемых - определить количество

      степеней свободы v по формуле:

      v=c-1,

      где с - количество условий (замеров).

      По Табл. IX Приложения 1 определить критические значения критерия ·2 при

      данном числе степеней свободы V.

      Если ·2

      r эмп равен критическому значению ·2 или превышает его, различия

      достоверны.

      3.5. L - критерий тенденций Пейджа

      Описание критерия L дается с использованием руководства J.Greene, M. D'Olivera

      (1989).

      Назначение L - критерия тенденций

      Критерий L Пейджа применяется для сопоставления показателей, измеренных в

      трех и более условиях на одной и той же выборке испытуемых.

      Критерий позволяет выявить тенденции в изменении величин признака при

      переходе от условия к условию. Его можно рассматривать как продолжение теста

      Фридмана, поскольку он не только констатирует различия, но и указывает на направление

      изменений.

      Описание критерия тенденций L

      Критерий позволяет проверить наши предположения об определенной возрастной

      или ситуативно обусловленной динамике тех или иных признаков. Он позволяет

      объединить несколько произведенных замеров единой гипотезой о тенденции изменения

      значений признака при переходе от замера к замеру. Если бы не его ограничения, крите-

      рий был бы незаменим в "продольных", или лонгитюдинальных, исследованиях.

      К сожалению, имеющиеся таблицы критических значений рассчитаны только на

      небольшую выборку (n<12) и ограниченное количество сопоставляемых замеров (с<6).

      В случае, если эти ограничения не выполняются, приходится использовать критерий

      ·2

      r Фридмана, рассмотренный в предыдущем параграфе.

      В критерии L применяется такое же ранжирование условий по каждому

      испытуемому, как и в критерии ·2

      r. Если испытуемый в первом опыте допустил 17

      ошибок, во втором - 12, а в третьем - 5, то 1-й ранг получает третье условие, 2-й ранг -

      второе, а 3-й ранг - первое условие. После того, как значения всех испытуемых будут

      проранжиро-ваны, подсчитываются суммы рангов по каждому условию. Затем все

      условия располагаются в порядке возрастания ранговых сумм: на первом месте слева

      окажется условие с меньшей ранговой суммой, за ним -условие со следующей по

      величине ранговой суммой, и т. д., пока справа не окажется условие с самой большой

      ранговой суммой. Далее мы с помощью специальной формулы подсчета L проверяем,

      действительно ли значения возрастают слева направо. Эмпирическое значение критерия L

      отражает степень различия между ранговыми суммами, поэтому чем выше значение L,

      тем более существенны различия.

      Гипотезы

      Н0: Увеличение индивидуальных показателей при переходе от первого условия ко

      второму, а затем к третьему и далее, случайно.

      H1: Увеличение индивидуальных показателей при переходе от первого условия ко

      второму, а затем к третьему и далее, неслучайно.

      При формулировке гипотез мы имеем в виду новую нумерацию условий,

      соответствующую предполагаемым тенденциям.

      Графическое представление критерия

      Используем для иллюстрации пример с предъявлением анаграмм предположительно

      возрастающей сложности. Замысел экспериментатора состоял в том, чтобы каждая

      последующая задача требовала от испытуемых все более длительных раздумий.

      Судя по графику на Рис. 3.6, у большинства испытуемых анаграмма 1 стоит на

      первом ранговом месте, то есть решается быстрее двух других, анаграмма 3 на 2-м

      ранговом месте, а анаграмма 2 - на 3-м. По-видимому, их следовало бы предъявлять в

      иной последовательности: 1, 3, 2. График, отражающий такую гипотетическую последова-

      тельность задач, представлен на Рис. 3.7.

      Символом достоверной, отчетливой тенденции в изменении показателей при

      переходе от условия к условию будет достаточно "собранная" ломаная кривая,

      устремленная кверху или, наоборот, книзу. Если на Рис. 3.6 характерной чертой всех

      индивидуальных кривых был крутой излом в одной и той же точке графика, то в данном

      случае на некоторых отрезках повышение кривой характеризуется большей крутизной, а

      на других - меньшей крутизной. Очевидно, достоверность тенденций будет

      обеспечиваться именно отрезками более крутого восхождения, но тест тенденций

      снисходительно распространит этот эффект и на более пологие отрезки.

      На Рис. 3.8 графики представлены уже для ранжированных показателей. Здесь уже

      все различия в крутизне сглажены. L-тест построен на сопоставлении сумм рангов, а

      ранжирование неизбежно несколько огрубляет полученные показатели. Опыт показывает,

      однако, что L-тест является достаточно мощным критерием, хотя и ограниченным по

      сфере применения из-за отсутствия таблиц критических значений для больших n.

      Ограничения критерия Пейджа

      1. Нижний порог - 2 испытуемых, каждый из которых прошел не менее 3-х замеров в

      разных условиях. Верхний порог - 12 испытуемых и 6 условий (n·12, c·6). Критические

      значения критерия L даны по руководству J.Greene, M. D'Olivera (1989). Они

      предусматривают три уровня статистической значимости: р·0,05; р·0,01; р·0,001.

      2. Необходимым условием применения теста является упорядоченность столбцов

      данных: слева должен располагаться столбец с наименьшей ранговой суммой показателей,

      справа - с наибольшей. Можно просто пронумеровать заново все столбцы, а потом вести

      расчеты не слева направо, а по номерам, но так легче запутаться.

      Пример

      Продолжим рассмотрение примера с анаграммами. В Табл. 3.7 показатели времени

      решения анаграмм и их ранги представлены уже в упорядоченной последовательности:

      анаграмма 1, анаграмма 3, анаграмма 2. Действительно ли время решения увеличивается

      при такой последовательности предъявления анаграмм?

      Таблица 3.7

      Показатели времени решения анаграмм 1, 3, 2 и их ранги (n=5)

      Код имени

      испытуемого

      Условие 1:

      Анаграмма 1

      Условие 2:

      Анаграмма 3

      Условие 3:

      Анаграмма 2

      Время (сек) Ранг Время (сек) Ранг Время (сек) Ранг

      1 Л-в 5 1 7 2 235 3

      2 П-о 7 1 20 2 604 3

      3 К-в 2 1 5 2 93 3

      4 Ю-ч 2 1 8 2 171 3

      5 Р-о 35 2 7 1 141 3

      Суммы 51 6 47 9 1244 15

      Средние 10,2 9,4 289

      Сумма рангов составляет: 6+9+5=30. Расчетная сумма:

      Реально полученная и расчетная суммы совпадают, мы можем двигаться дальше.

      Как видно из Табл. 3.7, среднее время решения анаграммы 3 даже меньше, чем

      анаграммы 1. Однако мы исследуем не среднегруп-повые тенденции, а степень совпадения

      индивидуальных тенденций. Нам важен именно порядок, а не абсолютные показатели

      времени. Поэтому и формулируемые нами гипотезы - это гипотезы о тенденциях

      изменения индивидуальных показателей.

      Сформулируем гипотезы.

      Н0: Тенденция увеличения индивидуальных показателей от первого условия к

      третьему является случайной.

      H1: Тенденция увеличения индивидуальных показателей от первого условия к

      третьему не является случайной. Эмпирическое значение L определяется по формуле:

      где Ti - сумма рангов по каждому условию;

      j - порядковый номер, приписанный каждому условию в новой

      последовательности .

      По Табл. VIII Приложения 1 определяем критические значения L для данного

      количества испытуемых: n=5, и данного количества условий: с=3.

      Построим "ось значимости"

      Ответ: Н0 отклоняется. Принимается H1. Тенденция увеличения индивидуальных

      показателей от первого условия к третьему не является случайной (р<0,01).

      Последовательность анаграмм: 1(КРУА), З(ИНААМШ), 2(АЛСТЬ), - будет в большей

      степени отвечать замыслу экспериментатора о постепенном возрастании сложности задач,

      чем первоначально применявшаяся последовательность.

      АЛГОРИТМ 11

      Подсчет критерия тенденций L Пейджа

      1. Проранжировать индивидуальные значения первого испытуемого, полученные им

      в 1-м, 2-м, 3-ми т. д. замерах.

      При этом первым может быть любой испытуемый, например первый по алфавиту

      имен.

      2. Проделать то же самое по отношению ко всем другим испытуемым.

      3. Просуммировать ранги по условиям, в которых осуществлялись замеры.

      Проверить совпадение общей суммы рангов с расчетной суммой.

      4. Расположить все условия в порядке возрастания их ранговых сумм в таблице.

      5. Определить эмпирическое значение L по формуле:

      где Ti - сумма рангов по данному условию;

      j - порядковый номер, приписанный данному условию в упорядоченной

      последовательности условий.

      6. По Ta6A.VIII Приложения 1 определить критические значения L для данного

      количества испытуемых п и данного количества условий с. Если Lэмп равен критическому

      значению или превышает его, тенденция достоверна.

      3.6. Задачи для самостоятельной работы

      ВНИМАНИЕ!

      При выборе способа решения задачи рекомендуется пользоваться

      АЛГОРИТМОМ 12

      Задача 4

      В исследовании Г. А. Бадасовой, которое уже рассматривалось как пример к

      параграфу 3.2, было установлено, что испытуемые по-разному относятся к наказаниям,

      которые совершают по отношению к их детям разные люди. Например, наказание со

      стороны самого родителя считается более приемлемым, чем наказание со стороны

      бабушки, и тем более воспитательницы или учительницы (см. Табл. 3.8).

      Таблица 3.8

      Оценки степени согласия с утверждениями о допустимости телесных наказаний до

      предъявления видеозаписи в экспериментальной группе (n=16)

      Испытуемые Условие 1:

      "Я сам наказываю"

      Условие 2:

      "Бабушка наказывает"

      Условие 3:

      "Учительница наказывает"

      1 4 2 1

      2 1 1 1

      3 5 4 4

      4 4 3 2

      5 3 3 2

      6 4 5 1

      7 3 3 1

      8 5 5 3

      9 6 5 3

      10 2 2 2

      И 6 3 2

      12 5 3 4

      13 7 5 4

      14 5 5 2

      15 5 5 4

      16 6 6 4

      Суммы 71 60 40

      Можно ли говорить о достоверной тенденции в оценках?

      Задача 5.

      12 участников комплексной программы тренинга партнерского общения,

      продолжавшегося 7 дней, дважды оценивали у себя уровень владения тремя важнейшими

      коммуникативными навыками. Первое измерение производилось в первый день тренинга,

      второе - в последний. Участники должны были также наметить для себя реально достижи-

      мый, с их точки зрения, индивидуальный идеал в развитии каждого из навыков. Все

      измерения производились по 10-балльной шкале. Данные представлены в Табл. 3.9.

      Таблица 3.9

      Оценки реального и идеального уровней развития коммуникативных навыков (n=12)

      1 измерение 2 измерение

      Код имени

      участника

      Активное

      слушание

      Снижение

      эмоционально-

      го напряжения

      Аргументация Активное

      слушание

      Снижение

      эмоционально-

      Аргументация

      Реал. Идеал

      .
      Реал. Идеал. Реал. Идеал. Реал. Идеал. Реал. Идеал. Реал. Идеал.

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      11

      12

      И.

      Я.

      Ин.

      Р.

      К.

      Н.

      Е.

      Ле.

      Ли.

      Т.

      Ет.

      Б.

      6

      3

      4

      4

      6

      6

      3

      6

      6

      5

      6

      6

      9

      5

      6

      6

      9

      8

      8

      9

      8

      8

      8

      8

      5

      1

      4

      4

      4

      5

      5

      5

      5

      6

      6

      3

      8

      3

      6

      5

      9

      8

      10

      8

      9

      9

      10

      10

      5

      4

      5

      5

      4

      3

      2

      3

      5

      5

      3

      4

      8

      5

      8

      7

      8

      6

      6

      7

      9

      8

      9

      7

      7

      5

      8

      6

      4

      8

      7

      5

      7

      7

      5

      7

      10

      7

      10

      7

      10

      9

      8

      8

      8

      10

      10

      9

      6

      4

      7

      5

      5

      7

      8

      7

      6

      7

      4

      6

      10

      6

      8

      7

      10

      9

      10

      10

      9

      10

      9

      8

      7

      5

      6

      5

      5

      6

      5

      5

      5

      6

      3

      5

      9

      7

      8

      7

      10

      8

      7

      9

      9

      10

      9

      8

      Вопросы:

      1. Ощущаются ли участниками достоверные сдвиги в уровне владения каждым из

      трех навыков после тренинга?

      2. Произошли ли по трем группам навыков разные сдвиги, или эти сдвиги для

      разных навыков примерно одинаковы?

      3. Уменьшается ли расхождение между "идеальным" и реальным уровнями владения

      навыками после тренинга?

      3.7. Алгоритм принятия решения о выборе критерия оценки изменений






      Share |

       

      Версия для печати

      Читайте также
      36% воронежцев считают, что заниматься детьми сложнее, чем работать
      Три признака выдающегося лидера

      Все мы знаем расхожие стереотипы: хорошие директора – непременно экстраверты, они любят набивать себе цену и принимать рискованные решения. Но насколько эти представления пересекаются с реальностью?


      KPI — как метод управления подчиненными
      KPI — как метод управления подчиненными

      В общепринятой бизнес-практике Key Performance Indicators (КPI) — это универсальный инструмент для системной оценки эффективности подразделения или даже конкретного процесса.

      Решайте сами, иначе другие сделают это за вас


      Управление талантами

      Талант - это сотрудник, эффективность которого в заданных условиях превышает среднюю, скажем, в четыре раза. Ключевой момент - «в заданных условиях»
      Имя 
      Пароль  забыли?
      Присоединяйтесь!

      Новые материалы

         Названы самые высокооплачиваемые вакансии в Башкирии
         Не все профессии равны. Вчерашние школьники идут в телевизионщики и PR
         Новочебоксарские безработные граждане обучаются востребованным профессиям
         Где в Уфе заработать 100 тысяч рублей в месяц
         Сколько в среднем получают владимирские врачи?


      Последние комментарии

        
         мне приятно Вас читать 99 % читаемое мной - мусор... А на ваших постах глаза отдыхают 
         Действительно, Эдуард, что это я! Всё ещё hr, всё ещё пишу - с удовольствием вернусь)))
         Марина, вы вернетесь к нам или уже все?)
         вы можете оставлять активную ссылку на источник 
      Все статьи


      Интервью




      Публикую статью Алексея Королькова с видеокомментарием
      все интервью


      О проекте      Реклама       Подписка       Контакты       Rambler's Top100 Яндекс цитирования ©2000-2011, HRM