сделать домашней  добавить в избранное  карта сайта RSS
 

Вебинары HRM.RU

Прогноз эффективности кандидатов на основе тестов
Начало 26.05.2017 12.00 (по московскому времени)

Полный список вебинаров

События

полный список

Последние обсуждения

  26.09.2019 16:41:06
Новый уровень безопасности дыхания
  30.08.2019 14:26:41
Worldskills International и 3М запускают новый совместный проект «Образование во имя будущего»
  30.08.2019 11:33:40
Молодые профессионалы за устойчивое будущее
  24.08.2019 14:36:18
Научные эксперименты, продуктовые тесты и мировые технологии для молодых профессионалов
  09.08.2019 16:18:31
Только оригинальные СИЗ обеспечивают гарантированную защиту


Опросы
  Актуальные направления работы HR вашей организации 2017
Все опросы


Крыштановский. Анализ социологических данных. подготовка к анализу данных. описательная статистика

      Тематические разделы:
      Психология, теории HR
      Психология, теории HR : Социальная психология
      Общий менеджмент : Аналитика
      Книги

      Дата публикации: 03.07.2017






      ПОДГОТОВКА К АНАЛИЗУ ДАННЫХ. ОПИСАТЕЛЬНАЯ СТАТИСТИКА

      1.1

      Социяльное исследовяние

      и янялиз дянных: основные понятия

      Анализ информации, собираемой в процессе эмпирических социологических

      исследований, представляет собой не просто совокупность

      технических приемов и методов, позволяющих в той или иной форме

      визуализировать полученные данные. Анализ данных является ключевым

      этапом всего исследования, в ходе которого Происходит непосредственная

      проверка соответствия собранной информации тем моделям

      социальных явлений, которые, явно или латентно, имеются у

      социологов. И более того, в ходе анализа формулируются и проверяются

      новые модели, адекватно отражающие те закономерности, которые

      есть в собранных данных.

      Очевидно, что в случае простой визуализации собранной информации

      мы имеем дело лишь с обработкой социологических данных.

      Если ставятся задачи построения определенной модели изучаемого

      социального явления и проверки соответствия этой модели имеющимся

      данным, можно говорить именно об анализе данных.

      В ходе как обработки, так и анализа данных часто используют

      одни и те же технические и математические приемы, однако с гносеологической

      точки зрения это два разных подхода к данным. В первом

      случае социолог использует стандартный набор средств (как правило —

      это одномерные распределения, таблицы, гистограммы и графики) для

      наиболее наглядной демонстрации полученных данных, которые, при

      удачном подборе технических средств, вроде бы говорят сами за себя.

      Во втором случае исследователь выдвигает определенную модель социального

      явления, демонстрирует соответствие (либо противоречие)

      данных этой модели и ведет дальнейшую разработку именно модели,

      отвлекаясь от самих данных.

      При работе с социологическими данными используются два основополагающих

      понятия:

      • единица анализа (анкета, случай);

      • переменная.

      Единица анализа — это элементарная, единичная часть объекта

      исследования. В большинстве случаев единица анализа совпадает с

      единицей наблюдения, т.е. с тем объектом, о котором непосредственно

      получают информацию в ходе сбора данных. В социологии, как правило,

      этой единицей является отдельный респондент. Однако это не

      всегда так. Например, объектом изучения социолога может выступать

      семья как целостная единица и, следовательно, она выступает единицей

      анализа в исследовании. Единицами же наблюдения выступают

      члены семей, т.е. отдельные респонденты, о которых, собственно, и

      собирается информация. Преобразование информации, собранной о

      единицах наблюдения, в информацию о единицах анализа является самостоятельным

      и не только техническим этапом исследования.

      Переменная — это элементарный показатель, признак, характеризующий

      одно из изучаемых свойств единицы анализа. Простейшими

      переменными являются, скажем, пол или зарплата респондента.

      Ключевыми характеристиками переменной является то, что, с одной

      стороны, для каждой единицы анализа она имеет одно, вполне определенное

      значение, а с другой стороны — то, что не все единицы

      анализа имеют одинаковое значение переменной.

      Представление данных в пакете SPSS

      Матрица, в которой представляются данные в программной системе

      SPSS, изображена на рис. 1.1. Редактор данных состоит из двух частей:

      таблицы для работы собственно с данными (рис. 1.2) и таблицы

      работы с переменными (рис. 1.3).

      Рис. 1.1. Представление данных в пакете SPSS

      Каждая строка в матрице данных содержит информацию по одной

      единице анализа. В примере (см. рис. 1.1) в качестве единицы

      анализа выступает анкета, содержащая ответы одного респондента.

      Все единицы анализа в матрице данных автоматически нумеруются.

      Номера располагаются в первой колонке матрицы данных, в остальных

      колонках — соответствующие значения переменных.

      Прежде всего рассмотрим простейшие количественные методы

      анализа данных. В зависимости от решаемых задач разделим их на

      три основных типа.

      1. Одномерный описательный анализ раскрывает некоторые характеристики

      частотных распределений.

      2. Двумерный описательный анализ связан с описанием формы

      и силы взаимосвязи между переменными, а также со сравнением значений

      некоторой переменной в разных социальных группах.

      3. Объяснительный анализ направлен на выявление силы влияния

      переменных друг на друга.

      1.3

      Построение частотных распределений

      Анализ частотных распределений результатов количественного социологического

      исследования — это первый шаг при обработке собранной

      информации. Во многих случаях этот анализ не является, строго

      говоря, анализом данных, а выполняет функции получения общих

      представлений об изучаемых социальных группах.

      Первый шаг одномерного описательного анализа для объяснения

      какого-то явления — его описание. Результаты любого массового

      опроса содержат ответы большого числа респондентов на широкий

      круг анкетных вопросов. Даже в рамках только одного вопроса анкеты

      объем исходной информации достаточно велик для того, чтобы

      можно было охватить его одним взглядом и каким-то образом суммировать.

      Именно задачу сжатия исходной информации, компактного ее

      представления для дальнейшего осмысления и решают методы одномерного

      описательного анализа.

      Одномерный описательный анализ решает поставленную задачу

      взаимодополняющими методами:

      • построения частотных распределений;

      • графического представления поведения анализируемой переменной;

      • получения статистических характеристик распределения анализируемой

      переменной.

      В табл. 1.1 представлен фрагмент данных по результатам социологического

      опроса1.

      Таблица 1.1. Фрагмент матрицы данных из трех

      переменных в формате SPSS, содержащий

      результаты социологического опроса

      Переменная q9, представленная во второй колонке матрицы, содержит

      ответы респондентов на вопрос анкеты:

      q9 Что вы могли бы сказать о своем настроении в последние дни?

      1. Прекрасное настроение.

      2. Нормальное, ровное состояние.

      3. Испытываю напряжение, раздражение.

      4. Испытываю страх, тоску.

      5. Затрудняюсь ответить.

      1 Опрос проводился ВЦИОМ ·Мониторинг общественного мнения· // Мониторинг

      общественного мнения: экономические и социальные перемены. 2002. № 6.

      В матрице данных ответы представлены в виде числовых кодов.

      Поскольку полностью вся матрица содержит ответы 2407 респондентов,

      просто просмотр ответов всех опрошенных либо на экране компьютера,

      либо в распечатанном виде на листах бумаги не дает возможности

      понять, каково было настроение опрошенных. Получить

      обобщенную, агрегированную картину ответов на данный вопрос

      позволяет таблица одномерного частотного распределения, представленная

      в табл. 1.2.

      Построение одномерного частотного распределения в рамках

      пакета SPSS выполняется с помощью команды Frequencies, расположенной

      в блоке команд Descriptives (рис. 1.2). На рис. 1.3 представлено

      меню команды Frequencies.

      Таблица 1.2 демонстрирует одномерное частотное распределение

      переменной q9 в том виде, как это распределение вычисляется

      командой Frequencies пакета SPSS. Рассмотрим информацию, которую

      дает таблица одномерного частотного распределения.

      Колонка Frequency (частота) содержит частоты, т.е. то количество

      респондентов, которые выбрали тот или иной вариант ответа.

      Таким образом, из табл. 1.2 видно, что вариант ·1· выбрали 158 респондентов,

      вариант ·2· — 1185 респондентов и т.д. Последняя стро-

      ка в табл. 1.2 — Total — в колонке Frequency показывает общее количество

      опрошенных, иными словами — объем выборки.

      Рис. 1.2. Метод вызова команды построения одномерных

      частотных распределений в пакете программ SPSS

      Рис. 7.5. Меню команды построения одномерных частотных

      распределений

      Делать выводы о том, много или мало респондентов отметили

      при опросе ту или иную градацию в вопросе, опираясь на значения в

      колонке Frequency, невозможно, поскольку необходимо постоянно соотносить

      эти числа с общим количеством опрошенных. Поэтому удобнее

      использовать колонку Percent (процент), которая содержит процентные

      значения для каждой из частот. В результате, базируясь на

      значениях этой колонки, можно сказать, что более распространенным

      ответом является «нормальное, ровное состояние», поскольку этот

      вариант отметили 49,2% респондентов.

      Колонка Valid Percent связана с такой важной в социологической

      практике характеристикой, как «Отсутствие ответа». Мы знаем, что в

      ходе любого массового опроса какая-то часть опрашиваемых не отвечает

      на поставленные вопросы. Причины такого рода «неответов» различны.

      Это и просто нежелание людей давать информацию по тем

      или иным показателям. Это и отсутствие собственного мнения по определенным

      вопросам. Возможности преодоления проблемы «неответов

      » на этапе сбора социологической информации достаточно подробно

      рассматриваются у разных авторов, однако очевидно, что эту проблему

      нельзя решить полностью.

      На этапе работы с собранными данными проблема «неответов»

      может быть сформулирована следующим образом: как анализировать

      ту информацию, которая может быть квалифицирована как «отсутствие

      ответа».

      Необходимо отметить, что на этот вопрос нет однозначного ответа.

      В зависимости от характера решаемых задач существуют разные

      подходы к анализу информации, которая соответствует «неответам».

      Отметим, что числовые коды, связанные с «неответами», называют

      пропущенные данные (Missing values).

      Первый подход к рассмотрению кодов пропущенных данных рассматривает

      эти коды как равноправные остальным числовым кодам,

      которые приписаны всем другим типам ответов. Одномерное частотное

      распределение (см. табл. 1.2) представляет именно такой подход.

      Действительно, числовой код «5» приписанный варианту «Затрудняюсь

      ответить», т.е. фактически коду пропущенных данных, представ-

      лен точно так же, как и остальные числовые коды. В результате табл. 1.2

      демонстрирует нам, что затруднились ответить на поставленный вопрос

      149 человек, или 6,2% общего числа опрошенных. При этом и все

      остальные проценты в табл. 1.2 рассчитаны от числа опрошенных.

      Альтернативным вариантом построения таблицы одномерного

      частотного распределения выступает возможность исключения из дальнейшего

      анализа тех респондентов, которые затруднились дать ответ.

      Действительно, какие у нас основания рассматривать тех 149 респондентов,

      которые не дали ответа на поставленный вопрос точно так

      же, как и тех, кто дал содержательный ответ? Простейшим выходом в

      рамках данной модели рассуждений является приписывание коду «5»

      статуса пропущенных данных и исключение из дальнейшего анализа

      тех, кто дал такой ответ. В табл. 1.3 представлено одномерное частотное

      распределение, в котором коду «5» приписан статус пропущенных

      данных.

      Таблица 1.3 отличается от табл. 1.2 тем, что код «5» помечен

      как код пропущенных данных. Колонка Percent, как и раньше, содержит

      процентное распределение всех опрошенных, а колонка Valid

      Percent — процентное распределение от того числа респондентов,

      которые дали ответы, не помеченные кодами пропущенных данных.

      Иными словами, колонка Valid Percent представляет одномерное частотное

      распределение от числа ответивших респондентов.

      Вопрос о том, какой из показателей — процент опрошенных,

      либо процент ответивших необходимо использовать для выявления

      определенных социологических закономерностей, некорректен. Оба

      показателя несут определенную информацию и, как правило, используются

      одновременно, однако их интерпретация существенно различна.

      Например, если в ходе опроса, за кого собираются голосовать респонденты

      на предстоящих выборах, мы получим, что за кандидата А

      собирается голосовать 20% опрошенных и 40% ответивших, т· оба

      этих числа представляют интерес. Действительно, первое число говорит

      нам, что 20% общего количества взрослого населения собирается

      поддержать кандидата А на будущих выборах. Поскольку коды

      пропущенных данных в такого рода опросах получают, как правило,

      те респонденты, которые говорят, что не будут участвовать в выборах,

      то число 40% говорит нам о том, сколько процентов может набрать

      кандидат А в ходе голосования.

      Присвоение кода пропущенных данных для переменных в пакете

      SPSS выполняют по таблице «Описание переменных». На рис. 1.4

      приведены таблица «Описание переменных» и показатель, с помощью

      которого задаются коды пропущенных данных. В нашем примере

      у переменной q9 задан код пропущенных данных «5».

      На рис. 1.5 представлено меню, которое позволяет задавать коды

      пропущенных данных для выбранной переменной, а также показывает

      три варианта задания кодов пропущенных данных:

      • не определять коды пропущенных данных для переменной {No

      missing values);

      • задать несколько (от 1 до 3) значений кодов пропущенных данных

      (по одному значению в каждом из открытых окон — Discrete

      missing values);

      задать интервал значении кодов пропущенных данных и одно

      значение кода пропущенных данных {Range plus one optional discrete

      missing value).

      Нажать правую кнопку мыши для вызова меню задания кодов

      пропущенных данных для переменной q9

      Рис. 1.4. Таблица ·Описание переменных· в пакете программ SPSS

      Рис. 1.5. Меню задания кодов пропущенных данных

      По какой причине может потребоваться задание не одного, а нескольких

      кодов пропущенных данных? Эта возможность отражает реаль-

      ные ситуации, по которым в ходе опроса мы нередко имеем несколько

      причин того, что респондент не отвечает на вопрос анкеты. Рассмотрим

      вопрос, в котором присутствует несколько вариантов, каждый из

      которых объясняет причину, почему респондент не дает ответа.

      За кого из кандидатов вы голосовали на прошедших выборах?

      1. За кандидата А.

      2. За кандидата В.

      7. Я не участвовал в голосовании.

      8. Я голосовал, но не помню за кого.

      9. Я участвовал в голосовании, но не хочу говорить, за кого отдал

      свой голос.

      С точки зрения социологического анализа результатов голосования,

      коды «7», «8» и «9» должны быть определены как коды пропущенных

      данных, поскольку эти ответы не содержат информации о

      том, за кого голосовал респондент. Однако с точки зрения социологических

      задач весьма интересным может быть изучение, например, характеристик

      тех респондентов, кто не участвовал в голосовании. Для

      осуществления анализа этой социальной совокупности мы можем отменить

      задание кода «7» как кода пропущенных данных и сосредоточиться

      на анализе данной группы респондентов.

      Третий вариант задания кодов пропущенных данных чаще всего

      встречается в ситуации, когда анализируемая переменная выражена

      количественно. Иногда в ответах респондентов на вопросы, например,

      о размере получаемых доходов встречаются данные, которые, строго

      говоря, не могут быть признаны ошибочными, однако, скорее всего,

      являются недостоверными. Например, если респондент сказал, что

      у него 15 детей или что его зарплата 5 млн. руб., эти ответы едва ли

      корректны. Иными словами, для многих показателей мы можем указать

      границы, допустимых значений, а те данные, которые выходят за

      эти границы целесообразно признать пропущенными данными. В меню

      определения кодов пропущенных данных в разделе Range plus one

      optional discrete missing value (интервал и, возможно, одно значение

      пропущенных данных) можно задать верхнюю и нижнюю границы

      интервала, все значения внутри будут являться пропущенными данными.

      В этом разделе наряду с интервалом можно задать одно точное

      значение кода пропущенных данных.

      1.4

      Графическое представление поведения

      анализируемой переменной

      Наряду с табличным представлением одномерное частотное распределение

      можно визуализировать в графической форме. Наиболее популярные

      формы — это столбиковые и круговые диаграммы. На рис.

      1.6 и 1.7 представлены эти виды диаграмм для одномерного частотного

      распределения табл. 1.2.

      Рис. 1.6. ·Что вы могли бы сказать о своем настроении

      в последние дни?·

      Диаграммы на рис. 1.6 и 1.7 построены с помощью графических

      возможностей пакета программ SPSS. Команды для построения графических

      диаграмм могут выполняться либо непосредственно из модуля

      вычисления одномерных частотных распределений (команда Frequencies),

      либо из специального блока команд Graphs, в котором представлены

      возможности графического анализа пакета программ SPSS.

      В нижней части меню команды Frequencies (см. рис. 1.3) есть

      педаль Charts..., нажатие на которую приводит к вызову меню построения

      диаграмм одномерного частотного распределения (рис. 1.8).

      Графические диаграммы в качестве метода построения одномерных

      частотных распределений повышают наглядность полученных

      закономерностей и могут использоваться, прежде всего, для презентации

      результатов социологических исследований. Какой из видов

      диаграмм выбрать для каждого конкретного случая — зависит от эстетических

      пристрастий и существенного значения не имеет.







      Share |

       

      Версия для печати

      Читайте также

      Профили мышления
      Профили мышления

      Профиль мышления отображает доминирующие способы переработки информации и уровень креативности человека. Он является важнейшей личностной характеристикой, определяющей стиль деятельности, склонности, интересы и профессиональную направленность индивида. С помощью предлагаемого опросника вы можете определить свой базовый тип мышления и измерить уровень креативности.

      Почти 80% руководителей уже начали трансформацию с помощью внедрения новых технологий

      Коммуникативный минимум менеджера
      Коммуникативный минимум менеджера

      Известно, что от 50 до 90% рабочего времени менеджера приходится на коммуникацию. Базовый коммуникативный минимум представляет собой перечень требований к практическим и теоретическим знаниям, навыкам и умениям менеджера. Он может быть определен как стандарт и является основой для оценки (аттестации) коммуникативной компетентности менеджера.


      Предсказывает интернет
      Предсказывает интернет

      Анализ поисковых запросов и сообщений в социальных сетях, по мнению экспертов, помогает предугадывать тенденции на рынке труда.


      Оцените свою лояльность к компании (Тест)
      Оцените свою лояльность к компании (Тест)

      Лояльность подразумевает не просто стремление соответствовать принципам компании и содействовать достижению ее целей, но и способность принимать новые требования. Предлагаем вам пройти тест, чтобы оценить свою лояльность к компании.

      Имя 
      Пароль  забыли?
      Присоединяйтесь!

      Новые материалы

         Названы самые высокооплачиваемые вакансии в Башкирии
         Не все профессии равны. Вчерашние школьники идут в телевизионщики и PR
         Новочебоксарские безработные граждане обучаются востребованным профессиям
         Где в Уфе заработать 100 тысяч рублей в месяц
         Сколько в среднем получают владимирские врачи?


      Последние комментарии

        
         мне приятно Вас читать 99 % читаемое мной - мусор... А на ваших постах глаза отдыхают 
         Действительно, Эдуард, что это я! Всё ещё hr, всё ещё пишу - с удовольствием вернусь)))
         Марина, вы вернетесь к нам или уже все?)
         вы можете оставлять активную ссылку на источник 
      Все статьи


      Интервью




      Публикую статью Алексея Королькова с видеокомментарием
      все интервью


      О проекте      Реклама       Подписка       Контакты       Rambler's Top100 Яндекс цитирования ©2000-2011, HRM