сделать домашней  добавить в избранное  карта сайта RSS
 

Вебинары HRM.RU

Прогноз эффективности кандидатов на основе тестов
Начало 26.05.2017 12.00 (по московскому времени)

Полный список вебинаров

События

  25.05.2017
II ежегодная онлайн-конференция hr-кухня!
  01.06.2017
III Всероссийская Конференция «Новое в регулировании трудовых отношений 2017: законодательство и судебная практика»
  20.06.2017
Семинар-практикум "HR-Аналитика в R", Москва, 20-21 июня 2017
полный список

Последние обсуждения

  21.04.2017 14:16:42
командообразование или просто выезд на природу
  20.04.2017 17:52:29
Как сделать так, чтобы тебя не заменили роботом?
  19.04.2017 15:27:00
Рекрутер (подбор рабочих строительных специальностей, удаленно)
  17.04.2017 13:52:30
Вакансия! Digital Creative Designer!
  10.04.2017 19:26:30
Био инженеры-это кто и какие у них зп?


Опросы
  Актуальные направления работы HR вашей организации 2017
Все опросы


«Аналитик, как правило, чувствует себя униженным»


    Обычно анализ больших данных проводится так. Сначала специалист по данным обнаруживает какую-то накопившуюся на сервере и еще не обработанную информацию. Затем он или она много дней, а то и недель по-разному крутит и вертит эти цифры, пока не наткнется на неожиданное открытие. После этого назначается собрание, находка предъявляется менеджерам.

    Тематические разделы:
    Общий менеджмент
    Общий менеджмент : Аналитика

    Автор: Кайзер Фунг

    Дата публикации: 16.02.2017



    Обычно анализ больших данных проводится так. Сначала специалист по данным обнаруживает какую-то накопившуюся на сервере и еще не обработанную информацию. Затем он или она много дней, а то и недель по-разному крутит и вертит эти цифры, пока не наткнется на неожиданное открытие. После этого назначается собрание, находка предъявляется менеджерам. Что дальше? Дальше аналитик, как правило, чувствует себя обиженным или даже униженным, а менеджеры сокрушаются о потерянном времени.

    В чем причина провала? Обычно в том, что нет четко обозначенной цели или в том, что анализ проводился на недостаточном количестве данных, или в том, что докладчик чересчур увлечен наукой, а менеджеры ничего в ней не понимают. Если вы столкнулись с такой ситуацией, рекомендую прочитать статью об именах новорожденных на сайте FiveThirtyEight, а прочитав, поделиться со своей командой аналитиков.

    Нет Сильвер и Элисон Маккен из FiveThirtyEight проделали с информацией об именах новорожденных такое, на что следует ориентироваться всем специалистам по большим данным. Они сумели задать интересные для бизнеса вопросы, подобрали дополнительные сведения, сделали смелые, но вполне оправданные предположения, чтобы заполнить пробелы в информации, и представили вывод с указанием допустимой погрешности. Их статья — лучший образец журналистики, созданный на основе больших данных. И это превосходит многие известные примеры аналитики данных.

    База данных имен всех американцев с 1880 года хранится в Управлении социального страхования — это идеальный архив для больших данных. В последние годы его заизучали, простите за каламбур, вусмерть. Своей славой архив обязан программисту Мартину Ваттенбергу, который создал программу Baby Names Voyager с удобным интерфейсом, позволяющим визуализировать имена. Эта программа помогает выяснить, в какое время какие имена пользовались популярностью. С ней был реализован целый ряд проектов: самые модные имена, самые странные имена, отличия в именах между штатами и т. д.

    Но все эти подходы давали нам не больше информации, чем любые саундбиты и кликбейты, пока не явились Сильвер и Маккен.

    Они задали интересные для бизнеса вопросы. Вместо вопроса о популярных, странных, модных, особенных для того или иного периода именах, эти два специалиста по данным вывернули вопрос наизнанку и постарались выяснить, можно ли извлечь из имени человека информацию о годе его рождения.

    Такая формулировка сразу же напоминает о других рациональных задачах: определении религии или родного языка по имени человека, выбору места проживания и т. д. (На практике легче выяснить возраст, чем язык или религию.) Умные компании использует подобного рода демографические данные, чтобы усилить сегментацию покупателей. Если вы приобретали такие базы данных, то уже получали выгоду от типа анализа, предложенного Сильвером и Маккен.

    Они привлекли дополнительные данные. Редко случается так, чтобы все необходимые для решения конкретной проблемы данные сосредотачивались в одной базе. Архив Управления соцстрахования содержит полную информацию по рождениям, но не по смертям. Если выводить средний возраст живущих в настоящее время Елизавет только на основании дат рождения, результат будет сильно завышен, поскольку многих из этих женщин давно уже нет. Для правильного проведения анализа Сильвер и Маккен добавили также таблицы вероятности дожития из страховых компаний, по которым подсчитывается средняя продолжительность жизни.


    Они заполнили пробелы в данных. Но составители таблиц в страховых компаниях не интересуются именами — они расписывают вероятность дожития по полу, но не по именам. В такой ситуации аналитику оставалось либо отказаться от проекта, либо сделать смелое предположение и совершить прорыв. Сильвер и Маккен выбрали второй путь, допустив, что от имени вероятность дожития не зависит. Это смелое предположение, но, на мой взгляд, с ним можно согласиться, потому что оно позволяет довести анализ до удовлетворительных результатов. Аналитики данных часто сталкиваются в своей работе с необходимостью принятия подобных решений.

    Они указали допустимую погрешность. Наглядная инфографика исследования Сильвера и Маккен четко указывает допустимую погрешность в ситуации, когда по имени человека пробуют угадать его возраст. Они оговаривают, что точность зависит от пола и от характера трендов. Порой установить возраст (в пределах 10 лет) удается с точностью до 50%. Слишком часто в журналистских публикациях об анализе больших данных отсутствует как раз анализ точности (поразительно, учитывая, как они восхваляют научную методику).

    Все перечисленные здесь решения можно прекрасно применить в любой бизнес-аналитике. Не нужно порождать лишние килобайты бесполезной для бизнеса информации. Аналитикам следует на первых же этапах работы проконсультироваться с заказчиками исследования и найти представляющую общий интерес проблему. Хотя многие современные базы данных огромны, все же и там может недоставать каких-то существенных фактов и потребуются дополнения.

    Анализ больших данных представляет ценность, поскольку позволяет делать надежные прогнозы, но аналитики обязаны предусмотреть также пределы допустимой погрешности. Здравые решения в бизнесе требуют учета не только наиболее перспективных сценариев, но и целого спектра вероятностей. По мере того, как развивается сбор и анализ данных, наладится и процесс создания ценных для бизнеса гипотез. И встречи, посвященные анализу данных, уже не будут вызывать взаимного разочарования.


    Источник

    Share |

     

    Версия для печати

    Читайте также
    Вовлечение менеджмента в HR-процессы, или один в поле не воин

    Любая HR-инициатива, как водится, нуждается в поддержке менеджеров. Понятно, что надо заручаться согласием ключевых менеджеров – топ-менеджеров, находить агентов влияния и тому подобное. Это прописная истина, известная каждому.
    Как стать высокопроизводительной организацией

    Различные исследования HPO (High performing organizations, высокопроизводительные организации) показывают, что только около 6% компаний в мире являются высокопроизводительными, 72% — «серые», посредственные компании, которые могут быть прибыльными, но до высокопроизводительных им далеко. Остальные 12% находятся на разных стадиях в процессе перехода к high performing. Исследования показывают, что переход из пункта A (серость, посредственность, контролирующая компания) в пункт B занимает около 300 лет. Не многие компании столько живут.

    Как убить мотивацию сотрудников
    Как убить мотивацию сотрудников

    Если задаться целью, то заставить персонал потерять всякое желание работать можно в два счета. Список самых эффективных мер, благодаря которым подчиненные побегут из вашей компании как крысы с тонущего корабля, предлагает Галина Царькова.


    Защита от критических манипуляций
    Защита от критических манипуляций по модели «открытая дверь»

    Нередко люди используют критику для того, чтобы добиться от нас выгодных для себя уступок или просто для того, чтобы испортить нам настроение. Независимо от того, хочет ли оппонент нас вывести из себя намеренно или делает это непроизвольно, мы имеем полное право не позволять ему портить нам настроение. Для этого мы продолжаем взаимодействие с ним, оберегая собственное душевное равновесие, используя при этом хорошо себя зарекомендовавшую стратегию «открытая дверь». Основная ее идея состоит в том, что, когда критикующий готовится «взламывать дверь», она оказывается открытой.


    Способы удержания внимания при публичном выступлении
    Способы удержания внимания при публичном выступлении

    Слушатели с напряженным вниманием следят за таким выступлением, при котором в излагаемом материале все время раскрывается новое содержание. Если выступление не содержит ничего нового, оно не только остается без внимания, но и вызывает у слушателей ощущение скуки. Как же сохранить и поддержать их внимание в течение всего выступления? Рассмотрим кратко основные факторы: темп и паузы, диалог с аудиторией, логическую организацию и драматизацию речи, эмоциональные приемы и убежденность оратора, и пр.

    Имя 
    Пароль  забыли?
    Присоединяйтесь!

    Новые материалы

       Плохое обращение с кандидатами на вакансии может дорого обойтись компании
       Почему секреты успешных людей и компаний вам не помогут
       Концепция Индустрии 4.0
       11 книг из обязательного списка Гарвардской школы бизнеса
       Команда студентов Вышки создало приложение для мониторинга вовлеченности аудитории

    Семинар
    "HR-Аналитика в R"

    Москва,20-21 июня


    ______________________________

    ВНИМАНИЕ
    Желаете узнать свою стоимость на рынке?

    Сколько я стою на рынке
    ______________________________
     
    Подпишитесь на
    рассылку
    Вебинары HRM

    *Подписка на НОВОСТИ HRM
    Пожалуйста, укажите ваш e-mail адрес:
      


    Последние комментарии

       ну а дальше творите..... выбирайте в зависимые переменные ту (те-), что вам кажутся наиболее корретными в...
       Да, конечно))
       вы, видимо, социолог))) еще у меня вопрос: а у вас в excel установлена надстройка Анализ данных?
       Работаю в программе excel. Панельные данные-это данные, которые размещены во времени и пространстве)...
       и после того, как написали коммент, не нажимайте - обновить страницу))) иначе ваш коммент задваивается)
    Все статьи


    Интервью




    Публикую статью Алексея Королькова с видеокомментарием
    все интервью


    О проекте      Реклама       Подписка       Контакты       Rambler's Top100 Яндекс цитирования ©2000-2011, HRM