#R #shiny #Корреляция и размер выборки: волнение в океане личностных факторов (см. дискуссию на форуме ЭСПП http://forum.ht-line.ru/threads/volnenie-v-okeane-lichnostnyx-faktorov.1562/).
4 года назад сделал анимацию в виде shiny-приложения, которая демонстрирует влияние выборочных флуктуаций на корреляционную структуру пунктов личностного опросника (набор данных bfi из пакета psych). Из генеральной совокупности в 2800 человек случайным образом извлекаются выборки испытуемых (слайдер - 'Случайных выборок') по N человек в каждой (слайдер - 'Размер выборки'). На выборке вычислялись корреляции между 10 вопросами - на Экстраверсию (E1-E5) и Нейротизм (N1-N5). Сила связи отражается насыщенностью цвета, направление - цветом (отрицательные связи обозначаются оттенками синего).
http://hr-datalab.ru/corplot/
4 года назад сделал анимацию в виде shiny-приложения, которая демонстрирует влияние выборочных флуктуаций на корреляционную структуру пунктов личностного опросника (набор данных bfi из пакета psych). Из генеральной совокупности в 2800 человек случайным образом извлекаются выборки испытуемых (слайдер - 'Случайных выборок') по N человек в каждой (слайдер - 'Размер выборки'). На выборке вычислялись корреляции между 10 вопросами - на Экстраверсию (E1-E5) и Нейротизм (N1-N5). Сила связи отражается насыщенностью цвета, направление - цветом (отрицательные связи обозначаются оттенками синего).
http://hr-datalab.ru/corplot/
#психометрика #монте_карло #R #shiny #тесты Сделал еще одну маленькую интерактивную визуализацию http://hr-datalab.ru/test_scale/ к одной из дискуссий на форуме ЭСПП. Применяем метод Монте-Карло, то есть метод моделирования (в данном случае распределения тестовых баллов и изучаем влияние артефакта случайного угадывания в зависимости от длины теста (см. Подробнее http://forum.ht-line.ru/threads/dlina-testovoj-shkaly-granicy-ocenok-i-metod-monte-karlo.2246/#post-19582)
#психометрика #тесты #IQ #распределения #визуализация На фб-странице компании BSSL встретился очень хороший популярный текст "Что такое IQ?", в котором доступно рассказывается про IQ баллы. Я решил сделать интерактивную визуализацию к данной статье: https://psych.shinyapps.io/distiqscores/
#предиктивная_аналитика Эрик Сигель прекрасен! В этом видео простыми словами объясняет, почему компьютеры предсказывают смерть человека
https://youtu.be/_4q7FrPWqF8
Видео на английском, но никто не мешает включить субтитры и перевод субтитров.
Если не читали его "Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, Or Die", то бегом за изданием на русском (см. пост выше про книгу) -- "Просчитать будущее. Кто кликнет, купит, соврет или умрет"
https://youtu.be/_4q7FrPWqF8
Видео на английском, но никто не мешает включить субтитры и перевод субтитров.
Если не читали его "Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, Or Die", то бегом за изданием на русском (см. пост выше про книгу) -- "Просчитать будущее. Кто кликнет, купит, соврет или умрет"
YouTube
Five Reasons Computers Predict When You'll Die – The Dr. Data Show
Want to learn more about machine learning from Dr. Data? His three-course series, "Machine Learning Leadership and Practice – End-to-End Mastery", covers everything he covered in The Dr. Data Show, plus a whole lot more. TO ACCESS: http://www.MachineLearning.courses…
#юмор #пятничное
Кагэбэшное: "Ни одни данные не скроются. Будем их пытать, пока не признаются"
Гоп-аналитика: "Статистически значимые различия есть? Нет? А если найду?"
Кагэбэшное: "Ни одни данные не скроются. Будем их пытать, пока не признаются"
Гоп-аналитика: "Статистически значимые различия есть? Нет? А если найду?"
#юмор #аналитики_тоже_шутят Баловства ради в течение недели фиксировал, сколько я съел конфет "Метелица-сказочница" и свое самочувствие. Помним, что корреляция -- не причина. Шутки шутками, а мораль: не считайте корреляцию между ежемесячной текучестью персонала и прибылью организации, как это рекомендуют некоторые аналитики.
PS: я очень люблю конфеты
PS: я очень люблю конфеты
#оценка_персонала #hippo #тесты #стандарт_тестирования #размышлизмы Пока все пытаются осмыслить хайп по поводу hr analytics, я хотел бы обратить внимание на другой аспект проблемы "реальной" работы данными и аналитики для решения эйчарских задач: в моем опыте оценщика часто встречались ситуации, например, когда оцениваемый сотрудник получил низкие результаты по тестам, что явно не соответствовало ожиданиям его руководителя. Естественная реакция: "Ну, Вы же понимаете, надо перетестировать ...". Уверен, большинство эйчаров-оценщиков, особо не задумываясь, соглашаются с руководителем и назначают перетест. ("Клиент всегда прав!"). Только это порочная практика, которая полностью дискредитирует саму процедуру тестирования и независимой оценки. Именно по этой причине во многих организациях тяжело идёт (или никогда не будет) hr аналитики. Данные противоречат интуиции и опыту HiPPO -- тем хуже для данных! Какая там аналитическая культура!? С HiPPO невозможно спорить!
Как влияет повторное тестирование на результат, я показывал выше на примере теста СНИП (https://news.1rj.ru/str/c/1192333141/37), где мы сравнивали распределения тестового балла (первая попытка и повторные попытки).
Рекомендую также прочитать небольшую статью в блоге Юрия Шатрова (ЭКОПСИ) о том, что такое повторное тестирование и каковы могут быть последствия, в каких случаях оно может быть допустимо. (https://assessment.livejournal.com/5914.html)
Как влияет повторное тестирование на результат, я показывал выше на примере теста СНИП (https://news.1rj.ru/str/c/1192333141/37), где мы сравнивали распределения тестового балла (первая попытка и повторные попытки).
Рекомендую также прочитать небольшую статью в блоге Юрия Шатрова (ЭКОПСИ) о том, что такое повторное тестирование и каковы могут быть последствия, в каких случаях оно может быть допустимо. (https://assessment.livejournal.com/5914.html)
Livejournal
Всех не перетестировать: В каких ситуациях можно назначать повторную оценку?
В 90-х годах исследователи пришли к удивительному открытию. С каждым прохождением теста MMPI человек диагностировался с меньшим количеством психических заболеваний (Kelley, Jacobs Farr, 1994). В этот момент практики задались вопросом: как перетест влияет…
#ТЕЗАЛ #HRу_на_заметку Чем полезна HR-менеджеру система ТЕЗАЛ, или о женском творчестве в представлениях о "супер-менеджере" ;)
О чем нам говорит объявление?
1) При конверсии в БигФайв получился следующий профиль:
Активность (Экстраверсия) = 20
Миролюбие (Согласие) = 1
Сознательность = 5
Стабильность = 10
Новаторство = 21
2) Результат дефакторизации (обратной конверсии профиля в словник):
Конструктивный, Подвижник, Обольстительный (?), Дельный,
Созидатель, Неотразимый (?), Вольнодумец (?), Приметливый (?),
Стратег, Жизнелюбивый,Умелый.
Видим, по списку дефакторизации, что профиль отражает ...гм...
женское творчество в представления о "супер-менеджере". Он получился весьма похожим на... супер-любовника (!?)
34 Результат конверсии буферного списка в профиль 16PF:
А = 15 (общительность)
В = 54 (интеллект)
С = 36 (эмоциональная стабильность)
Е= 23 (доминантность)
F = 1
G = 21 (моралистичность)
H = 31 (социальная смелость)
I = -20 (мужественность)
L = 6 (незначительная подозрительность)
M = -17 (практичность)
N = 10 (воспитанность)
O = 4
Q1= 25 (новаторство)
Q2 = 14 (самодостаточность)
Q3 = 31 (организованность)
Q4 = 20 (стремление к свершениям)
4) Результат обратной конверсии от профиля 16PF к прилагательным (результат дефактризации):
Умелец, Коммерсант, Продуктивный., Оперативный, Деловитый,
Смекалистый, Дееспособный, Жизнеспособный, Передовой,
Преуспевающий, Созидательный, Прогрессивный, Приметливый (?), Целеустремленный, Деловой.
Как видим по содержанию дефакторизации, более детальный профиль16PF лучше отразил сфокусированность на деловых чертах, а не на коммуникативно-личностных.
Спасибо Александру Георгиевичу Шмелеву за текст и анализ в системе ТЕЗАЛ.
См. подробный пример работы с ТЕЗАЛ: конверсии слов в объявлении-вакансии в факторные профили B5 и 16PF http://forum.ht-line.ru/posts/25161/
О системе ТЕЗАЛ и заявка на приобретение: http://tezal.tilda.ws/sponsor
О чем нам говорит объявление?
1) При конверсии в БигФайв получился следующий профиль:
Активность (Экстраверсия) = 20
Миролюбие (Согласие) = 1
Сознательность = 5
Стабильность = 10
Новаторство = 21
2) Результат дефакторизации (обратной конверсии профиля в словник):
Конструктивный, Подвижник, Обольстительный (?), Дельный,
Созидатель, Неотразимый (?), Вольнодумец (?), Приметливый (?),
Стратег, Жизнелюбивый,Умелый.
Видим, по списку дефакторизации, что профиль отражает ...гм...
женское творчество в представления о "супер-менеджере". Он получился весьма похожим на... супер-любовника (!?)
34 Результат конверсии буферного списка в профиль 16PF:
А = 15 (общительность)
В = 54 (интеллект)
С = 36 (эмоциональная стабильность)
Е= 23 (доминантность)
F = 1
G = 21 (моралистичность)
H = 31 (социальная смелость)
I = -20 (мужественность)
L = 6 (незначительная подозрительность)
M = -17 (практичность)
N = 10 (воспитанность)
O = 4
Q1= 25 (новаторство)
Q2 = 14 (самодостаточность)
Q3 = 31 (организованность)
Q4 = 20 (стремление к свершениям)
4) Результат обратной конверсии от профиля 16PF к прилагательным (результат дефактризации):
Умелец, Коммерсант, Продуктивный., Оперативный, Деловитый,
Смекалистый, Дееспособный, Жизнеспособный, Передовой,
Преуспевающий, Созидательный, Прогрессивный, Приметливый (?), Целеустремленный, Деловой.
Как видим по содержанию дефакторизации, более детальный профиль16PF лучше отразил сфокусированность на деловых чертах, а не на коммуникативно-личностных.
Спасибо Александру Георгиевичу Шмелеву за текст и анализ в системе ТЕЗАЛ.
См. подробный пример работы с ТЕЗАЛ: конверсии слов в объявлении-вакансии в факторные профили B5 и 16PF http://forum.ht-line.ru/posts/25161/
О системе ТЕЗАЛ и заявка на приобретение: http://tezal.tilda.ws/sponsor
#хи_квадрат_спасет_hr_аналитику #хи_квадрат #номограмма Один известный HR аналитик постоянно сетует, что хи-квадрат эйчары освоить не могут ( "вы хоть Хи квадрат сделайте, лишь бы это работало и приносило пользу"). Проще надо быть -- учить как пользоваться номограммой (см. В Википедии: https://ru.m.wikipedia.org/wiki/%D0%9D%D0%BE%D0%BC%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0) для вычисления критерия хи-квадрат, и люди (эйчары) потянутся.
Номограмму на рисунке можно использовать для приближенного вычисления некоторых величин, которые нужны для вычисления хорошо известного критерия согласия Пирсона. Эта номограмма показывает применение кривых шкал с нелинейной градуировкой.
Соответствующее выражение
(observed - expected)^2/expected
Шкала сверху соответствует пяти различным интервалам наблюдаемых значений — A, B, C, D и E. Наблюдаемое значение ищется среди этих значений и выбирается метка над ним. Затем на соответствующих кривых шкалах выбирается ожидаемое значение. Например, для наблюдаемого значения 9 выбирается метка на числом 9 в интервале A, а кривая шкала A используется для ожидаемого значения. Для наблюдаемого значения 81 будет использована метка над 81 в интервале E и кривая шкала E будет использована для ожидаемого значения. Это позволяет несколько номограмм вместить в одну диаграмму.
На рисунке синяя линия показывает вычисление
(9 − 5)^2 / 5 = 3.2
а красная — вычисление
(81 − 70)^2 / 70 = 1.7
Для проведения теста часто используется поправка Йейтса, просто вычитается 0.5 из наблюдаемых значений. Номограмма для критерия с поправкой Йетса может быть построена просто сдвигом каждой шкалы "наблюдений" на половинку единицы влево, так что вместо 1.0, 2.0, 3.0, ... появятся значения 0.5, 1.5, 2.5, ....
Номограмму на рисунке можно использовать для приближенного вычисления некоторых величин, которые нужны для вычисления хорошо известного критерия согласия Пирсона. Эта номограмма показывает применение кривых шкал с нелинейной градуировкой.
Соответствующее выражение
(observed - expected)^2/expected
Шкала сверху соответствует пяти различным интервалам наблюдаемых значений — A, B, C, D и E. Наблюдаемое значение ищется среди этих значений и выбирается метка над ним. Затем на соответствующих кривых шкалах выбирается ожидаемое значение. Например, для наблюдаемого значения 9 выбирается метка на числом 9 в интервале A, а кривая шкала A используется для ожидаемого значения. Для наблюдаемого значения 81 будет использована метка над 81 в интервале E и кривая шкала E будет использована для ожидаемого значения. Это позволяет несколько номограмм вместить в одну диаграмму.
На рисунке синяя линия показывает вычисление
(9 − 5)^2 / 5 = 3.2
а красная — вычисление
(81 − 70)^2 / 70 = 1.7
Для проведения теста часто используется поправка Йейтса, просто вычитается 0.5 из наблюдаемых значений. Номограмма для критерия с поправкой Йетса может быть построена просто сдвигом каждой шкалы "наблюдений" на половинку единицы влево, так что вместо 1.0, 2.0, 3.0, ... появятся значения 0.5, 1.5, 2.5, ....
#пятничное #юмор В честь окончания трудовой недели, вот вам немного суровых аналитических будней от тираннозавра Рекса. (Автор: @threddyrex, перевод: Наталья Киселева)
#аналитика_для_жизни Что такое аналитика, зачем нужна аналитика, а также почему журналистика данных в тренде? Берем данные из спортивного трекера Starva, в котором бегуны указывают дистанцию, время её преодоления, а также зачастую модель кроссовок. Анализируем :) Получаем итог: определенная модель кроссовок бегунов значительно улучшают их результаты. Международная ассоциация легкоатлетических федераций уже думает над запретом бега в высокотехнологичных кроссовках...
#НЕпопулярная_тестология Учитесь! Вот как надо позиционировать свои доморощенные тесты: "является мощным инструментом с более чем 50-летней историей исследований на основе различных теорий и статистик. Родоначальниками исследований в этой области можно назвать древнегреческих ученых Эмпедокла и Гиппократа. Впоследствии на теорию оказали влияния Карл Юнг, Уильям Марстон, Вальтер Кларк, Джон Грейер и другие. Исследование системы <...> имеет сертификат ISO9001, согласно ему, валидность теста составляет более 90%."
Я бы еще им слоган предложил: "Видим людей насквозь, ибо стоим на плечах Эмпедокла и Гиппократа"!
Ключевые слова: "мощный инструмент" на "основе теорий и статистик(!)", "сертификат", "валидность более 90%"
Картинка к тексту: (С) Юра Шатров
Я бы еще им слоган предложил: "Видим людей насквозь, ибо стоим на плечах Эмпедокла и Гиппократа"!
Ключевые слова: "мощный инструмент" на "основе теорий и статистик(!)", "сертификат", "валидность более 90%"
Картинка к тексту: (С) Юра Шатров
#оценка #тестирование #стандарты В 1917 году началась практика группового тестирования интеллекта новобранцев, которые сидели на полу.
Не совсем подходящие условия тестирования по действующим стандартам тестирования.
Между прочим, кто еще не в курсе, в 2015 году в России вышел "Российский стандарт тестирования персонала" http://orgpsyjournal.hse.ru/2015-5-2/152057297.html
Источник картинки: Psychological Testing and Assessment: An Introduction to Tests and Measurement 7th Edition (Cohen−Swerdlik)
Не совсем подходящие условия тестирования по действующим стандартам тестирования.
Между прочим, кто еще не в курсе, в 2015 году в России вышел "Российский стандарт тестирования персонала" http://orgpsyjournal.hse.ru/2015-5-2/152057297.html
Источник картинки: Psychological Testing and Assessment: An Introduction to Tests and Measurement 7th Edition (Cohen−Swerdlik)
"Let my dataset change your mindset" (c) Hans Rosling Он превращал цифры в музыку, боролся с искажением фактов, сам себя он не считал ни пессимистом, ни оптимистом, а называл себя "поссибилистом" (possibilist). Он был самым настоящим “волшебником”, заставлявшим данные танцевать. В искусстве жонглирования статистическими данными ему нет равных. Журнал Foreign Policy включил Ханса Рослинга в рейтинг 100 мыслителей, имеющих “большие идеи” и оказавших влияние на мир в 2009 году. Его лекции отличались особой энергетикой, динамикой и экспрессией, свидетельствующих о том, что он действительно понимает, о чем говорит. Кстати, в одном из своих выступлений Ханс даже продемонстрировал искусство глотателей мечей, после чего аудитория аплодировала стоя. Для всех, кто работает с данными, его слова "Let my dataset change your mindset" – должны быть девизом. https://www.youtube.com/watch?v=jbkSRLYSojo
#пятничное в #четверг #опрос Друзья, приглашаю принять участие в серьезном опросе на не очень серьезную тему (или в не очень серьезном опросе на очень серьезную тему), всем заполнившим опрос в конце будет ссылка на видео по теме опроса :)
https://forms.gle/KbKjE8wyFktb1zEE7 Через 1 месяц посмотрим результаты.
https://forms.gle/KbKjE8wyFktb1zEE7 Через 1 месяц посмотрим результаты.
#аналитик_рекомендует Книжка про оружие математического поражения -- она о том, как алгоритмы превратились в опасное оружие в руках государства и корпораций, как они поражают в основном самые бедные и незащищённые слои населения. Книжка о том, как модели "черного ящика" выносят вердикты, подчас очевидно ошибочные и вредные, но их решения обжалованию не подлежат и являются окончательными, тем самым оказывая разрушительное влияние на судьбы людей. Увлекательный рассказ о том как работают алгоритмы, использующиеся полицией, страховыми компаниями, банками и другими организациями и какой вред они могут нанести.