#nightingale
Недавно в курсе Дьяконова в занятии по визуализации мы разбирали графики Флоренс Найтингейл (1820), и тут такое )
https://www.youtube.com/watch?v=Z-rxJeBEAFQ
Недавно в курсе Дьяконова в занятии по визуализации мы разбирали графики Флоренс Найтингейл (1820), и тут такое )
https://www.youtube.com/watch?v=Z-rxJeBEAFQ
YouTube
Как преобразовать и реформировать непрестижную профессию | Флоренс Найтингейл @Max_Katz
Благодаря новаторам то, что когда-то считалось ересью, в один день становится неотъемлемой частью повседневной жизни. Сегодняшняя история — о женщине-реформаторе, навсегда изменившей представления о больничном деле.
_________________________
Поддержать канал:…
_________________________
Поддержать канал:…
❤2
#ml #applied #dyakonov #pzad
Крайне интересная идея о дополнительных фичах: взять одномерный сигнал, предсказывать его на N шагов (каким-то простым способом), считать от такого прогноза разные метрики, и уже их использовать как фичи (ну и сами коэффициенты приближения). Высший пилотаж.
https://youtu.be/zX7hzjVBqeM?list=PLaRUeIuewv8CMFox0oEjlyePUhUmo-x0h&t=151
Крайне интересная идея о дополнительных фичах: взять одномерный сигнал, предсказывать его на N шагов (каким-то простым способом), считать от такого прогноза разные метрики, и уже их использовать как фичи (ну и сами коэффициенты приближения). Высший пилотаж.
https://youtu.be/zX7hzjVBqeM?list=PLaRUeIuewv8CMFox0oEjlyePUhUmo-x0h&t=151
YouTube
ПЗАД2020. Лекция 10. Качество в задачах классификации
курс "Прикладные задачи анализа данных", ВМК МГУ, Дьяконов Александр (https://dyakonov.org/ag/)
страница курса: https://github.com/Dyakonov/PZAD/blob/master/README.md
страница курса: https://github.com/Dyakonov/PZAD/blob/master/README.md
❤3
#gpt
"О своём опыте общения с ИИ агентству Bloomberg рассказал Майло Ван Слик (Milo Van Slyck), работающий помощником юриста в Чарльстоне (США, шт. Южная Каролина) — у него нестандартный подход к собственной идентичности, который не могут принять его родители, придерживающиеся характерных для южного штата традиционных ценностей. Пропустив встречу со своим психотерапевтом в начале апреля, Ван Слик решил обратиться к ChatGPT и обнаружил, что общение с ИИ дало ему ощущение психологического комфорта.
«Когда снова увидитесь с родителями, важно будет расставить приоритеты в ваших потребностях и благополучии. Подумайте, что вам нужно, чтобы ощущать комфорт и безопасность в их присутствии. Это нормально — устанавливать границы того, сколько времени вы с ними проводите, каких тем не следует касаться, и как они относятся к вам и вашей идентичности», — такой совет ChatGPT дал «пациенту», у которого назрел конфликт с родителями."
https://3dnews.ru/1085307/vmesto-pohoda-k-psihoterapevtu-lyudi-stali-obrashchatsya-k-chatgpt-hotya-posledstviya-mogut-bit-nepredskazuemimi
"О своём опыте общения с ИИ агентству Bloomberg рассказал Майло Ван Слик (Milo Van Slyck), работающий помощником юриста в Чарльстоне (США, шт. Южная Каролина) — у него нестандартный подход к собственной идентичности, который не могут принять его родители, придерживающиеся характерных для южного штата традиционных ценностей. Пропустив встречу со своим психотерапевтом в начале апреля, Ван Слик решил обратиться к ChatGPT и обнаружил, что общение с ИИ дало ему ощущение психологического комфорта.
«Когда снова увидитесь с родителями, важно будет расставить приоритеты в ваших потребностях и благополучии. Подумайте, что вам нужно, чтобы ощущать комфорт и безопасность в их присутствии. Это нормально — устанавливать границы того, сколько времени вы с ними проводите, каких тем не следует касаться, и как они относятся к вам и вашей идентичности», — такой совет ChatGPT дал «пациенту», у которого назрел конфликт с родителями."
https://3dnews.ru/1085307/vmesto-pohoda-k-psihoterapevtu-lyudi-stali-obrashchatsya-k-chatgpt-hotya-posledstviya-mogut-bit-nepredskazuemimi
3DNews - Daily Digital Digest
Все самое интересное из мира IT-индустрии
Самые интересные и оперативные новости из мира высоких технологий. На нашем портале - все о компьютерном железе, гаджетах, ноутбуках и других цифровых устройствах. А также обзоры новых игр, достижения современной науки и самые любопытные онлайн-проекты.
#vk
Давно пора было.
"При активном фильтре нецензурных выражений относящиеся к ненормативной лексике слова и выражения в публикациях и комментариях заменяются на набор символов. При необходимости пользователь сможет увидеть их в исходном виде — соответствующая плашка появляется при клике на скрытые системой слова.
Новая функция является частью общей стратегии платформы по формированию комфортной цифровой среды для всех пользователей. Ранее администрация соцсети предложила им функцию «Личное пространство», которая позволяет оградить себя от лишнего внимания и нежелательных собеседников; а также уведомления о подозрительных собеседниках в фирменном мессенджере."
https://3dnews.ru/1085326/polzovateli-vkontakte-teper-mogut-skrivat-nenormativnuyu-leksiku-v-publikatsiyah-i-kommentariyah
Давно пора было.
"При активном фильтре нецензурных выражений относящиеся к ненормативной лексике слова и выражения в публикациях и комментариях заменяются на набор символов. При необходимости пользователь сможет увидеть их в исходном виде — соответствующая плашка появляется при клике на скрытые системой слова.
Новая функция является частью общей стратегии платформы по формированию комфортной цифровой среды для всех пользователей. Ранее администрация соцсети предложила им функцию «Личное пространство», которая позволяет оградить себя от лишнего внимания и нежелательных собеседников; а также уведомления о подозрительных собеседниках в фирменном мессенджере."
https://3dnews.ru/1085326/polzovateli-vkontakte-teper-mogut-skrivat-nenormativnuyu-leksiku-v-publikatsiyah-i-kommentariyah
3DNews - Daily Digital Digest
Во «ВКонтакте» теперь можно скрыть ненормативную лексику в публикациях и комментариях
Администрация «ВКонтакте» предложила пользователям возможность скрывать ненормативную лексику в публикациях и комментариях на платформе — для этого в разделе настроек теперь предусмотрена соответствующая опция.
👎1
#hardware
"Новинка одной из первых на рынке предлагает поддержку разрешения 4K и частоты обновления 240 Гц. Яркость представленного дисплея составляет 400 кд/м2. Производитель также заявляет для дисплея скорость отклика в 1 мс и 95-процентный охват цветового пространства DCI-P3.
Показанная компанией 65-дюймовая панель поддерживает разрешение 7680 × 4320 (8K) и частоту обновления до 120 Гц."
https://3dnews.ru/1085319/auo-pokazala-novinki-s-antiblikovoy-tehnologiey-art-32dyuymoviy-4kmonitor-s-chastotoy-240-gts-i-65dyuymovuyu-8kpanel-s-chastotoy-120-gts
"Новинка одной из первых на рынке предлагает поддержку разрешения 4K и частоты обновления 240 Гц. Яркость представленного дисплея составляет 400 кд/м2. Производитель также заявляет для дисплея скорость отклика в 1 мс и 95-процентный охват цветового пространства DCI-P3.
Показанная компанией 65-дюймовая панель поддерживает разрешение 7680 × 4320 (8K) и частоту обновления до 120 Гц."
https://3dnews.ru/1085319/auo-pokazala-novinki-s-antiblikovoy-tehnologiey-art-32dyuymoviy-4kmonitor-s-chastotoy-240-gts-i-65dyuymovuyu-8kpanel-s-chastotoy-120-gts
3DNews - Daily Digital Digest
AUO показала дисплеи с антибликовой технологией A.R.T. — 32 дюйма с 4K и 240 Гц, а также 65 дюймов с 8K и 120 Гц
Контрактный производитель панелей для мониторов AU Optronics (AUO) показал на выставке Touch Taiwan 32- и 65-дюймовый дисплеи с новой антибликовой технологией Advanced Reflectionless Technology (A.
#gender
Обрабатываю результаты веб-опроса. В форме было поле "пол". Узнал много нового.
https://www.medicalnewstoday.com/articles/types-of-gender-identity#types-of-gender-identity
Обрабатываю результаты веб-опроса. В форме было поле "пол". Узнал много нового.
https://www.medicalnewstoday.com/articles/types-of-gender-identity#types-of-gender-identity
Medical News Today
Types of gender identity: Types and definitions
There are many types of gender identity. Learn more about their definitions, the difference between sex and gender, and how gender exists on a spectrum here.
⚡1👏1
#facebook
"Первыми под сокращения попали сотрудники кадровой службы, сейчас настал черёд технических специалистов, а в мае увольнения ждут работников бизнес-сегмента компании. По некоторым оценкам, в текущем раунде Meta* потеряет 4000 человек из запланированных 10 000. Многие теперь уже бывшие сотрудники компании публично сообщили о своих увольнениях в профессиональной соцсети LinkedIn и на других ресурсах. Одним из них стал глава подразделения, обеспечивающего благополучие пользователей платформ Meta* — оно производит «надзор за стратегией в области проблемного использования, запугивания и преследования, а также других ключевых вопросов». Компания также решила объединить подразделения, занимающиеся модерацией рекламы и пользовательского контента, хотя здесь никаких сокращений не будет.
В марте Цукерберг заявил, что в рамках реструктуризации будет произведено выравнивание организационной структуры Meta*, отменены менее приоритетные проекты, а также сокращены найм и кадровая служба компании. В общей сложности планируется увольнение примерно 10 000 человек и ликвидация 5000 вакансий. В ноябре компания анонсировала сокращения 11 000 человек, и до начала этой процедуры её численность на конец года была 86 482 человека. Это значит, что по окончании двух этапов увольнения в ней останутся около 66 000 сотрудников. Некоторые из попавших под сокращения въехали в США по рабочей визе H-1B, а значит, у них будет 60 дней, чтобы найти новую работу — в противном случае придётся покинуть страну.
Объявленному главой Meta* «году эффективности» предшествовал неудачный 2022 год, когда выручка компании упала на 4 %, а расходы выросли на 22 %. Это отчасти связано с изменениями политики конфиденциальности Apple iOS, которые обошлись гиганту соцсетей в $10 млрд. Ещё $13,7 млрд компания потеряла на подразделении Reality Labs, занимающемся разработками в сфере метавселенной — при этом Марк Цукерберг уже охладел к этому направлению и назвал новым приоритетом ИИ."
https://3dnews.ru/1085366/v-meta-nachalsya-ocherednoy-raund-sokrashcheniy-rabotu-poteryayut-tisyachi-tehnicheskih-spetsialistov
"Первыми под сокращения попали сотрудники кадровой службы, сейчас настал черёд технических специалистов, а в мае увольнения ждут работников бизнес-сегмента компании. По некоторым оценкам, в текущем раунде Meta* потеряет 4000 человек из запланированных 10 000. Многие теперь уже бывшие сотрудники компании публично сообщили о своих увольнениях в профессиональной соцсети LinkedIn и на других ресурсах. Одним из них стал глава подразделения, обеспечивающего благополучие пользователей платформ Meta* — оно производит «надзор за стратегией в области проблемного использования, запугивания и преследования, а также других ключевых вопросов». Компания также решила объединить подразделения, занимающиеся модерацией рекламы и пользовательского контента, хотя здесь никаких сокращений не будет.
В марте Цукерберг заявил, что в рамках реструктуризации будет произведено выравнивание организационной структуры Meta*, отменены менее приоритетные проекты, а также сокращены найм и кадровая служба компании. В общей сложности планируется увольнение примерно 10 000 человек и ликвидация 5000 вакансий. В ноябре компания анонсировала сокращения 11 000 человек, и до начала этой процедуры её численность на конец года была 86 482 человека. Это значит, что по окончании двух этапов увольнения в ней останутся около 66 000 сотрудников. Некоторые из попавших под сокращения въехали в США по рабочей визе H-1B, а значит, у них будет 60 дней, чтобы найти новую работу — в противном случае придётся покинуть страну.
Объявленному главой Meta* «году эффективности» предшествовал неудачный 2022 год, когда выручка компании упала на 4 %, а расходы выросли на 22 %. Это отчасти связано с изменениями политики конфиденциальности Apple iOS, которые обошлись гиганту соцсетей в $10 млрд. Ещё $13,7 млрд компания потеряла на подразделении Reality Labs, занимающемся разработками в сфере метавселенной — при этом Марк Цукерберг уже охладел к этому направлению и назвал новым приоритетом ИИ."
https://3dnews.ru/1085366/v-meta-nachalsya-ocherednoy-raund-sokrashcheniy-rabotu-poteryayut-tisyachi-tehnicheskih-spetsialistov
3DNews - Daily Digital Digest
В Meta началась очередная волна увольнений — работу потеряют тысячи технических специалистов
В среду компания Meta Platforms инициировала очередной раунд увольнений — на сей раз он коснётся преимущественно сотрудников на технических должностях.
❤1
#tesla #autopilot
Прям как я , когда оцениваю сроки выполнения работы.
"Летопись обещаний главы Tesla внедрить полный автопилот на электромобилях этой марки к концу года тянется c 2019 года, и поскольку сейчас в самом разгаре 2023 год, а соответствующая технология до сих пор не внедрена, Илону Маску (Elon Musk) на отчётной конференции Tesla на этой неделе пришлось давать новый прогноз на эту тему. Без привычной уверенности он заявил, что рассчитывает представить полный автопилот до конца текущего года."
https://3dnews.ru/1085370/o-vozmognosti-vnedrit-polniy-avtopilot-v-etom-godu-ilon-mask-zayavil-ne-stol-reshitelno-kak-ranshe
Прям как я , когда оцениваю сроки выполнения работы.
"Летопись обещаний главы Tesla внедрить полный автопилот на электромобилях этой марки к концу года тянется c 2019 года, и поскольку сейчас в самом разгаре 2023 год, а соответствующая технология до сих пор не внедрена, Илону Маску (Elon Musk) на отчётной конференции Tesla на этой неделе пришлось давать новый прогноз на эту тему. Без привычной уверенности он заявил, что рассчитывает представить полный автопилот до конца текущего года."
https://3dnews.ru/1085370/o-vozmognosti-vnedrit-polniy-avtopilot-v-etom-godu-ilon-mask-zayavil-ne-stol-reshitelno-kak-ranshe
3DNews - Daily Digital Digest
Илон Маск снова пообещал скорое внедрение полного автопилота, но уже не столь решительно, как раньше
Летопись обещаний главы Tesla внедрить полный автопилот на электромобилях этой марки к концу года тянется c 2019 года, и поскольку сейчас в самом разгаре 2023 год, а соответствующая технология до сих пор не внедрена, Илону Маску (Elon Musk) на отчётной конференции…
🤡1
#spacex #starship #astronomy #superheavy
"Уже тот факт, что ракета оторвалась от земли и пролетела несколько минут, является успехом для SpaceX — это ведь был лишь первый тест с запуском Starship в полностью собранном состоянии. Данные, собранные сегодня, помогут лучше подготовиться к следующим пускам. Starship состоит из огромного ускорителя (первой ступени), называемой Super Heavy, а также космического корабля (верхней ступени), известного как Starship. В текущем испытательном полете использовался 24-й прототипы корабля и седьмой ускорителя."
https://3dnews.ru/1085165/spacex-vpervie-zapustila-v-kosmos-ogromniy-raketu-starship
"Уже тот факт, что ракета оторвалась от земли и пролетела несколько минут, является успехом для SpaceX — это ведь был лишь первый тест с запуском Starship в полностью собранном состоянии. Данные, собранные сегодня, помогут лучше подготовиться к следующим пускам. Starship состоит из огромного ускорителя (первой ступени), называемой Super Heavy, а также космического корабля (верхней ступени), известного как Starship. В текущем испытательном полете использовался 24-й прототипы корабля и седьмой ускорителя."
https://3dnews.ru/1085165/spacex-vpervie-zapustila-v-kosmos-ogromniy-raketu-starship
❤1
#astronomy #supernova
"Используя данные рентгеновской обсерватории NASA «Чандра» (Chandra) и других телескопов учёные обнаружили неизвестную ранее угрозу для жизни на планетах земного типа. На определённой фазе процесса образования сверхновых исходящее от области взрыва рентгеновское излучение способно уничтожить биологическую жизнь на планетах в радиусе до 100 световых лет и больше. Раньше это явление не принималось во внимание. Но теперь к нему надо отнестись со всей серьёзностью."
https://3dnews.ru/1085456/sverhnovie-okazalis-namnogo-opasnee-chem-schitalos-oni-sposobni-unichtogit-gizn-na-planetah-eshchyo-odnim-sposobom
"Используя данные рентгеновской обсерватории NASA «Чандра» (Chandra) и других телескопов учёные обнаружили неизвестную ранее угрозу для жизни на планетах земного типа. На определённой фазе процесса образования сверхновых исходящее от области взрыва рентгеновское излучение способно уничтожить биологическую жизнь на планетах в радиусе до 100 световых лет и больше. Раньше это явление не принималось во внимание. Но теперь к нему надо отнестись со всей серьёзностью."
https://3dnews.ru/1085456/sverhnovie-okazalis-namnogo-opasnee-chem-schitalos-oni-sposobni-unichtogit-gizn-na-planetah-eshchyo-odnim-sposobom
3DNews - Daily Digital Digest
Сверхновые способны уничтожать жизнь на планетах огромными дозами радиации на больших расстояниях
Используя данные рентгеновской обсерватории NASA «Чандра» (Chandra) и других телескопов учёные обнаружили неизвестную ранее угрозу для жизни на планетах земного типа.
#astronomy #ligo
Говорят, Россия на войну в день тратит ~$300M. Не на научные комплексы, не на улучшение жизни граждан, а на убийства и разрушения.
"Власти Индии выделят на реализацию проекта около $320 млн. Строительство будет вестись недалеко от города Аундха в индийском штате Махараштра. Это будет комплекс зданий, включая L-образный интерферометр с 4-километровыми рукавами. Проекты зданий уже завершены, дороги к объекту подведены, часть оборудования — вакуумные камеры — испытаны в лаборатории. Поскольку проект LIGO-India станет калькой с проекта LIGO-USA, то с передачей технологий и проектной документацией всё хорошо. Индийская сторона просто должна следовать проверенным рекомендациям и повторить уже реализованный проект."
https://3dnews.ru/1085462/v-indii-postroyat-sobstvenniy-detektor-gravitatsionnih-voln-eto-na-poryadok-uluchshit-tochnost-opredeleniya-istochnikov-sobitiy-v-nebe
Говорят, Россия на войну в день тратит ~$300M. Не на научные комплексы, не на улучшение жизни граждан, а на убийства и разрушения.
"Власти Индии выделят на реализацию проекта около $320 млн. Строительство будет вестись недалеко от города Аундха в индийском штате Махараштра. Это будет комплекс зданий, включая L-образный интерферометр с 4-километровыми рукавами. Проекты зданий уже завершены, дороги к объекту подведены, часть оборудования — вакуумные камеры — испытаны в лаборатории. Поскольку проект LIGO-India станет калькой с проекта LIGO-USA, то с передачей технологий и проектной документацией всё хорошо. Индийская сторона просто должна следовать проверенным рекомендациям и повторить уже реализованный проект."
https://3dnews.ru/1085462/v-indii-postroyat-sobstvenniy-detektor-gravitatsionnih-voln-eto-na-poryadok-uluchshit-tochnost-opredeleniya-istochnikov-sobitiy-v-nebe
3DNews - Daily Digital Digest
В Индии построят детектор гравитационных волн — это на порядок повысит точность определения источников событий в небе
Кабинет министров Индии одобрил строительство в стране собственного детектора гравитационных волн.
❤1
#truedetective #openings
Шедевр.
When the last light warms the rocks,
And the rattlesnakes unfold,
Mountain cats will come
To drag away your bones.
So rise with me forever,
Across the silent sand,
And the stars will be your eyes,
And the wind will be my hands...
https://www.youtube.com/watch?v=ZRPpCqXYoos
Шедевр.
When the last light warms the rocks,
And the rattlesnakes unfold,
Mountain cats will come
To drag away your bones.
So rise with me forever,
Across the silent sand,
And the stars will be your eyes,
And the wind will be my hands...
https://www.youtube.com/watch?v=ZRPpCqXYoos
❤1
Forwarded from Small Data Science for Russian Adventurers
#книга
Jakub M. Tomczak "Deep Generative Modeling"
По ощущениям это как раз книга для продвинутого ML, т.к. в стандартных программах не всегда глубокие генеративные модели подробно излагаются. Автор довольно известен, у него очень симпатичный сайт и доклады о генеративных моделях на разных научных школах. Там и блог есть, но в нём излагаются главы книги.
Минус у книги один:
- не смотря на объём, глубоко в специфику отдельных методов автор не погружается.
Зато много плюсов:
+ обзор всех популярных классов генеративных моделей;
+ для каждого класса даётся перечень приёмов/улучшений со ссылками на первоисточниками;
+ даны примеры кода.
Jakub M. Tomczak "Deep Generative Modeling"
По ощущениям это как раз книга для продвинутого ML, т.к. в стандартных программах не всегда глубокие генеративные модели подробно излагаются. Автор довольно известен, у него очень симпатичный сайт и доклады о генеративных моделях на разных научных школах. Там и блог есть, но в нём излагаются главы книги.
Минус у книги один:
- не смотря на объём, глубоко в специфику отдельных методов автор не погружается.
Зато много плюсов:
+ обзор всех популярных классов генеративных моделей;
+ для каждого класса даётся перечень приёмов/улучшений со ссылками на первоисточниками;
+ даны примеры кода.
❤1✍1
#ml #featureselection #experiment #advicewanted
Готовлю большое сравнение методов отбора признаков (Feature Selection) на синтетическом датасете (12k rows, 240 numerical columns, 7 categorical columns), сделанном из реального. Наблюдения я перемешиваю по каждому признаку, удаляя любые старые корреляции, но сохраняя распределения. Затем создаю точно известные вероятностные (нелинейные) связи таргета с небольшим количеством числовых и категориальных признаков, причём у большинства признаков связь формируется на всей области определения, у двух - только на тех наблюдениях, где их значения одновременно меньше их выборочных средних (а-ля Проблема XOR).
Задача бинарной классификации. Планирую 2 режима:
1) вероятность позитивного исхода ПОЛНОСТЬЮ определяется входами.
2) вероятность позитивного исхода лишь частично определяется входами (признаки сдвигают среднюю вероятность на 5-10%, имитируем неполную осведомлённость наблюдателя о всех влияющих факторах).
Всё это для 2 вариантов средней частоты позитивного класса: высокой, около 30%-50%, и низкой (несбалансированный набор), около 3%-5%.
Метрики хочу взять в вероятностном пространстве: BrierScore, CRPS. Можно добавить и "обычные" для классификации метрики (accuracy, precision, recall, f1, etc.), но в несбалансированном режиме при низкой частоте они будут иметь мало смысла из-за низкого % реализаций положительного класса.
Классификаторов хочу использовать несколько: логрег, лес, бустинг, бустинг с ранней остановкой (ES).
Методы FS: по сути хочу попробовать все из sklearn,+BorutaPy+BorutaShap. Как вариант, есть ещё идея своего multivariate filter: та же Mutual Information (MI), но над всеми парами фичей, вместо индивидуальных признаков (плюс свои тонкости для пар вида число-категория).
How the process is organized:
1) each estimator`s performance is shown on a CV using
1) all features
2) only influencing features
3) raw probability feature
4) features selected by the FS step in a pipeline
features selected on all CV subsets are reported along with their frequencies
5) features EXCEPT the influencing features
early stopping is used where possible, results are reported separately.
2) as a reference, Brier score of ideal (true) probs, shuffled probs, mean target freq are given
3) resulting variables impact is analyzed & reported.
libs used are SHAP and RAPIDS (cuml)
Если есть пожелания и советы к организации процесса, положительный опыт использования каких-то фичеселекторов, присылайте свои мудрые замечания в личку или комменты.
Готовлю большое сравнение методов отбора признаков (Feature Selection) на синтетическом датасете (12k rows, 240 numerical columns, 7 categorical columns), сделанном из реального. Наблюдения я перемешиваю по каждому признаку, удаляя любые старые корреляции, но сохраняя распределения. Затем создаю точно известные вероятностные (нелинейные) связи таргета с небольшим количеством числовых и категориальных признаков, причём у большинства признаков связь формируется на всей области определения, у двух - только на тех наблюдениях, где их значения одновременно меньше их выборочных средних (а-ля Проблема XOR).
Задача бинарной классификации. Планирую 2 режима:
1) вероятность позитивного исхода ПОЛНОСТЬЮ определяется входами.
2) вероятность позитивного исхода лишь частично определяется входами (признаки сдвигают среднюю вероятность на 5-10%, имитируем неполную осведомлённость наблюдателя о всех влияющих факторах).
Всё это для 2 вариантов средней частоты позитивного класса: высокой, около 30%-50%, и низкой (несбалансированный набор), около 3%-5%.
Метрики хочу взять в вероятностном пространстве: BrierScore, CRPS. Можно добавить и "обычные" для классификации метрики (accuracy, precision, recall, f1, etc.), но в несбалансированном режиме при низкой частоте они будут иметь мало смысла из-за низкого % реализаций положительного класса.
Классификаторов хочу использовать несколько: логрег, лес, бустинг, бустинг с ранней остановкой (ES).
Методы FS: по сути хочу попробовать все из sklearn,+BorutaPy+BorutaShap. Как вариант, есть ещё идея своего multivariate filter: та же Mutual Information (MI), но над всеми парами фичей, вместо индивидуальных признаков (плюс свои тонкости для пар вида число-категория).
How the process is organized:
1) each estimator`s performance is shown on a CV using
1) all features
2) only influencing features
3) raw probability feature
4) features selected by the FS step in a pipeline
features selected on all CV subsets are reported along with their frequencies
5) features EXCEPT the influencing features
early stopping is used where possible, results are reported separately.
2) as a reference, Brier score of ideal (true) probs, shuffled probs, mean target freq are given
3) resulting variables impact is analyzed & reported.
libs used are SHAP and RAPIDS (cuml)
Если есть пожелания и советы к организации процесса, положительный опыт использования каких-то фичеселекторов, присылайте свои мудрые замечания в личку или комменты.
👍5❤2✍1
#ml #ds #rookies
Меня спросили, с чего начинать обучение науке о данных.
Для начала советую
1) прочитать книжку Гвидо/Мюллера, она красиво иллюстрирована и хорошо раскрывает концепции. Также хороша книга Герона, там несколько посложнее и обширнее темы раскрыты. Они обе есть на русском, кажется.
2) лекции А. Дьяконова (МЛ и ПЗАД), если есть желание забуриться в теорию, то и К. Воронцова
3) параллельно этому советую всё же курсы, я знаю 2 хороших источника: ОТУС (там есть 2 начальных, изучите программы) и А. Груздева (у него есть материалы на Бусти и индивидуальное обучение). Только обязательно вовремя прорешивайте задачи и домашние работы, иначе не будет толку.
4) запишитесь в ШАД, это бесплатно и очень круто. но будет требовать много времени, скорее всего.
5) начните участвовать в соревнованиях Кэггл и им подобных российских (организаторами выступают наши бигтехи типа Сбербанк, Роснефть, МТС). Впрочем, на курсах из пункта 3 Вас и так заставят это сделать )
6) подпишитесь на towardsdatascience и подобные ему блоги медиума. контент там варьируется по качеству, но бывает, попадаются жемчужины.
7) есть ещё Хабр
8) начните делать свой пет-проект. если он окажется общественно-полезным и/или коммерчески выгодным, тем круче.
Меня спросили, с чего начинать обучение науке о данных.
Для начала советую
1) прочитать книжку Гвидо/Мюллера, она красиво иллюстрирована и хорошо раскрывает концепции. Также хороша книга Герона, там несколько посложнее и обширнее темы раскрыты. Они обе есть на русском, кажется.
2) лекции А. Дьяконова (МЛ и ПЗАД), если есть желание забуриться в теорию, то и К. Воронцова
3) параллельно этому советую всё же курсы, я знаю 2 хороших источника: ОТУС (там есть 2 начальных, изучите программы) и А. Груздева (у него есть материалы на Бусти и индивидуальное обучение). Только обязательно вовремя прорешивайте задачи и домашние работы, иначе не будет толку.
4) запишитесь в ШАД, это бесплатно и очень круто. но будет требовать много времени, скорее всего.
5) начните участвовать в соревнованиях Кэггл и им подобных российских (организаторами выступают наши бигтехи типа Сбербанк, Роснефть, МТС). Впрочем, на курсах из пункта 3 Вас и так заставят это сделать )
6) подпишитесь на towardsdatascience и подобные ему блоги медиума. контент там варьируется по качеству, но бывает, попадаются жемчужины.
7) есть ещё Хабр
8) начните делать свой пет-проект. если он окажется общественно-полезным и/или коммерчески выгодным, тем круче.
OZON.ru
Книга "Машинное обучение с помощью Python. Руководство для специалистов по работе с данными", Гвидо Сара, Мюллер Андреас - купить…
В наличии книга "Машинное обучение с помощью Python. Руководство для специалистов по работе с данными", Гвидо Сара, Мюллер Андреас, Диалектика-Вильямс в интернет-магазине OZON со скидкой! ✅ Реальные отзывы читателей, фото 🚚
❤🔥3👍1
❤1
#poetry
Нашел старенький стих, даже не помню, чей.
"Ты думаешь, ты счастлив,
И проживаешь жизнь сполна?
Дурак! твой день ужасен,
Кругом идёт война.
Везде одна разруха
Не веришь мне?
А зря.
На улице так глухо,
И на ушах у всех лапша.
Мой мир.
Здесь каждый верит в Бога.
Бог не имеет столько сил.
Ты в нищете, твой дом - берлога,
Увы, не Бог твой господин.
Пустынная алея,
Холодная зима прошла.
Так чем же мы болеем?
Откуда столько зла?
Плечом к плечу встречаясь,
Друг друга посылаем на.
Ты сам всё понимаешь,
Холодная идёт война.
Счастливая улыбка,
Печальные глаза.
Наш мир - всего ошибка,
Пустой, как и душа."
Нашел старенький стих, даже не помню, чей.
"Ты думаешь, ты счастлив,
И проживаешь жизнь сполна?
Дурак! твой день ужасен,
Кругом идёт война.
Везде одна разруха
Не веришь мне?
А зря.
На улице так глухо,
И на ушах у всех лапша.
Мой мир.
Здесь каждый верит в Бога.
Бог не имеет столько сил.
Ты в нищете, твой дом - берлога,
Увы, не Бог твой господин.
Пустынная алея,
Холодная зима прошла.
Так чем же мы болеем?
Откуда столько зла?
Плечом к плечу встречаясь,
Друг друга посылаем на.
Ты сам всё понимаешь,
Холодная идёт война.
Счастливая улыбка,
Печальные глаза.
Наш мир - всего ошибка,
Пустой, как и душа."
😢1
#bigquery #primarykeys
Офигеваю с Гугла. Многие годами жаловались, что в BigQuery нет первичных и внешних ключей.
И вот гугл их добавил. Теперь можно указать таблице primary key(x,y) not enforced. Not enforced прописано во всех примерах доки. Думаю, к чему бы это?
Опытным путём выяснилось, что ключи указать ты можешь, но проверять база их целостность за тебя не будет. На кой хер тогда такое "добавление" нужно? С таким созданным первичным ключом в базу спокойно добавляются дубликаты. Отлично, гугл.
https://www.datadice.io/blog/how-comprehensive-are-the-new-primary-keys-and-foreign-keys-in-bigquery
Офигеваю с Гугла. Многие годами жаловались, что в BigQuery нет первичных и внешних ключей.
И вот гугл их добавил. Теперь можно указать таблице primary key(x,y) not enforced. Not enforced прописано во всех примерах доки. Думаю, к чему бы это?
Опытным путём выяснилось, что ключи указать ты можешь, но проверять база их целостность за тебя не будет. На кой хер тогда такое "добавление" нужно? С таким созданным первичным ключом в базу спокойно добавляются дубликаты. Отлично, гугл.
https://www.datadice.io/blog/how-comprehensive-are-the-new-primary-keys-and-foreign-keys-in-bigquery
www.datadice.io
How comprehensive are the new Primary Keys and Foreign Keys in BigQuery? - datadice - Customized Data-Warehouse Solutions
Google is starting to add features from systems like MySQL. By Alexander Junke
❤1