Визуализации распространения заражения при вакцинации - https://www.reddit.com/r/dataisbeautiful/comments/5v72fw/how_herd_immunity_works_oc/
reddit
How Herd Immunity Works [OC]
Posted in r/dataisbeautiful by u/theotheredmund • 37,149 points and 2,061 comments
Еще одно пояснение про XGBboost - http://blog.kaggle.com/2017/01/23/a-kaggle-master-explains-gradient-boosting/?utm_source=Mailing+list&utm_campaign=b94a4a50dc-Kaggle_Newsletter_03-01-2017&utm_medium=email&utm_term=0_f42f9df1e1-b94a4a50dc-400801137 - хуже чем презентация его авторов...
Kaggle Blog
Official Kaggle Blog!
Forwarded from Spark in me
Если вы знаете прикладные алгоритмы, но не понимаете как работает один из самых "популярных" и "современных" сегодня алгоритмов машинного обучения
Forwarded from Spark in me
Для всех тех, кто пришел недавно - это просто канал-сборник реально интересных курсов, статей, алгоритмов, статистики. Всего, что относится к статистике, интернету, data science. Ведем вдвоем с девушкой без рассуждений в стиле "журналисты придумали".
Вольная цитатка человека из отдела DS тинькофф - на практике деревья используем только чтобы быстро понять есть что-то или нет. На практике в бою их тяжело поддерживать.
Пара интересных фактов по итогу общения с людьми из медиалогии: i) в день собирается 500k строк новостей и 50m строк из соцсетей ii) новости работают на большом количестве машин которые соединены на MySQL в большую виртуальную iii) новые проекты - PostgreSQL + Elastic Search + Hadoop iv) для старых продуктов используются ОЛАП системы, для новых иногда питон и Hadoop
Сайт с данными по Москве. https://data.mos.ru/ . Зашел в несколько - там вроде как все чисто и нормально, но на примере пары датасетов, которые в прошлом парсили, данных кажется на порядок меньше чем в гугл-картах или 2Gis.
mos.ru
Портал открытых данных Правительства Москвы
1246 наборов | Портал открытых данных Правительства Москвы является первым порталом открытых данных в России и был запущен для широкого круга пользователей 29 января 2013 года. На данный момент на портале опубликовано более 1000 наборов данных и справочников…
http://www.openhab.org/ - решение для интеграции разных источников данных + визуализация, если вы хотите отслеживать свой бойлер, к примеру...(сельский дом)
Про то, как люди коптятся, чтобы выиграть соревнование - http://blog.kaggle.com/2017/02/27/allstate-claims-severity-competition-2nd-place-winners-interview-alexey-noskov/
Medium
Kaggle Blog – Medium
Official Kaggle Blog ft. interviews from top data science competitors and more!
Отличный блог с описанием практического анализа данных, как по сути, так и с точки зрения задротства - https://habrahabr.ru/users/alexkuku/topics/
https://github.com/alexanderkuk/log-progress такое же решение для консоли которое я наковырял выглядит так - https://gist.github.com/snakers4/91fa21b9dda9d055a02ecd23f24fbc3d
GitHub
kuk/log-progress
https://habr.com/ru/post/276725/. Contribute to kuk/log-progress development by creating an account on GitHub.