Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
New method to create relightable 3D selfies from Samsung AI (Moscow). You have: single smartphone video of a head with blinking flash. You get: sharp renderings under any lighting and from any viewpoint.

saic-violet.github.io/relightable-portrait
arxiv.org/abs/2012.09963
Закон о больших числах и Центральная предельная теория находятся в центре статистики, анализа данных и большей части науки о данных.

http://bit.ly/3nw1bWR
Про приложения графовых сеток в биологии, физики, системах рекомендации и других областях.

http://bit.ly/38VWRvL
Приличная статья про сравнение разных реализаций градиентного бустинга

https://bit.ly/2Y2rWYw
Как IT-ные вещи меняли мир науки и о важности CS

https://www.nature.com/articles/d41586-021-00075-2
Очень классная серия постов по кластеризации. Многие вещи объясняются "на пальцах".

https://habr.com/ru/post/340360/
Неплохой сайт с задачами по SQL, чтобы набить руку. Решения в премиуме, но они не так уж и нужны.

https://sqlpad.io/
Изображение генотипов народов Европы с помощью метода главных компонент

https://www.nature.com/articles/nature07331
Хороший курс по глубокому обучению

http://bit.ly/2NkqRZV
Госдума принимает закон, запрещающий ученым читать лекции без справки от правительства...
Интересное выступление SJW в MS Research про причины успеха взрослых в контексте условий в детстве

https://youtu.be/EcMKLwVlpJk
#top@datamining.team

ТОП 5 постов за январь

1)Неплохой сайт с задачами по SQL, чтобы набить руку. Решения в премиуме, но они не так уж и нужны.

https://sqlpad.io/

2) Хороший курс по глубокому обучению

http://bit.ly/2NkqRZV

3) Статья с подробным примером настройки интерактивного дашборда с помощью dash

http://bit.ly/3hCzpGQ

4) Закон о больших числах и Центральная предельная теория находятся в центре статистики, анализа данных и большей части науки о данных.

http://bit.ly/3nw1bWR

5) Госдума принимает закон, запрещающий ученым читать лекции без справки от правительства...

https://novayagazeta.ru/articles/2021/01/19/88778-konets-epohi-prosvescheniya
Sequence-to-sequence модели (seq2seq) – это модели глубокого обучения, достигшие больших успехов в таких задачах, как машинный перевод, суммаризация текста, аннотация изображений и др. Так, например, в конце 2016 года подобная модель была встроена в Google Translate.

Перевод статьи по ссылке:
http://bit.ly/3j60DpS
Autoregressive Transformers have taken over the world of Language Modeling (GPT-3). However, in order to train them, people use causal masking and sample parallelism, which means computation only happens in a feedforward manner. This results in higher layer information, which would be available, to not be used in the lower layers of subsequent tokens, and leads to a loss in the computational capabilities of the overall model. Feedback Transformers trade-off training speed for access to these representations and demonstrate remarkable improvements in complex reasoning and long-range dependency tasks.

https://youtu.be/zdb8MM94A5c
https://arxiv.org/abs/2002.09402
Примеры кода на Pytorch с разъяснением

https://nn.labml.ai/
Библиотека, которая сгенерирует дашборд с объяснениями вашей модели

explainerdashboard is a library for quickly building interactive dashboards for analyzing and explaining the predictions and workings of (scikit-learn compatible) machine learning models, including xgboost, catboost and lightgbm. This makes your model transparant and explainable with just two lines of code.

https://explainerdashboard.readthedocs.io/en/latest/
Интересная статья про попытку обучить алгоритм оценивать «надёжность» человека по его лицу

http://bit.ly/39Sy3Wf
Бесплатный курс - "Анализ Данных просто и доступно".
Доступен на платформах: ютуб или степик

https://www.youtube.com/playlist?list=PLUfHxBkkFMSfvgd_rAzt8iM9foo9sbcFx
Департамент информационных технологий Москвы решил создать за 185 миллионов рублей подробную и персонализированную базу данных о каждом жителе города.

https://mdza.io/sTpZgV9qS3k