Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Подборка из 5 библиотек для Python, которые в некоторых ситуациях позволят сэкономить время и не беспокоиться о некоторых вещах.

https://bit.ly/3wnkvKX
HuggingFace выпускает свой собственный курс покрывающие темы работы с их экосистемой

https://bit.ly/2TKh1DK
Видео-отчет Андрея Карпатого (Tesla) о процессе работы над беспилотными автомобилями.

https://bit.ly/3gPO6as
Facebook AI используют GrokNet для улучшения поиска вещей для покупок внутри Instagram и Facebook по фотографиям.

https://bit.ly/3j5lVGj
Бесплатня онлайн-книга для подготовки к собеседованию по машинному обучению. Содержит более двухсот вопросов разной степени сложности.

https://bit.ly/3db1pQE
Блог о работе над алгоритмом перефразирования русских текстов с использованием последних NLP методик.

https://bit.ly/35XPWjr
Copilot - расширение для VSCode от GitHub и OpenAI. Оно позволяет, с помощью ИИ, заканчивать код заранее за программиста, постепенно обучаясь откидывать ненужные варианты.

https://bit.ly/2TjLtFi
МФТИ и компания NVIDIA объявляют набор на стипендиальную магистерскую программу «Прикладное глубокое обучение»!

Магистранты приобретут бесценный опыт работы в международной команде IT-специалистов. Под руководством опытных инженеров-исследователей каждый студент будет погружаться в решение практических задач компании в одной из двух команд NVIDIA. В команде разговорного искусственного интеллекта идет работа над новыми моделями распознавания, синтеза речи, машинного перевода и обработки естественного языка, а команда Simulation Technology работает над нейросетевыми алгоритмами для 3D-анимации, симуляции, графики и генерации 2D/3D-контента.

Кандидаты, успешно прошедшие все этапы отбора, получат гранты на обучение от NVIDIA, а также высокую ежемесячную стипендию. Мотивированные выпускники программы смогут присоединиться к команде NVIDIA — им будет сделано предложение о работе.

Переходите на сайт и отправляйте заявку на участие в отборе!

http://nvidia-masterprogram.ru/
Парень измерил свой пульс во время защиты диссертации.

Он использовал пульсометр Garmin, импортировал данные в R и построил график с помощью ggplot2

https://redd.it/ntvmey
#top@datamining.team

ТОП 5 постов за июнь

1) Бесплатня онлайн-книга для подготовки к собеседованию по машинному обучению
https://bit.ly/3db1pQE

2) Свежая книга по машинному обучению "История о машинном обучении»: доступна бесплатно, покрывает множество базовых понятий вплоть до обучения с подкреплением
https://bit.ly/3go26Hi

3) Краткое пояснение отличий аналитика от "дата саентиста"
https://bit.ly/3wmkJlG

4) Подборка из 5 библиотек для Python, которые иногда позволят сэкономить время и не беспокоиться о некоторых вещах
https://bit.ly/3wnkvKX

5) Сайт, который позволяет генерировать рукописный текст из напечатанного. Технологию можно посмотреть в приложенном репозитории

Ссылка : https://bit.ly/3ggPhQl

Репозиторий : https://bit.ly/3weClQe
В Массачусетском технологическом институте ведется разработка исследовательских роботов, собирающих данные для морских ученых.

По словам аспиранта Виктории Престон, члена команды разработчиков, это действительно захватывающее время для робототехники, которая также заботится об окружающей среде.

«Я с нетерпением жду возможности продемонстрировать, как наши алгоритмические разработки работают на практике. Также здорово быть частью огромной, разнообразной группы, которая хочет попробовать это», - добавляет она

https://bit.ly/3hD97Ew
20-21 июля в OTUS пройдет открытый интенсив для тех, кто хочет работать с большими данными. После двухдневного обучения вы сможете выводить модель в продакшн с помошью AWS:
- Узнаете, как использовать lambda и нюансы работы с IoT данными
- Научитесь выводить модель в продакшн без сложных настроек системы
Кроме того, интенсив — это возможность попробовать онлайн-курс «Промышленный ML на больших данных».

Для участия в занятии пройдите вступительный тест https://otus.pw/k2rH/
Корнелльский университет опубликовал статью, где изучается сквозная токенизация подслов как часть модели.

Актуальность статьи в том, что современные модели обработки естественного языка полагаются на жесткие алгоритмы токенизации подслов. Это ограничивает их способность к обобщению и адаптации к новым параметрам.

https://arxiv.org/abs/2106.12672
«Введение в глубокое обучение и генеративные модели»

Курс глубокого обучения, охватывающий MLP, сверточные нейронные сети, рекуррентные нейронные сети, генеративные состязательные сети, автоэнкодеры, преобразователи и многое другое. Примеры кода есть в PyTorch

https://bit.ly/36ryap6
Введение в LSH

По отзывам пользователей, в данном блог-посте основы Locality-Sensitive Hashing преподносятся подробнее и нагляднее, чем в аналогичных источниках

http://tylerneylon.com/a/lsh1/
DAGsHub создали open-sourced обертку над git  и dvc 

Например, fds add = dvc add + git add + magic – команды выполнятся в правильном порядке.
Аналогично fds commit = dvc commit + git commit + magic

https://dagshub.com/pages/fds/
Интересный блог-пост с "выдуманной историей" на основе нескольких мест работы. Что делать тем, кто пришёл руководить командой DS в небольшой стартап, где есть проблемы с инфраструктурой и культурой работы с данными?

https://bit.ly/3yHmzhI
Статья про сравнение производительности TF1, TF2 и pyTorch

https://bit.ly/3hTt3mZ
Расширенный курс по Deep Learning (проектирование, визуализация, понимание DNN)

https://bit.ly/2T9Nzat
Где учиться биоинформатике в России?

Делимся с вами статьей Дианы Кондинской, руководителя отдела структурной биоинформатики BIOCAD, в которой она рассказывает про алгоритм AlphaFold2 от компании DeepMind: https://bit.ly/2VJSNuB

AlphaFold появился на свет благодаря тому, что члены его команды обладали компетенциями в области биологии, физики, математики, алгоритмов глубокого обучения и оптимизации — то есть в области вычислительной биологии. Этому мало где хорошо учат в мире и пока что нигде на достаточном уровне не учат в России.
В 2021 году компания BIOCAD совместно с Высшей школой экономики запускает первую магистерскую программу «Вычислительная биология и биоинформатика», в которой будут учить этим дисциплинам, столь необходимым для решения таких амбициозных задач.

📌Набор на программу уже идет и закончится 31 июля, узнайте больше о новой магистратуре на сайте: https://bit.ly/biocadhse

Задать интересующие вас вопросы можно в чате программы: https://bit.ly/3xBWXmh

Это промо пост