Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Профессия будущего в мехмате МГУ — теперь в онлайн-формате
МГУ и SkillFactory запускают онлайн-магистратуру "Искусственный интеллект и цифровые технологии". Для тех, кто хочет двигать Россию и мир в будущее.

Приходите к нам, чтобы получить:
▪️ Глубокое понимание принципов анализа данных и машинного обучения
▪️ Математическую базу мехматского уровня
▪️ Навыки решения исследовательских и практических задач с помощью ML-моделей и нейросетей
▪️ Практику и стажировку от корпоративных партнеров программы

И все это — онлайн. Материалы для обучения доступны на платформе 24/7. Вы можете сами выбрать группу с оптимальным временем практических занятий и семинаров. Гибкий график позволяет совмещать обучение с работой.

За 2 года вы успеете погрузиться в сферу, получить практический опыт в разработке ИИ и собрать 7+ проектов в портфолио. А по окончании обучения вас ждет диплом МГУ им. М.В. Ломоносова.

Узнайте, какие бонусы вас ждут как студента МГУ и как будет проходить ваше обучение, на сайте программы:
https://u.to/-DV4Gw
​​Ломай дату полностью: сравниваем подходы к качеству данных у крупных компаний (Lyft, Shopify) на Data Quality Meetup

статья
Яндекс вместе с учеными Оксфорда и Кембриджа проводит соревнование среди исследователей ML на базе самого большого в мире открытого датасета по беспилотным авто.

Зачем?
Повысить осведомленность о проблеме “сдвига данных” в машинном обучении.

Когда? Сейчас, в рамках NeurIPS 2021 - крупнейшей ML конференции в в мире.

В чем фишка? Машинное обучение сталкивается с испытанием – реальный мир почти бесконечно разнообразен, поэтому очень сложно просчитать все ситуации, в которые попадает алгоритм. Оказываясь в незнакомой среде, он начинает справляться с задачами хуже (например, модель машинного перевода классической литературы вдруг возьмется переводить твиты).

Важно, чтобы алгоритмы, попадая в реальный мир, были готовы справляться со сдвигом, который их там ждет. Беспилотникам Яндекса удалось собрать уникальный по наличию разных условий датасет – их авто набирались опыта и собирали данные в трех странах с разными особенностями манеры вождения, дорожных правил и погоды.


Что требуется? Разработать алгоритмы для предсказания поведения участников автомобильного движения, погоды или машинного перевода текстов.
Обучить их на предоставленных данных. Для этого Яндекс открыл доступ к трем датасетам с реальными данными из Погоды, Переводчика и по беспилотным автомобилям.

Проверить качество работы алгоритмов в условиях сдвига. Кстати, авторы самых успешных получат деньги, а решения можно будет применять и в других сферах, где есть проблема сдвига данных.

Хотели бы попробовать себя?
​​🤖 Метод k-ближайших соседей (k-nearest neighbour)

Метод k-ближайших соседей (k Nearest Neighbors, или kNN) – популярный алгоритм классификации, который используется в разных типах задач машинного обучения. Наравне с деревом решений это один из самых понятных подходов к классификации.
статья
​​🛠 Сложноструктурные аналитические отчеты с Python и LaTeX

В руководстве подробно рассматривается пример использования Python-библиотеки облачного представления приложений Streamlit и системы компьютерной вёрстки LaTeX для подготовки сложных аналитических отчетов с математическими, программными и графическими вставками.
Статья
​​🐦 BigBird от Google: еще одна важная веха в NLP?

Разбираемся, что такое Google BigBird, какие задачи она может решать, и насколько она важна для отрасли.
Статья
​​​​ Хотим обратить ваше внимание на полезный telegram-канал для обучения высокоуровневому языку программирования Python

На канале ежедневно публикуются задачи по Python и Machine Learning: алгоритмы, функции, классы, регулярные выражения, итераторы, генераторы, ООП, исключения, numpy, pandas, matplotlib, scikit-learn, TensorFlow и многое другое!

✔️Станьте специалистом по Python вместе с каналом "Задачи по Python и машинному обучению"
​​Над чем задуматься перед тем, как брать ML-задачу в работу.

Поток идей для ML-проектов огромный, но не все из них стоят того, чтобы за них браться. Некоторые с большей вероятностью принесут результат, а другие изначально обречены на провал....
статья
ИТ-компания Selectel приглашает на вебинар «Искусственный интеллект и Machine learning»

После вебинара вы сможете:

💥 наладить прозрачный R&D-процесс в командах
💥 получить нужный результат даже при низкой квалификации кадров
💥 провести оценку эффективности работы исследователей

Дата: 29 июля, четверг, 16:00 МСК

Спикеры: Алексей Гончаров, CEO в Machine Intelligence Laboratory, и Антон Чунаев, менеджер ML-продуктов в @selectelnews.

Подробности и регистрация по ссылке:

🚀 https://slc.tl/HKEgq
​​Уходим с Mercurial на Git

Так уж случилось, что у меня остался ряд репозиториев на Mercurial, которые захостил на Bitbucket много лет назад. Проекты перешли в полуархивное состояние, поэтому заглядывал в них не так уж и часто. И тут я решил обратиться к материалам, надо было внести правку...
статья
Заполни пробелы в знаниях в IT, дизайне, GameDev и вырасти до мидла за 1,5 месяца с помощью менторов Solvery и получи работу мечты уже этим летом. 

🧑‍💻Никаких групповых занятий, ментор один на один общается с учеником;
🧑‍💻Только нужные знания;
🧑‍💻Упор на практику;
🧑‍💻Менторы из Яндекса, Google, Nasa и других крупных компаний;
🧑‍💻Бесплатный первый созвон;
🧑‍💻Занимайся из любой точки мира.

До конца лета в Solvery действует скидка на пакеты занятий 15% по промокоду summer15.
​​Что Data Scientist может подсмотреть у разработчика

Всем привет, меня зовут Дарья Пронина, я специалист по анализу данных и машинному обучению в отделе R&D в Lamoda. Я расскажу о том, что специалист по Data Science может подсмотреть у разработчиков, чтобы сделать свою работу эффективнее, production-процессы — устойчивее, а работу с разработчиками и дата инженерами — приятнее.
Статья
​​Аналитика ФИО в ЦФТ


Данная статья посвящена тому, как в отделе машинного обучения ЦФТ занимаются аналитикой ФИО клиентов, зачем это нужно, и каких результатов удалось достичь за время исследований в данной области.
Статья
Не пропусти подачу документов в магистратуру московского кампуса ВШЭ - https://u.to/Y7F9Gw
Прием документов до 14 августа.
Программа "Анализ данных в биологии и медицине"
​​🎥 Делаем DeepFake на коленке: пошаговое практическое руководство

Хотите собственноручно сделать видеоролик DeepFake с помощью простых инструментов? Наше пошаговое практическое руководство позволит вам пошутить над друзьями или создать забавный ролик для соцсетей, не углубляясь в программирование.

Статья
​​📊 Разделение пространства и K-мерные деревья

Ускорение моделирования и поиска ближайших соседей.

Статья
​​🐍 3 инструмента для отслеживания и визуализации выполнения кода на Python

Каждый хотел бы облегчить процесс дебаггинга и избавиться от головной боли. Решаем эту проблему с помощью инструментов для отслеживания выполнения кода на Python.
Статья
Популярность Apache Airflow растет с каждым днем.

Вы хотите научиться создавать инфраструктуру для работы с данными быстро и не тратя ценные часы на поиски и изучение лучших решений?
Apache Airflow — самый популярный оркестратор для построения ETL процессов. Он позволяет создавать сложные пайплайны, управлять зависимостями, подключаться к любым системам и заменять собой кучу cron’ов и ручных запусков.

👉🏻Решение вы получите 5 августа на demo-занятии в рамках онлайн-курса «DataOps Engineer»

Это возможность получить практические знания и познакомиться с форматом обучения в OTUS.
📍Для регистрации пройдите вступительный тест: https://otus.pw/lFJw/
​​Как развитие алгоритмов сжатия остановилось 20 лет назад, или о новом конкурсе на 200 тысяч евро

Статья
​​Чем машинное обучение отличается от статистики на самом деле

Статья
​​Restricted Boltzmann Machine — физика для рекомендательных систем

Статья