Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​📊📈Математика за оптимизаторами нейронных сетей

В этой статье мы поговорим о математике градиентного спуска, почему при обучении нейронных сетей применяется стохастический градиентный спуск и о вариации SGD (Stochastic Gradient Descent) с использованием скользящего среднего (SGD с momentum и Nesterov Accelerated Gradient).
[ Статья ]
​​7 книг, которые стоит прочесть для изучения Python

Fluent Python (рус. Python. К вершинам мастерства) – Лучано Рамальо
Python Cookbook – Дэвид Бизли, Брайн Джонс
Effective Python – Брэтт Слаткин
Веб-программирование c Python
Flask Web Development (рус. Разработка веб-приложений с использованием Flask на языке Python) – Мигель Гринберг
Two Scoops Of Django – Даниэль Гринфилд, Одри Гринфилд
Обработка данных с Python
Python Machine Learning – Себастьян Рашка
Data Visualization with Python and Javanoscript – Кайран Дейл

Подробнее про содержания
​​🐍🐬 Python и MySQL: практическое введение.

Рассмотрим на практическом примере, как из кода Python делать SQL-запросы к MySQL-серверу: CREATE, SELECT, UPDATE, JOIN и т. д.
Статья
В шкафу лежат вперемешку 5 пар светлых ботинок и 5 пар темных ботинок одинаковых размера и фасона. Какое наименьшее количество ботинок надо взять наугад из шкафа, чтобы среди них была хоть одна пара (на правую и левую ноги) одинакового цвета?
Anonymous Quiz
31%
5
25%
7
12%
10
32%
11
🤔Хороший, плохой, злой: как Яндекс использует нейросети для борьбы со спамом и матом

Разработчики Яндекса автоматизировали борьбу со спамом и матом в своих сервисах. Рассказываем, какие инструменты они для этого использовали.
[ Статья ]
​​🎨 Используем CycleGAN для применения стиля к видео, полученному с веб-камеры

Вы когда-нибудь задумывались, как выглядел бы ваш портрет работы Моне? Или легендарного Ван Гога? Современные технологии позволяют увидеть это своими глазами.
Статья
​​🎥 Делаем DeepFake на коленке: пошаговое практическое руководство.

Хотите собственноручно сделать видеоролик DeepFake с помощью простых инструментов? Наше пошаговое практическое руководство позволит вам пошутить над друзьями или создать забавный ролик для соцсетей, не углубляясь в программирование
Статья
DataOps — инженер будущего, который выстраивает инфраструктуру для работы с данными.

👉🏻Если вы Data Engineer, администратор или DevOps с опытом, и хотите узнать больше об управлении данными, 15 июля OTUS приглашает на demo-занятие «Практики Data Governance»:

На этом открытом уроке вы узнаете:
- Почему обработка данных - это не только написание ETL-процедур.
- Как не превратить Data Lake в Data Swamp.
- Что в себя включают практики Data Governance.

Занятие дает возможность предварительно попробовать новый онлайн-курс «DataOps Engineer» и познакомиться с преподавателем.
📍Для регистрации пройдите вступительный тест: https://otus.pw/XwXH/
​​⚕ Какие специалисты по Data Science требуются в медицинских проектах и что им нужно знать?

Что может быть прибыльнее, чем вести войну, торговать оружием и промышлять в даркнете? Правильно – лечить людей и продавать лекарства. Рассказываем, что нужно знать и уметь, чтобы влиться в выгодную и легальную индустрию здравоохранения.
Статья
​​5 неожиданных мест работы дата-сайентиста: от йоги до борьбы с deepfakes

Специалисты в области Data Science за последние пять лет стали особенно востребованными. Так, в 2019 году вакансий для них стало почти в 1,5 раза больше, чем в 2018, и почти в 10 раз больше, чем в 2015. Главные заказчики — финансовый сектор и IT-компании. Однако хорошие дата-сайентисты нужны не только в этих отраслях...
Статья
6 сентября стартует новый поток курса о данных в энтерпрайзе. Это первая подобная программа в стране. Ее разработали создатели MDM- и CDI-решений из компании HFLabs.

🧑‍💻 Для кого

Подойдет всем, кто работает или будет работать с клиентскими данными в крупной компании. Специальность не имеет значения.

📚 Программа

Пять дней, пять преподавателей, пять модулей:
1. Предпосылки создания MDM-системы. Проектирование модели данных.
2. Построение MDM-системы: структура и правила работы с данными.
3. Добавление новых источников в MDM-систему.
4. Получение данных из эталонной клиентской базы. Обратное распространение.
5. Управление качеством данных в MDM-системе.

🧙‍♂️ Преподаватели

Эти специалисты работают с клиентскими данными в ВТБ, «Открытии», «Росгосстрахе», МТС. Каждый «закрыл» минимум десяток проектов для крупного бизнеса.

🏃‍♀️ Студенты уже регистрируются

До 1 августа цены ниже на 4 000—6 000 ₽. Мест всего 16, разлетаются быстро.

Узнать больше https://bit.ly/3r5b0yd
🐍Скрапинг сайта с помощью Python: гайд для новичков.

В этой статье мы разберемся, как создать HTML скрапер на Python, который получает неофициальный доступ к коду сайта и позволяет извлечь необходимые данные.

Статья
Подборка полезных инструментов для повседневной работы от специалиста по Data Science.

Обзор инструментов для Data Scientist и ML-инженеров, которые упрощают ежедневную работу, повышают продуктивность и просто делают опыт использования разных сервисов приятнее...
Статья
​​🤖 Вариационные автоэнкодеры (VAE) для чайников – пошаговое руководство

Практическое руководство в стиле "сделай сам" с работающим кодом создания и обучения VAE для лиц знаменитостей на Keras.
[ Статья ]
​​🤖 Numpy, Pandas, matplotlib – необходимый минимум для старта в Machine Learning

В одном обзоре мы рассмотрим базовый программный минимум для старта в Machine Learning. Для этого понадобятся: Python 3.8+, Jupyter Notebook, numpy, pandas и matplotlib.
Статья
⭐️ Актуальные новости и интересные материалы о регулировании и других аспектах искусственного интеллекта (ИИ) — в Telegram-фиде База знаний AI

Команда ICT.Moscow собирает самые заметные новости о технологиях машинного обучения, компьютерного зрения и обработке естественного языка; публикует данные из отраслевых исследований, правового регулирования, мнения экспертов рынка, статьи, интервью и другие полезные материалы об ИИ, а каждое утро начинается с обзора главных ИИ-новостей.

Вот несколько постов из их фида:
📌 В России утвержден первый стандарт в области больших данных
📌 Регуляторы ЕС против использования ИИ для распознавания признаков человека в общедоступных местах
📌 Зачем нужны транспортные полигоны для «умных» машин

***
👉🏻 Подписаться на фид @ICT_Moscow_AI
​​Платформа обработки данных Билайн

Статья
Профессия будущего в мехмате МГУ — теперь в онлайн-формате
МГУ и SkillFactory запускают онлайн-магистратуру "Искусственный интеллект и цифровые технологии". Для тех, кто хочет двигать Россию и мир в будущее.

Приходите к нам, чтобы получить:
▪️ Глубокое понимание принципов анализа данных и машинного обучения
▪️ Математическую базу мехматского уровня
▪️ Навыки решения исследовательских и практических задач с помощью ML-моделей и нейросетей
▪️ Практику и стажировку от корпоративных партнеров программы

И все это — онлайн. Материалы для обучения доступны на платформе 24/7. Вы можете сами выбрать группу с оптимальным временем практических занятий и семинаров. Гибкий график позволяет совмещать обучение с работой.

За 2 года вы успеете погрузиться в сферу, получить практический опыт в разработке ИИ и собрать 7+ проектов в портфолио. А по окончании обучения вас ждет диплом МГУ им. М.В. Ломоносова.

Узнайте, какие бонусы вас ждут как студента МГУ и как будет проходить ваше обучение, на сайте программы:
https://u.to/-DV4Gw
​​Ломай дату полностью: сравниваем подходы к качеству данных у крупных компаний (Lyft, Shopify) на Data Quality Meetup

статья
Яндекс вместе с учеными Оксфорда и Кембриджа проводит соревнование среди исследователей ML на базе самого большого в мире открытого датасета по беспилотным авто.

Зачем?
Повысить осведомленность о проблеме “сдвига данных” в машинном обучении.

Когда? Сейчас, в рамках NeurIPS 2021 - крупнейшей ML конференции в в мире.

В чем фишка? Машинное обучение сталкивается с испытанием – реальный мир почти бесконечно разнообразен, поэтому очень сложно просчитать все ситуации, в которые попадает алгоритм. Оказываясь в незнакомой среде, он начинает справляться с задачами хуже (например, модель машинного перевода классической литературы вдруг возьмется переводить твиты).

Важно, чтобы алгоритмы, попадая в реальный мир, были готовы справляться со сдвигом, который их там ждет. Беспилотникам Яндекса удалось собрать уникальный по наличию разных условий датасет – их авто набирались опыта и собирали данные в трех странах с разными особенностями манеры вождения, дорожных правил и погоды.


Что требуется? Разработать алгоритмы для предсказания поведения участников автомобильного движения, погоды или машинного перевода текстов.
Обучить их на предоставленных данных. Для этого Яндекс открыл доступ к трем датасетам с реальными данными из Погоды, Переводчика и по беспилотным автомобилям.

Проверить качество работы алгоритмов в условиях сдвига. Кстати, авторы самых успешных получат деньги, а решения можно будет применять и в других сферах, где есть проблема сдвига данных.

Хотели бы попробовать себя?