Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​⚕ Какие специалисты по Data Science требуются в медицинских проектах и что им нужно знать?

Что может быть прибыльнее, чем вести войну, торговать оружием и промышлять в даркнете? Правильно – лечить людей и продавать лекарства. Рассказываем, что нужно знать и уметь, чтобы влиться в выгодную и легальную индустрию здравоохранения.
Статья
​​5 неожиданных мест работы дата-сайентиста: от йоги до борьбы с deepfakes

Специалисты в области Data Science за последние пять лет стали особенно востребованными. Так, в 2019 году вакансий для них стало почти в 1,5 раза больше, чем в 2018, и почти в 10 раз больше, чем в 2015. Главные заказчики — финансовый сектор и IT-компании. Однако хорошие дата-сайентисты нужны не только в этих отраслях...
Статья
6 сентября стартует новый поток курса о данных в энтерпрайзе. Это первая подобная программа в стране. Ее разработали создатели MDM- и CDI-решений из компании HFLabs.

🧑‍💻 Для кого

Подойдет всем, кто работает или будет работать с клиентскими данными в крупной компании. Специальность не имеет значения.

📚 Программа

Пять дней, пять преподавателей, пять модулей:
1. Предпосылки создания MDM-системы. Проектирование модели данных.
2. Построение MDM-системы: структура и правила работы с данными.
3. Добавление новых источников в MDM-систему.
4. Получение данных из эталонной клиентской базы. Обратное распространение.
5. Управление качеством данных в MDM-системе.

🧙‍♂️ Преподаватели

Эти специалисты работают с клиентскими данными в ВТБ, «Открытии», «Росгосстрахе», МТС. Каждый «закрыл» минимум десяток проектов для крупного бизнеса.

🏃‍♀️ Студенты уже регистрируются

До 1 августа цены ниже на 4 000—6 000 ₽. Мест всего 16, разлетаются быстро.

Узнать больше https://bit.ly/3r5b0yd
🐍Скрапинг сайта с помощью Python: гайд для новичков.

В этой статье мы разберемся, как создать HTML скрапер на Python, который получает неофициальный доступ к коду сайта и позволяет извлечь необходимые данные.

Статья
Подборка полезных инструментов для повседневной работы от специалиста по Data Science.

Обзор инструментов для Data Scientist и ML-инженеров, которые упрощают ежедневную работу, повышают продуктивность и просто делают опыт использования разных сервисов приятнее...
Статья
​​🤖 Вариационные автоэнкодеры (VAE) для чайников – пошаговое руководство

Практическое руководство в стиле "сделай сам" с работающим кодом создания и обучения VAE для лиц знаменитостей на Keras.
[ Статья ]
​​🤖 Numpy, Pandas, matplotlib – необходимый минимум для старта в Machine Learning

В одном обзоре мы рассмотрим базовый программный минимум для старта в Machine Learning. Для этого понадобятся: Python 3.8+, Jupyter Notebook, numpy, pandas и matplotlib.
Статья
⭐️ Актуальные новости и интересные материалы о регулировании и других аспектах искусственного интеллекта (ИИ) — в Telegram-фиде База знаний AI

Команда ICT.Moscow собирает самые заметные новости о технологиях машинного обучения, компьютерного зрения и обработке естественного языка; публикует данные из отраслевых исследований, правового регулирования, мнения экспертов рынка, статьи, интервью и другие полезные материалы об ИИ, а каждое утро начинается с обзора главных ИИ-новостей.

Вот несколько постов из их фида:
📌 В России утвержден первый стандарт в области больших данных
📌 Регуляторы ЕС против использования ИИ для распознавания признаков человека в общедоступных местах
📌 Зачем нужны транспортные полигоны для «умных» машин

***
👉🏻 Подписаться на фид @ICT_Moscow_AI
​​Платформа обработки данных Билайн

Статья
Профессия будущего в мехмате МГУ — теперь в онлайн-формате
МГУ и SkillFactory запускают онлайн-магистратуру "Искусственный интеллект и цифровые технологии". Для тех, кто хочет двигать Россию и мир в будущее.

Приходите к нам, чтобы получить:
▪️ Глубокое понимание принципов анализа данных и машинного обучения
▪️ Математическую базу мехматского уровня
▪️ Навыки решения исследовательских и практических задач с помощью ML-моделей и нейросетей
▪️ Практику и стажировку от корпоративных партнеров программы

И все это — онлайн. Материалы для обучения доступны на платформе 24/7. Вы можете сами выбрать группу с оптимальным временем практических занятий и семинаров. Гибкий график позволяет совмещать обучение с работой.

За 2 года вы успеете погрузиться в сферу, получить практический опыт в разработке ИИ и собрать 7+ проектов в портфолио. А по окончании обучения вас ждет диплом МГУ им. М.В. Ломоносова.

Узнайте, какие бонусы вас ждут как студента МГУ и как будет проходить ваше обучение, на сайте программы:
https://u.to/-DV4Gw
​​Ломай дату полностью: сравниваем подходы к качеству данных у крупных компаний (Lyft, Shopify) на Data Quality Meetup

статья
Яндекс вместе с учеными Оксфорда и Кембриджа проводит соревнование среди исследователей ML на базе самого большого в мире открытого датасета по беспилотным авто.

Зачем?
Повысить осведомленность о проблеме “сдвига данных” в машинном обучении.

Когда? Сейчас, в рамках NeurIPS 2021 - крупнейшей ML конференции в в мире.

В чем фишка? Машинное обучение сталкивается с испытанием – реальный мир почти бесконечно разнообразен, поэтому очень сложно просчитать все ситуации, в которые попадает алгоритм. Оказываясь в незнакомой среде, он начинает справляться с задачами хуже (например, модель машинного перевода классической литературы вдруг возьмется переводить твиты).

Важно, чтобы алгоритмы, попадая в реальный мир, были готовы справляться со сдвигом, который их там ждет. Беспилотникам Яндекса удалось собрать уникальный по наличию разных условий датасет – их авто набирались опыта и собирали данные в трех странах с разными особенностями манеры вождения, дорожных правил и погоды.


Что требуется? Разработать алгоритмы для предсказания поведения участников автомобильного движения, погоды или машинного перевода текстов.
Обучить их на предоставленных данных. Для этого Яндекс открыл доступ к трем датасетам с реальными данными из Погоды, Переводчика и по беспилотным автомобилям.

Проверить качество работы алгоритмов в условиях сдвига. Кстати, авторы самых успешных получат деньги, а решения можно будет применять и в других сферах, где есть проблема сдвига данных.

Хотели бы попробовать себя?
​​🤖 Метод k-ближайших соседей (k-nearest neighbour)

Метод k-ближайших соседей (k Nearest Neighbors, или kNN) – популярный алгоритм классификации, который используется в разных типах задач машинного обучения. Наравне с деревом решений это один из самых понятных подходов к классификации.
статья
​​🛠 Сложноструктурные аналитические отчеты с Python и LaTeX

В руководстве подробно рассматривается пример использования Python-библиотеки облачного представления приложений Streamlit и системы компьютерной вёрстки LaTeX для подготовки сложных аналитических отчетов с математическими, программными и графическими вставками.
Статья
​​🐦 BigBird от Google: еще одна важная веха в NLP?

Разбираемся, что такое Google BigBird, какие задачи она может решать, и насколько она важна для отрасли.
Статья
​​​​ Хотим обратить ваше внимание на полезный telegram-канал для обучения высокоуровневому языку программирования Python

На канале ежедневно публикуются задачи по Python и Machine Learning: алгоритмы, функции, классы, регулярные выражения, итераторы, генераторы, ООП, исключения, numpy, pandas, matplotlib, scikit-learn, TensorFlow и многое другое!

✔️Станьте специалистом по Python вместе с каналом "Задачи по Python и машинному обучению"
​​Над чем задуматься перед тем, как брать ML-задачу в работу.

Поток идей для ML-проектов огромный, но не все из них стоят того, чтобы за них браться. Некоторые с большей вероятностью принесут результат, а другие изначально обречены на провал....
статья
ИТ-компания Selectel приглашает на вебинар «Искусственный интеллект и Machine learning»

После вебинара вы сможете:

💥 наладить прозрачный R&D-процесс в командах
💥 получить нужный результат даже при низкой квалификации кадров
💥 провести оценку эффективности работы исследователей

Дата: 29 июля, четверг, 16:00 МСК

Спикеры: Алексей Гончаров, CEO в Machine Intelligence Laboratory, и Антон Чунаев, менеджер ML-продуктов в @selectelnews.

Подробности и регистрация по ссылке:

🚀 https://slc.tl/HKEgq
​​Уходим с Mercurial на Git

Так уж случилось, что у меня остался ряд репозиториев на Mercurial, которые захостил на Bitbucket много лет назад. Проекты перешли в полуархивное состояние, поэтому заглядывал в них не так уж и часто. И тут я решил обратиться к материалам, надо было внести правку...
статья
Заполни пробелы в знаниях в IT, дизайне, GameDev и вырасти до мидла за 1,5 месяца с помощью менторов Solvery и получи работу мечты уже этим летом. 

🧑‍💻Никаких групповых занятий, ментор один на один общается с учеником;
🧑‍💻Только нужные знания;
🧑‍💻Упор на практику;
🧑‍💻Менторы из Яндекса, Google, Nasa и других крупных компаний;
🧑‍💻Бесплатный первый созвон;
🧑‍💻Занимайся из любой точки мира.

До конца лета в Solvery действует скидка на пакеты занятий 15% по промокоду summer15.