DataGym Channel [Power of data] – Telegram
DataGym Channel [Power of data]
2.4K subscribers
52 photos
7 videos
1 file
158 links
Канал про Data Science и BigData.

Для связи: @ermakovpetr
Download Telegram
Audio
Первый выпуск Russian Data Science Podcast.
Мы пригласили двух интересных гостей, Данилу и Александра, чтобы они рассказали свои нестандартные истории, как пришли в анализ данных.

ITunes, Castbox и Web, остальные площадки появятся позже
https://dscast.ru/e/russian-data-science-podcast-1/
https://news.1rj.ru/str/dscast/4
#competitions : X5 RetailHero
Контест по машинному обучению в виде трёх соревнований с ритейловой спецификой.
Дедлайн: 09/02/2020 (1 месяц)
Призовой фонд: 1.600.000 руб (1ая задача - 400.000 руб, 2ая задача - 800.000 руб, 3я задача - 400.000 руб)
Возможно участие в любом количестве задач в рамках разных команд.

Задача 1. Каким клиентам нужно отправить SMS?
В этой задаче необходимо подготовить список клиентов, ранжированный по эффективности коммуникации.

Задача 2. Какие товары клиент купит в следующий раз?
Тут участникам предстоит построить рекомендательную систему и при этом сделать сервис, который выдержит нагрузку.

Задача 3. Как расставить товары по полкам?
Нужно реализовать алгоритм, который сможет найти самую эффективную расстановку товаров.

Подробности: http://xxtt.ru/retailhero_competitions
Лучший публичный бейзлайн 2 задачи на текущий момент: http://xxtt.ru/retailhero-recomender-baseline
#events : PyData Moscow Meetup #11
Когда: 1 (суббота) февраля 2020, 13:00 - 17:20 (сбор в 12:00)
Место: Mail.ru Group, Москва, Ленинградский проспект, 39, стр. 79
Язык докладов - русский

Одиннадцатая PyData Moscow Meetup пройдет в офисе Mail.ru Group
PyData Moscow Meetup - это события, посвященные Сбору, Хранению, Обработке, Анализу и Визуализации данных на Python. Все как Вы любите.

Программа докладов:
- Павел Клеменков "RAPIDS: ускоряем Pandas и scikit-learn на GPU"
- Николай Маслович "CV в пайплайне распознавания ценников товаров: трюки и хитрости"
- Александр Бельских "Почему вам стоит использовать свой велосипед и почему не стоит"

Программа воркшопов:
- Михаил Трофимов "Рекомендательная система на коленке"
- Михаил Свешников "Эбонитовый воркшоп: заворачиваем свою модель в ebonite"

Обязательна регистрация, закончится через пару часов: http://xxtt.ru/pydata11
#link : Туториал по Uplift моделированию
#партнерство

Выше в канале был анонс соревнования RetailHero, где одна из задач - Uplift-моделирование.
Ребята из МТС написали туториал по Uplift и теперь хотят поделиться второй его частью: http://xxtt.ru/fe83

Если первая статья включала в себя знакомство с Uplift моделированием, разбор особенностей сбора данных для обучения модели и описание несколько базовых алгоритмов, то вторая статья является разбором более сложных подходов, которые позволяют оптимизировать Uplift напрямую.
Дедлайн соревнований продлили на 2 недели, потому статья может быть полезна тем, кто прямо сейчас решит принять участие в соревновании.
Следующему набору DataGym быть! С 6 апреля 🙂

На фоне перехода компаний на удаленку и закрытия учебных заведений на карантин мы в DataGym решили усилить дистанционный формат нашего курса.

Как это будет организовано:
– Трансляции лекций на youtube;
– Подключение слушателей по zoom;
– Для удаленных слушателей еженедельные созвоны на 1 час для ответов на вопросы (очники обычно обсуждают вопросы до/после лекции и во время перерывов).
Приглашаем всех, кто ждал дистанционный формат нашего курса! Это отличная возможность подключиться слушателям из других городов, а коллегам из Москвы не тратить время на дорогу.
Берегите себя и с пользой проводите время в карантине.

https://datagym.ru
https://www.facebook.com/datagym.ru/photos/a.621196941966812/662914941128345/
#events : PyDoma [PyData Moscow Meetup #12]
Когда: 26 (вторник) мая 2020, 19:00 - 21:00 (сбор в 18:45)
Место: трансляция YouTube и дискуссия в Zoom
Язык докладов - русский

DataGym совместно с ODS в этот раз пройдет онлайн PyData Moscow под флагом самоизоляции и благотворительности — PyDoma.
PyData Moscow Meetup - это события, посвященные Сбору, Хранению, Обработке, Анализу и Визуализации данных на Python.

Программа докладов:
- Юрий Кашницкий "Из пушки по воробьям, или BERT vs. logreg"
- Евгений Нижибицкий "Треды, процессы и хеши-беляши"
- Артур Кузин "DL пайплайны"
- Павел Якубовский "StarterKit для решения задач семантической сегментации"

Зарегистрируйтесь, чтобы не пропустить ссылку на трансляцию https://pydata.timepad.ru/event/1318959/
К митапу приурочен благотворительный сбор средств https://sluchaem.ru/event/5154
Сделайте любое пожертвование для помощи всем, кто пострадал от последствий пандемии в России. Вот в какие фонды и как будут распространены средства.
Привет, это @ermakovpetr и я делаю школу машинного обучения DataGym.ru
Я создал этот канал 3 года назад.
Казалось нужно сделать его красивым и формальным, но это стало стопом для его развития
Давайте сделаем его более душевным 😉
Channel name was changed to «DataGym Channel [Power of data]»
Завтра 22 мая начинается онлайн DataFest.ru : будет презентация формата, треков и много нетворка
С 23 мая по 18 июня ждите кучу докладов и еще больше нетворка

Я участвую в организации с первого феста.
В этом году я делаю SysML, PyData и BigData, помогаю с Data Collection
Завтра проведу вновь DS PowerPoint Karaoke
А 29 мая проведем выездной стрим DataFest-а

Кажется, контента море, но как не пропустить? Зарегистрируйтесь на DataFest.ru
Завтра вам расскажут про платформу и как после регистрации иметь доступ ко всем трекам и расписанию на целый месяц

Увидимся завтра! А пока не забудьте зарегистрироваться 😉
А у нас тут стрим из Ярославля)
Forwarded from ODS Events
Data Fest набирает обороты! 🚀

Мы решили попробовать новый формат и сделать выездной стрим из Ярославля.

Уже завтра с 14 до 18 по Москве мы встретимся онлайн и:
🔸 обсудим, какие доклады и секции уже прошли на Data Fest
🔸 узнаем больше о том, что еще запланировано в рамках феста
🔸 поговорим про последние новости в мире данных
🔸 поностальгируем про предыдущие оффлайн конференции ODS, пофантазируем о будущем
🔸 ответим на ваши вопросы

У нас нет четкого плана, кроме как веселиться и угорать.😜 А если судьба 29 мая занесет вас в Ярославль, давайте после увидимся за ужином - заходите в канал Slack ODS #_meetings_yar
DataFest_воркшоп_"Как_запихнуть_в_CatBoost_терабайты_данных,_используя.ics
2.8 KB
Я в ПК многих конференций, а где-то организую целые митапы сам.
Когда-нибудь расскажу "Зачем"
Но сейчас я пришел рассказать один из воркшопов, в котором поучаствовал "уточкой"

Ребята из CatBoost-а подготовили воркшоп, о том как обучать CatBoost на больших данных в Spark
Сейчас поделюсь промороликом https://youtu.be/ei-ZCAafr7s
А завтра в 19:00 (03/06/2021) пройдет сам доклад.
Андрей даст вводную про CatBoost на Spark, а потом объяснит мне, как запустить вот это вот все и применить к своим задачам.
Вишенкой на торте, Андрей в рамках Q&A ответит на все ваши вопросы.
Добавляйте событие в свой календарь, чтобы не пропустить.
Ну а для тех кто пропустил, вот видео
Интерес этого воркшопа еще в том, что это первая попытка сделать онлайн-воркшоп в новом формате, когда в видео присутствует не только докладчик, но и аудитория (пусть в одном лице), которая видит код первый раз и задает вопросы
(еще добавил чат и комментарии к каналу, расскажите там про новый формат онлайн воркшопа)
Яндекс открыл демку своей GPT-3
Посмотреть можно тут https://yandex.ru/lab/yalm
А кратко как работает тут https://yandex.ru/lab/yalm-howto
В русском ютубе вышло видео об Искусственном Интеллекте
На вопросы отвечают Крайнов, Лемпицкий, Ханин и другие
Распознавание лиц, роботы, дипфейки и вот это вот все

Как раз то видео, что можно отправить маме со словами "я занимаюсь вот этим" (но на деле я продаю труселя с использованием данных)
Через 5 минут (8 июня в 19:00) пройдет ML Party — регулярный митап Яндекса о разных применениях машинного обучения в IT.

В этот раз про CV, speech и про то, что иногда вместо огромных тяжелых моделей приходится обучать более эффективные и не менее качественные.

https://events.yandex.ru/events/ml-party/08-06-2021
3 раза в неделю по пн-ср-пт в 9:30 (мск) мы проводим Дата Завтраки Online
Они более 4 месяцев стабильно проходят в ClubHouse (What Is Dead May Never Die), завтраки живее всех живых
Мы общаемся, пока собираемся или едем на работу, просыпаемся или настраиваемся на рабочий лад.
Мы обсуждаем все, что связанно с данными. Но у нас нет четких тем: мы обсуждаем новости, отвечаем на вопросы и готовы выслушать.
Приходите послушать или поговорить. Ссылка на комнату мы кидаем в отдельный телеграм канал
В комментарии к посту выше,заметили, что выпилили чувствительные темы
api-ка
import requests
import json

headers = {
'Accept': '*/*',
'Content-Type': 'application/json',
'Origin': 'https://yandex.ru',
'Content-Length': '45',
'Accept-Language': 'ru',
'Host': 'zeapi.yandex.net',
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0.3 Safari/605.1.15',
'Referer': 'https://yandex.ru/',
'Accept-Encoding': 'gzip, deflate, br',
'Connection': 'keep-alive',
}

data = json.dumps({"query":"Заходит ","intro":0,"filter":1})

response = requests.post('https://zeapi.yandex.net/lab/api/yalm/text3',
headers=headers,
data=data)