DataGym Channel [Power of data] – Telegram
DataGym Channel [Power of data]
2.4K subscribers
52 photos
7 videos
1 file
158 links
Канал про Data Science и BigData.

Для связи: @ermakovpetr
Download Telegram
Forwarded from ODS Events
Data Fest набирает обороты! 🚀

Мы решили попробовать новый формат и сделать выездной стрим из Ярославля.

Уже завтра с 14 до 18 по Москве мы встретимся онлайн и:
🔸 обсудим, какие доклады и секции уже прошли на Data Fest
🔸 узнаем больше о том, что еще запланировано в рамках феста
🔸 поговорим про последние новости в мире данных
🔸 поностальгируем про предыдущие оффлайн конференции ODS, пофантазируем о будущем
🔸 ответим на ваши вопросы

У нас нет четкого плана, кроме как веселиться и угорать.😜 А если судьба 29 мая занесет вас в Ярославль, давайте после увидимся за ужином - заходите в канал Slack ODS #_meetings_yar
DataFest_воркшоп_"Как_запихнуть_в_CatBoost_терабайты_данных,_используя.ics
2.8 KB
Я в ПК многих конференций, а где-то организую целые митапы сам.
Когда-нибудь расскажу "Зачем"
Но сейчас я пришел рассказать один из воркшопов, в котором поучаствовал "уточкой"

Ребята из CatBoost-а подготовили воркшоп, о том как обучать CatBoost на больших данных в Spark
Сейчас поделюсь промороликом https://youtu.be/ei-ZCAafr7s
А завтра в 19:00 (03/06/2021) пройдет сам доклад.
Андрей даст вводную про CatBoost на Spark, а потом объяснит мне, как запустить вот это вот все и применить к своим задачам.
Вишенкой на торте, Андрей в рамках Q&A ответит на все ваши вопросы.
Добавляйте событие в свой календарь, чтобы не пропустить.
Ну а для тех кто пропустил, вот видео
Интерес этого воркшопа еще в том, что это первая попытка сделать онлайн-воркшоп в новом формате, когда в видео присутствует не только докладчик, но и аудитория (пусть в одном лице), которая видит код первый раз и задает вопросы
(еще добавил чат и комментарии к каналу, расскажите там про новый формат онлайн воркшопа)
Яндекс открыл демку своей GPT-3
Посмотреть можно тут https://yandex.ru/lab/yalm
А кратко как работает тут https://yandex.ru/lab/yalm-howto
В русском ютубе вышло видео об Искусственном Интеллекте
На вопросы отвечают Крайнов, Лемпицкий, Ханин и другие
Распознавание лиц, роботы, дипфейки и вот это вот все

Как раз то видео, что можно отправить маме со словами "я занимаюсь вот этим" (но на деле я продаю труселя с использованием данных)
Через 5 минут (8 июня в 19:00) пройдет ML Party — регулярный митап Яндекса о разных применениях машинного обучения в IT.

В этот раз про CV, speech и про то, что иногда вместо огромных тяжелых моделей приходится обучать более эффективные и не менее качественные.

https://events.yandex.ru/events/ml-party/08-06-2021
3 раза в неделю по пн-ср-пт в 9:30 (мск) мы проводим Дата Завтраки Online
Они более 4 месяцев стабильно проходят в ClubHouse (What Is Dead May Never Die), завтраки живее всех живых
Мы общаемся, пока собираемся или едем на работу, просыпаемся или настраиваемся на рабочий лад.
Мы обсуждаем все, что связанно с данными. Но у нас нет четких тем: мы обсуждаем новости, отвечаем на вопросы и готовы выслушать.
Приходите послушать или поговорить. Ссылка на комнату мы кидаем в отдельный телеграм канал
В комментарии к посту выше,заметили, что выпилили чувствительные темы
api-ка
import requests
import json

headers = {
'Accept': '*/*',
'Content-Type': 'application/json',
'Origin': 'https://yandex.ru',
'Content-Length': '45',
'Accept-Language': 'ru',
'Host': 'zeapi.yandex.net',
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0.3 Safari/605.1.15',
'Referer': 'https://yandex.ru/',
'Accept-Encoding': 'gzip, deflate, br',
'Connection': 'keep-alive',
}

data = json.dumps({"query":"Заходит ","intro":0,"filter":1})

response = requests.post('https://zeapi.yandex.net/lab/api/yalm/text3',
headers=headers,
data=data)
Пока на улице жара, остыньте дома под PyData секцию ДатаФеста в Spatial Сhat
Встречаемся через 15 минут

🔸12:00 Влад расскажет про библиотеку Inferoxy, ещё один движок для инференса нейронных сетей
🔸14:00 Воркшоп по AutoML от создателей библиотеки LightAutoML

Встречаемся в комнате PyData в Spatial Сhat, актуальный пароль на странице феста в разделе Нетворкинг.
К недавнему посту, который начинался как "Я в ПК многих конференций, а где то организую целые митапы сам..." пришел (заслуженно) от товарищей стеб про Успешный успех.
Сегодня ds-контента не будет, потому расскажу зачем я во всем этом участвую.

Я люблю нетворкинг. Хорошие знакомства помогают найти интересные предложения о работе, экспертизу в решении задач, которые самостоятельно решить не получается.
Когда я начинал перекатываться из разработки в анализ данных (2010г) источников было мало, я катался по разным российским академическим конференциям (Диалог, ромип/russir, AIST, AINL), знакомился с опытными, задавал глупые вопросы (в чем преуспел) и черпал идеи. По опыту it-конференций (студень от Яндекса, YAC, хайлоад), я видел, что ребята на таких мероприятиях охотно идут на контакт: так на Студне я отловил Сегаловича, спрашивал его про реализацию шинглов, а потом он учил меня жонглировать. Расположенность к тебе участников дата-конференций была и остается на том же уровне.

Участие в мероприятиях даже слушателем дало мне много знакомств, некоторые из которых не просто остались до сегодня, а даже окрепли и перетекли в дружбу семьями.
Когда я начал работать в ds-сфере, меня начали звать выступать (тогда людей было меньше и получить такое предложение было проще), а потом и модерировать. Но мне по прежнему нравилось слушать.

И тут подумалось, если я буду организатором или в программном комитете, то смогу отбирать те доклады, которые важны и интересны мне (не в ущерб контенту). А если за тобой известный бренд конференции, то ты можешь написать даже "богу машинного обучения", и вероятность, что тебя проигнорируют, гораздо меньше. Так по конференциям-секциям-митапам, где я участвовал, можно проследить зону моего интереса в области.

Если вы хотите выступить на конференции/митапе, но не знаете в каком, пишите тему, я вас сориентирую и мы подберем для вас подходящий митап.
Хорошего вечера!
Сегодня в 19:00 по МСК в рамках Data Fest-а доклад Дмитрия Дремова. Он расскажет, как модель может реагировать на каждое пользовательское действие, но использовать только offline предсказания

Вчера я рассказал про важность нетворкинга. С Димой мы познакомились как раз благодаря сообществу. Мы работали с ним на нескольких проектах, а сейчас трудимся в одной команде. Меня до сих пор поражает его основательный подход в решении задач и его порой нетривиальные взгляды на задачи. Потому для меня стало честью помочь ему с докладом.

В докладе Дима как раз расскажет про подход к ранжированию (сортировке) контета у нас в компании, а потом ответит на любые вопросы по своему докладу.

Встречаемся в комнате SysML в Spatial Сhat, актуальный пароль на странице феста в разделе Нетворкинг.
Будут проблемы с получением пароля - приходите в комменты. Увидимся там.
Утомил вас переписыванием новостей DataFest, но следующий доклад также из моей секции.

Сегодня в 19:00 по МСК Дмитрий Аникин расскажет об эволюции инфраструктуры разработки моделей ML в Касперском, как модели проходят путь от notebook до production

Весь путь от модели до сервиса, с болью и проблемами: CI/CD, мониторинг, алертинг
Если вы из разработки, вам тоже будет интересно: как "Data Scientist-ы которые не умеют программировать" прошли этот путь, что им удалось перенести из разработки, а что не вышло из-за специфики.

Встречаемся в комнате SysML в Spatial Сhat, актуальный пароль на странице феста в разделе Нетворкинг.
Как обычно, будут проблемы с получением пароля, приходите в комменты. До встречи!
MLOps - то что захватывает меня последнее время, но у меня много претензий к текущим решениям и продуктам.

Расскажите про ваши открытия и библиотеки, даже если они давно известны, в комментарии к этому посту.

А в четверг будет онлайн-митап. Если у вас нет MLOps или вы уже опытный в этом, подключайтесь посмотреть. Уверен, что будет интересно. А мой коллега, Роман, расскажет про MLOps в Lamoda.
Сегодня вышел подкаст со мной.
Я рассказал, как попал в DS, почему работа с данными не только работа, но и веселое хобби, чем комьюнити может помочь, как "пользоваться" ODS для новичков и несколько кулстори.
Послушать можно на подкаст платформах или Ютубе.
Записывали почти месяц назад и мои предсказания про очные мероприятия можно пока серьезно не рассматривать.
#реклама

24 сентября будет облачно, потому что пройдет Yandex Scale (крупнейшая конференция платформы Yandex.Cloud)

За весь день планируются более 30 докладов в 5 потоках: Infrastructure, Data Platform, Security, Cloud-native, ML & AI
Поделюсь заинтересовавшими меня докладами:

- Облачное поколение ноутбуков — от тетрадок к сфере данных: ребята расскажут про DataSphere, у меня тут есть много вопросов спикеру, держитесь =)
- Программа содействия образованию и науке в области Computer Science: это очень круто, такое есть у многих облаков, но всегда есть вопросы, а достучаться до Яндекса явно проще
- Рекомендательная система на базе DataSphere: прям интересно, какую рек.систему можно построить и показать за 40 минут
- Расскажите какие доклады и почему заинтересовали вас в комментах к посту

Мы на нескольких проектах уже перешли или задумываемся над переходом на Yandex.Cloud. Недавно даже протестировали часть задач на GPU в DataSphere. Потому я обязательно зайду задать вопросы и узнать о новостях и скорейших релизах.

Конференция пройдет онлайн, участие бесплатное. Программа и регистрация тут: https://scale.yandex.ru/
За новостями и деталями можно следить на официальном канале конференции @yandexscale.
Data Science MeetUp (онлайн + офлайн)

29 сентября встречаемся в Иннополисе, чтобы поговорить об использовании алгоритмов ML в производстве и обработке данных с самолетов и полетов. Бонус: кое-что про космос

Узнаем:
- как экономить на производстве с помощью машинного обучения;
- как прогнозировать техническое обслуживание самолетов с помощью данных;
- как машинное обучение помогает оптимизировать обслуживание воздушных судов;
и многое другое 🔥

Спикеры:
- Александр Стрельников, Lead Data Scientist, Accenture/Applied Intelligence
- Андрей Жуков, CTO S7 Techlab
- Валентин Азанов, Lead Data Scientist, S7 Techlab
- Любовь Рожкова, Middle Data Scientist, S7 Techlab

Модератор: Василий Сафронов - немного data scientist, немного technical engineer, немного product manager

Для кого: разработчикам и ML-аналитикам, а так же всем интересующимся самолётами и производством

🕑 29 сентября, 17ч (мск)
📍г.Иннополис, Технопарк им. Попова, 2 этаж, конференц-зал

Онлайн-трансляция

Регистрация и подробности докладов
#реклама

Вебинар Бесплатный ML Space на базе инструментов Intel oneAPI для всех желающих.

У нас отличные новости, инструменты Intel® oneAPI на облачной платформе ML Space стали доступны для физических лиц. Это значит, что любой желающий может бесплатно использовать набор программных инструментов для ускорения машинного обучения, анализа данных, разработки ПО.

На вебинаре вы узнаете:

— подробности об инструментах Intel® oneAPI;
— сценарии применения этих инструментов для построения ML-моделей;
— как получить бесплатный доступ к инструментам на платформе ML Space.

Вебинар будет полезен всем, кто интересуется data science.
Регистрируйтесь по ссылке.

Вебинар пройдёт — 14 октября 2021, четверг, 12:00

*SberCloud — облачный провайдер услуг и сервисов для физлиц, бизнеса и государственных организаций.
Друзья из hh весной провели конкурс по анализу отзывов на компании.

Сегодня через 3 часа пройдет онлайн-митап с разбором конкурса и топовых решений, а также доклад от ребят из ХХ про их новый подход в матчинге вакансий на резюме.