DataGym Channel [Power of data] – Telegram
DataGym Channel [Power of data]
2.4K subscribers
52 photos
7 videos
1 file
158 links
Канал про Data Science и BigData.

Для связи: @ermakovpetr
Download Telegram
#model : Языковая модель c 176b параметрами
https://huggingface.co/bigscience/bloom
Несколько недель назад закончилось обучение BLOOM модели от BigScience
Сегодня её выложили
59 языков (русского нет)

Самой большой языковой моделью с русским языком в открытом доступе остается YaLM-100b
На сколько вы сегодня уже уменьшили число людей? 🤡
Forwarded from Russian Business
Яровая заявила, что цель создателей искусственного интеллекта — уменьшить количество людей

«А вы знаете, сколько сегодня съедает искусственный интеллект? Вот те, кто сегодня создают искусственный интеллект — создают его в надежде вытеснить человека.

А кто сегодня потребляет энергию? Люди? Значит, что нужно уменьшить количество людей. Чтобы осталась маленькая группа, обладающая властью и имеющая возможность использовать все это во благо себе с помощью искусственного интеллекта», — заключила зампред Госдумы.

@rb_ru
👍1
#events : ML-тренировка
Когда: 22 (четверг) сентября 2022, 19:00 - 21:30 (сбор с 18:00)
Место: офис Яндекса (Москва, улица Льва Толстого, 16) + онлайн
Язык - русский

Ура, это ML-тренировка: обсуждаем конкурсы и бенчмарки, максимально искренне и без прикрас. Все как в старые-добрые 😉

Программа:
- Максим Рябинин "Бенчмарк приемлемости предложений на русском языке (RuCoLA) + секретный релиз"
- Артём Стрекалов, Дмитрий Гаус "Верификация моделей автомобилей (Machines Can See 2022)"

Нетворк попробую организовать как в офлайне, так и в онлайне.

Регистрация обязательна
❤‍🔥91👍1
#opensource : RuLeanALBERT от Yandex Research
2.9B трансформер для русского, которая влезет в домашнюю ПеКарню ресерчера

Мало того, что это самая большая БЕРТ-подобная модель для русского языка, которая показывает крутые результаты в бенчмарках, так еще и с кодом для fine-tuning-а

GitHub

А в статье можете узнать, как обучалась эта модель (а-ля коллаборативное глубокое обучение) на фреймворке по децентрализованному обучению Hivemind
❤‍🔥9👍41
#events : ML-тренировка
Когда: 17 (четверг) ноября 2022, 19:00 - 21:30 (сбор с 18:00)
Место: офис Яндекса (Москва, улица Льва Толстого, 16) + онлайн
Язык - русский

В этот раз нас ждёт 3 доклада:
- призер только что завершившегося Yandex ML Cup,
- 2ое место хакатона AgroCode Hack по анализу спутниковых снимков для виноградников
- организатор ML соревнований в информационной безопасности

Подробная программа по ссылке ниже
Будем рады видеть всех очно и онлайн ;)
Регистрация обязательна
🔥8👍52❤‍🔥1🤩1🏆1🍾1
#events : ML-трек Ya.Talks
Когда: 3 декабря (завтра) 2022
15:30 - 20:00 (по Москве)
Где: онлайн
Язык: русский, с нейро-переводом на другие языки

Хочу всех вас пригласить на ML-трек.
Нас ждёт 3 доклада и 2 дискуссии.
Каждый доклад, каждая дискуссия отобраны и отработаны, везде я добавил частичку себя.
Очень вас жду, жду ваших вопросов и фидбека.

Регистрируйтесь
6🔥4👍3
#общаемся

По всей видимости 17 декабря пройдет дата-ёлка от ODS.
Она будет онлайн, подробности скину, когда будет регистрация.

Расскажу, что последнего произошло с python (как с языком, так и с компонентами для данных и мл) за последние 3 года.

Буду рад вашим советам, на что обратить внимание в своем рассказе. Писать можно тут, в комментариях к этому сообщению ;)
👍17🍾3👨‍💻2🌚1
Барев дзес, друзья!

#общаемся
Наконец долетел в этот снегопад с ереванского хайлоада. Позже расскажу, какие интересные доклады там были по ML, а сейчас хочу похвалить очень классные локальные сообщества. Ребята встречаются иногда несколько раз в неделю, а уже на следующей неделе, возможно, проведут митап. Если вы там, настоятельно советую присоединиться.

[ODS в Ереване | ru]
[ML Yerevan | en]
👍164🔥4
#events : ML-тренировка Data Dojo
Когда: 24 (суббота) декабря 2022, 12:00 - 18:00 (сбор с 11:00)
Место: офис Яндекса (Москва, улица Льва Толстого, 16) + онлайн
Язык - русский

В этот раз нас ждёт 5 докладов:
- Поговорим про соревнования 2022
- Предсказание исполнителя трека по набору акустических признаков. Разбор решения с Yandex Cup 2022
- Призер хакатона MORE.Tech от ВТБ о своем решении
- Дорога к Kaggle Competitions Master в 17 лет
- Применение AutoML в соревнованиях по машинному обучению

Подробная программа по ссылке ниже
Офлайн приглашения уже разлетелись, но ждем вас в онлайне.
Планируем сделать активность и для онлайна, будет веселее чем в записи!
Регистрация обязательна
🔥7👍62
Тут вышел подкаст со мной:
- за жизнь
- чем занимаюсь в Яндексе
- как дошел до жизни такой
- внутрянку DS затронули по касательной (так что контент совсем ненапряжный)

Контент явно не профильный для канала, да и бабушка учила себя не нахваливать.
Но вдруг вам интересен "yet another" путь в ML-е.

На подкаст-платформах и ютубе (только аудио)
Для большего веселья можно на фоне включить бит Кровосток-Биография
🔥24😴1
#events : ML-тренировка Data Dojo
Когда: 16 (четверг) февраля 2023, 19:00 - 21:30 (сбор с 18:00)
Место: Музей Яндекса на Павелецкой (Москва, Садовническая ул., 82, стр. 2, подъезд 5, этаж 1) + онлайн
Язык — русский

Нас ждёт 3 доклада:
- Обзор активных соревнований: поговорим какие есть, чем интересны, чтоб вам было легче выбрать, в чем поучаствовать
- Ребята расскажут про участие в различных олимпиадах по машинному обучению и как им довелось внедрять это решение в компании
- Селим расскажет про диагностирование перелома шейных позвонков на КТ снимках

У нас новая локация! Там много интересного можно посмотреть
Подробная программа по ссылке ниже
Еще есть возможность влететь в офлайн, но, если что, ждем вас в онлайне.
Регистрация обязательна!
🔥12👍8🎉3
#events
Едем по городам и сёлам
Организуем ML Party в Ереване. Ждем офлайн (всех обниму) или онлайн (регистрация тоже нужна 😉 )

ML Party Yerevan
Когда: 2 (четверг) марта 2023, 18:00 – 21:00 GMT+4 (Регистрация с 17:00)
Место: The Office. улица Вагана Теряна, 91, Ереван + онлайн
Язык — русский

Нас ждёт 3 -4 доклада. например:
- Как МЛ формирует Быстрые ответы в поиске
- Выделение атрибутов из изображений одежды и манипуляция для поиска новых (платье+шелк+горошек-рукава)
- Как рекомендации Яндекс.Музыки помогают пользователю открывать новую музыку и незнакомых слушателю исполнителей.

Подробная программа по ссылке ниже
Если рядом - ждем онлайн, но можно и в онлайне.
Регистрация обязательна
🔥83👍2🤯1
Вышла серия Южного парка (South Park) про ChatGPT
Что интересно, серия называется Deep Learning
Первый случай, чтоб технологии ИИ или продукт на основе ИИ проник так глубоко в массовую культуру

В заключительных титрах авторы эпизода указаны как Trey Parker и ChatGPT.

Описание серии, если лень смотреть.
А для не_фанатов смотреть и не советую, кажется раньше серии были злободневнее и веселее а трава зеленее
🔥13😱3🥴2
Шикарно! Следим за первыми применениями и положительным опытом замены Hadoop/Spark
Яндекс выкладывает в опенсорс одну из основных инфраструктурных BigData-систем собственной разработки — YTsaurus. Это платформа, предназначенная для распределённого хранения и обработки больших данных.

Максим Бабенко, руководитель отдела технологий распределённых вычислений в Яндексе, рассказал историю возникновения YT, а также зачем нужна YTsaurus и где её можно применять.

В Github-репозитории — серверный код YTsaurus, инфраструктура развёртывания с использованием k8s, а также веб-интерфейс системы и клиентский SDK для распространённых языков программирования — C++, Java, Go и Python.

Ссылки на посты на Хабре и Медиуме.
🔥21👍54
8 лет ODS, а на деле больше.
Сколько друзей, коллег, работ и движа.

Спасибо всем, кто участвовал.
Сообщество, в первую очередь, это участники.

В комментариях буду рад услышать ваши cool story про ODS. 💔
💔72❤‍🔥9