REU Data Science Club – Telegram
REU Data Science Club
615 subscribers
380 photos
3 videos
124 links
Телеграмм канал от REU Data Science Club

Здесь вы найдете информацию про Data Science, а также Machine Learning, Data Engineering, Data Analytics 💻

Руководитель: @Sofiaklimova2006
Сотрудничество: @Mary_Kasim
Мероприятия: @mashazrn
Download Telegram
Привет, друзья!
Наши колеги сделали классный канал про поиск стажировок

Устали искать информацию о том, как найти начальную позицию, если практически везде нужен опыт работы?🤔
Что тогда делать, чтобы взлететь по карьерной лестнице?

🟨 Следить за анонсами мероприятий для студентов, стажировок, волонтерств, кейс-чемпионатов и других крутых карьерных активностей в тг-канале "Что мне делать"

🟨 Изучить каталог компаний со стажировками для студентов

🟨 Начать строить своё светлое будущее☀️

И помните: сейчас самое время начать!
3❤‍🔥3🔥2
🔗 Ссылка на регистрацию
👉🏻 https://forms.gle/QTPBwvbm93vcX26J7

❗️Внимание! Для гостей НЕ из РЭУ регистрация закрывается 27 мая в 23:59❗️

🗓️ Дата лекции: 29 мая (четверг), 19:30
2🔥1🤯1
Уважаемые участники! 💜

Сегодня в 19:00 стартует второй блок ML school PRO, в котором мы погрузимся в мир последовательных данных и работы со временем! 📊

В этом блоке мы:

🟣 Разберемся в основах временных рядов, что такое тренд, стационарность и ARIMA

🟣 Рассмотрим особенности работы с последовательными данными, как правильно разбивать на подвыборки и не переобучаться

📌 Домашнее задание: будем учиться предсказывать временные ряды — бесценный навык для реальных задач!

🔗 Ссылка на курс (Stepik): https://stepik.org/course/240191

💬 Чат школы: https://news.1rj.ru/str/+jzElvsUyrJg0MmJi

#ML_School_Pro@reu_data_science_club
4👍2🔥2💯2👏1
REU Data Science Club
Photo
Ждём вас в 101 аудитории 3 корпуса!
Приветствуем всех! 🎆Напоминаем, что сегодня в 19:00 стартует третий блок ML School Pro, который будет посвящен обучению представлений. На нем мы:

🟣 Разберем, что такое эмбеддинги и как их использовать для классификации текста и изображений в связке с Catboost

🟣 Рассмотрим основные модели для получения эмбеддингов

🟣 Научимся валидировать качество эмбеддингов

🔗 Ссылка на курс (Stepik): https://stepik.org/course/240191

💬 Чат школы: https://news.1rj.ru/str/+jzElvsUyrJg0MmJi

#ML_School_Pro@reu_data_science_club
1🔥1👏1
Reu DS club на young con 🧡

По традиции делимся с вами фотографиями 💫
7🔥2❤‍🔥1🥰1😍1💯1
Всем привет, на связи REU DS Club! 🐱

Лето позади — а это значит, что начинается новый, ещё более насыщенный сезон нашего сообщества. В этом году вас ждёт ещё больше:

🔶 ярких мероприятий и встреч
🔶 полезных материалов по Data Science
🔶 дайджестов событий и подборок вакансий
🔶 экскурсий в офисы топовых IT-компаний
🔶 разборов реальных тестовых заданий

Совсем скоро мы анонсируем открытую лекцию, на которой вы сможете познакомиться с командой, узнать детали и понять, когда откроется набор 🤩

❗️Чтобы ничего не пропустить, вступайте в наше сообщество, следите за новостями и включайте оповещения — мы делимся только полезной информацией!
🔥104🥰2👍1
Всем привет! 👋🏻

🔍Продолжаем нашу рубрику, в ходе которой разбираем ключевые понятия из мира Data Science. Сегодня на очереди метрика, которую вы наверняка видели в каждом втором туториале по бинарной классификации — AUC-ROC.

🔸AUC-ROC (Area Under the Receiver Operating Characteristic Curve) — это численная метрика, которая показывает, насколько хорошо модель разделяет два класса (например, «спам» / «не спам»).

Её значение равно площади под ROC-кривой — графиком, где по вертикали откладывается True Positive Rate (какую долю реально положительных объектов модель правильно определила), а по горизонтали — False Positive Rate (какую долю реально отрицательных объектов модель ошиблась и назвала положительными).

📊 Как интерпретировать результат?
- 1.0 — идеальное разделение классов;
- 0.9–0.99 — отличное;
- 0.8–0.89 — хорошее;
- 0.7–0.79 — среднее;
- 0.5–0.69 — плохое (не лучше случайного угадывания);
- < 0.5 — модель работает хуже случайности.

Ключевая особенность AUC-ROC — она не зависит от порога классификации и дисбаланса классов. Фактически, она отвечает на вопрос: «Насколько часто случайно выбранный положительный объект получает от модели более высокую оценку, чем случайно выбранный отрицательный?».

📌Используйте эту метрику, когда вам важно оценить именно качество ранжирования объектов, а не только точность при конкретном пороге.

А вы часто используете AUC-ROC в своих проектах?

#DSC_words
5
Дорогие друзья, у нас на очереди ещё один спикер нашей онлайн-школы ML School Pro! (https://news.1rj.ru/str/+_066h615TXVkZmMy) 🚀 Мы с радостью представляем вам:

🟣 Кристиан Кузнецов:
📍 ML Engineer в Huawei
📍 PhD в Сколтех
📍 Исследователь в области LLM

Раньше Кристиан ассистировал и вёл семинары по матану в Вышке. Мы уверены, что его фундаментальные знания помогут вам не просто разобраться в теме, а понять её на глубоком уровне! 💻

Если вы ещё не с нами — самое время присоединиться!
#ML_School_Pro
7🔥3👍1
Всем привет! 🐱
У нас для вас есть замечательная новость, сегодня в 19:00 стартует четвертый блок ML School Pro, который будет посвящен снижению размерности данных! 🚀 На нем мы:

🟣 Рассмотрим , для чего нужно снижение размерности в DataScience

🟣 Научимся использовать линейные и нелинейные алгоритмы

🟣 Разберем как применять на практике снижение размерности на примере нескольких задач

🔗 Ссылка на курс (Stepik): stepik.org/course/240191

💬 Чат школы: https://news.1rj.ru/str/c/2630539740/2

#ML_School_Pro
🔥21🥰1
🧡 Презентация REU Data Science клуба 🧡

Мы так долго ждали, чтобы познакомиться с вами, и вот наконец-то готовы пригласить на лекцию «Как вкатиться в DS»! 🎉🥳

На ней вы сможете узнать:
🔶что такое DS, где он используется и в каких сферах
🔶как вы сможете развиваться в клубе
🔸подробнее о менторстве и всех его плюшках
🔸 кейсы, проекты, хакатоны
🔸 алло свободное время, да да ивенты
- неформалки
- ликбезы
- лекции
- экскурсии в лучшие компании
🔸 разные департаменты, где ты точно найдешь людей со схожими интересами

Интересно? 🔥 Это еще далеко не все!
Приходи, чтобы стать частью нашего коммьюнити ❤️‍🔥

🗓️Когда?
24 сентября (среда) 19:30

📍Где?
РЭУ им Г.В. Плеханова, Стремянный переулок, 36 (м. Серпуховская)
🔎Аудитория будет указана в комментариях

Ссылка для регистрации на лекцию
🔗 https://forms.gle/QNRGxanMHNXuQ1yq9

❗️Внимание! Для гостей НЕ из РЭУ регистрация закрывается 21 сентября в 23:59❗️

Будем ждать тебя

#DSC_events
6🔥5❤‍🔥1👍1🥰1
Всем привет! Мы заряжены на новый сезон и готовы представить вам дайджест на сентябрь 📝

1. big tech night
📅 Когда: 12 сентября
🌙 Своеобразная «ночь музеев» в мире IT. Яндекс, Сбер, X5, Т-Банк и Lamoda откроют двери своих офисов для тех, кто любит технологии. В программе — доклады, экскурсии-погружения, лаборатория софт-скилов и многое другое.

Ссылка👉🏻 https://bigtechnight.ru/

2. E-CODE 2025
📅 Когда: 13-14 сентября
🌙 Конференция от Озон, где вы сможете:
🔸Послушать экспертов Озон и других бигтехов
🔸Получить карьерную консультацию
🔸Понетворкаться в чатах и лично с экспертами IT-индустрии
🔸Получить кастомный мерч и приятные подарки

Ссылка👉🏻 https://ecode.ozon.tech/

3. Data Driven
📅 Когда: 20 сентября
📈 Это ежегодная конференция для аналитиков от Яндекса. На конференции вы сможете:
🔸Увидеть реальные кейсы от экспертов
🔸Пообщаться 1 на 1 с руководителями направлений аналитики
🔸Принять участие в активностях и получить за это призы
🔸Неформально пообщаться на афтерпати

Ссылка👉🏻 https://events.yandex.ru/events/data-driven-2025

4. Доклады по ИС
📅 Когда: 23-27 сентября
🌙 Доклады позволят вам узнать о современных подходах к созданию и развитию информационных систем с участием ИИ. Всего докладов будет шесть.

23-26 сентября: один доклад с 9 до 10 утра
🌤 27 сентября: два доклада с 11 до 12 и с 12 до 13.

Ссылка👉🏻 https://systemsdesign.online/2025-ai

5. Yandex Neuro Scale
📅 Когда: 24 сентября
Это конференция от Yandex Cloud, где расскажут про практическое применении моделей машинного обучения, новые кейсы по работе с данными и многое другое.

Ссылка👉🏻 https://scale.yandex.cloud/

6. Презентация ДС клуба
📅 Когда: 24 сентября
💥 Вместе с презентацией сделаем лекцию "Как вкатиться в DS?" от нашего клуба🧡 На ней вы сможете узнать:
🔶что такое DS, где он используется и в каких сферах
🔶как вы сможете развиваться в клубе
🔸подробнее о менторстве и всех его плюшках
🔸 кейсы, проекты, хакатоны и многое другое

🔥 Это еще далеко не все!
Регистрируйся по ссылке снизу и приходи, чтобы стать частью нашего коммьюнити ❤️‍🔥"

Ссылка👉🏻 https://forms.gle/QNRGxanMHNXuQ1yq9

7. Вебинар «Статистика в действии: как анализ данных помогает изучать людей»
📅 Когда: 25 сентября
📌 На вебинаре вы ознакомитесь с тем, как современные методы анализа данных работают в реальных задачах социальных наук, и узнаете, как вы можете применять их для своих кейсов.

Ссылка👉🏻 https://social.hse.ru/dpo/announcements/1072049930.html

8. Practical ML Conf
📅 Когда: 27 сентября
🔑 Конференция посвящена практическому применению машинного обучения. Реальные кейсы, технические доклады и опыт ведущих инженеров помогут узнать, как извлекать реальную пользу из ML для продуктов и бизнеса.

Ссылка👉🏻 https://pmlconf.yandex.ru/2025/

9. Продукты 24 × ffdd2d
📅 Когда: 27 сентября
💫 В этом году Т Банк объединил две крупные конференции - Продукты 24 и ffdd2d. Конференция будет о продуктах, дизайне и аналитике. Расскажут о метриках, данных и креативах. Будет общение с экспертами, вайбкодинг и командные челленджи.

Ссылка👉🏻 https://producty24-ffdd2d.ru/

10. Лекция от ДС клуба
📅 Когда: 1 октября
💥 На лекции вы познакомитесь с AI-агентами и узнаете как их создавать через платформу n8n. Лекцию будет вести основатель REU Data Science Club, аспирант Сколтеха по ML, Петр Сокерин.

Ссылка👉🏻 Дадим перед мероприятием

11. Вебинар от ВШЭ
📅 Когда: 1 октября
💻 В ходе вебинара от МИЭМ ВШЭ состоится дискуссия о возможностях AI в современном мире с акцентом на вопросах подготовки данных для использования ИИ-инструментов.

Ссылка👉🏻 https://miem.hse.ru/announcements/1072083901.html
10
Всем привет, на связи REU Data Science Club! Спешим вам рассказать свежие новости из мира IT 👾

💥 Вышел грандиозный RAG 2.0
Появился RAG 2.0, в котором LLM ускоряются в 30 раз и обрабатывают в 16 раз больше контекста без потери точности. Основное улучшение – сжатие с помощью фреймворка REFRAG каждого фрагмента текста из 16 токенов в один плотный вектор (chunk embedding). В результате скорость первого ответа повышается в 30 раз, а всей обработки – в 7 раз.

💻 Наступила эра однобитных LLM
Однобитный DeepSeek - V 3.1. обошел GDP 4.5 благодаря Unsloth Dynamic GGUF. Формат основан на стандартной схеме GGUF, но в нем добавлена динамическая квантизация слоев нейросети. То есть разные части модели обрабатываются с разной точностью, в зависимости от их значимости для конечного результата. Это позволяет экономить ресурсы и ускоряет обработку запросов.

💡 Новая полезная фича в Claude
Теперь можно генерировать и редактировать pdf, презентации и таблицы. Все это теперь делается через промпты, что увеличивает удобство и эффективность.

🚀 Cursor улучшили свою фичу
Предсказания через таб стали точнее на 28%. Все благодаря изменениям в сборе данных и reward модели. Reward модель предсказывает вероятности разных исходов и вероятность, что оффер будет принят. Reward исходя из вероятностей поощряет принятые и штрафует отклонённые предложения. В награде также учитывается длина предложения и общее число предложений. Стало на 21% меньше предложений, при этом доля принятия увеличилась на 28%.

Qwen пишет рэп
Модель распознавания речи от Qwen показывает высокую точность даже в сложных условиях. Модель Qwen-3-ASR умеет распознавать как обычную речь, так и песни/рэп/шумы. Автоматически узнаёт язык говорящего и без дообучения распознаёт особенные имена и фразы (их достаточно просто загрузить).

Оставайтесь с нами, чтобы быть в теме! 😉

#DSC_new@reu_data_science_club
👍53🔥3
🍂Сентябрь - время обновлений - начало нового сезона и учебного года, пора и для себя открывать что-то новое!
Например, пройти на стажировку в крутую компанию! Как раз подготовили подборку для вас

🧡Стажировка в Яндексе
🔸Набор на несколько направлений
▪️ML
▪️Аналитика данных
▪️Yandex Research ML Residency
👉🏻Ссылка https://yandex.ru/yaintern/internship

🧡Стажировка в Сбере
🔸Набор на несколько направлений
▪️Data Science
▪️Data Engineering
▪️Оптические вычисления
▪️Разметка данных
👉🏻Ссылка https://sberstudent.ru/internship/

🧡Стажировка в ВК
🔸Набор на несколько направлений
▪️Бизнес -аналитик
▪️Data Engineer
👉🏻Ссылка https://internship.vk.company/internship?direction=6%2C4

🧡Стажировка в X5 Group
🔸Набор на несколько направлений
▪️Аналитика данных
▪️Data Engineer
▪️Data Scientist
▪️Дата инженер
👉🏻Ссылка https://techcrew.start.x5.ru/#reg

🧡Стажировка в Билайн
▪️Data Scientist
👉🏻Ссылка https://job.beeline.ru/vacancies?internship=true&cities=1

🧡Стажировка в Мегафон
▪️Data Scientist LLM
👉🏻Ссылка https://job.megafon.ru/vacancy/all/intern

Вакансии разлетаются со скоростью света, успей подать заявку! 🔥

Думаешь, что ещё не готов для стажировки?
💡 Приходи на лекцию клуба 24.09 в 19:30 и узнай как получить нужные навыки!
🔗Ссылка для регистрации: https://forms.gle/QNRGxanMHNXuQ1yq9

🔗Подписывайся на наше вк сообщество:
https://vk.com/reu_ds_club

#DSC_job
8