REU Data Science Club – Telegram
REU Data Science Club
614 subscribers
380 photos
3 videos
124 links
Телеграмм канал от REU Data Science Club

Здесь вы найдете информацию про Data Science, а также Machine Learning, Data Engineering, Data Analytics 💻

Руководитель: @Sofiaklimova2006
Сотрудничество: @Mary_Kasim
Мероприятия: @mashazrn
Download Telegram
Всем привет! 👋🏻
Мы продолжаем наш месяц, посвященный компьютерному зрению (CV), и сегодня мы подготовили для вас глоссарий основных терминов! 🗒️
Скорее листай карусель! ⏩️

#DSC_words@reu_data_science_club
5🔥1🥰1
Всем привет! 👋🏻Сегодня мы подготовили для вас подборку статей по компьютерному зрению⚡️

🔸Масштабирование оценки выразительной позы и формы человека
LLM обладают знанием внешнего мира, способны работать без предварительного обучения на конкретных данных и генерировать объяснения для своих рекомендаций.
Ссылка 👉🏻 https://caizhongang.com/projects/SMPLer-X/assets/53_smpler_x_scaling_up_expressive.pdf

🔸Оптимизация моделей компьютерного зрения с использованием вознаграждений

Предлагается подход, при котором модели компьютерного зрения дообучаются с использованием функций вознаграждения, что позволяет лучше согласовать их предсказания с задачами пользователя
Ссылка 👉🏻 https://arxiv.org/abs/2302.08242

🔸Система автоматического подбора свёрточных нейронных сетей (CNN) для задач классификации изображений

Рассматривается подход к оценке сложности задачи и подбору оптимальной модели CNN для конкретных задач компьютерного зрения.
Ссылка👉🏻https://arxiv.org/abs/1612.08484

🔸Диверсификация ансамблей глубокого обучения для улучшения обнаружения выбросов и калибровки

Методика диверсификации ансамблей нейронных сетей с помощью карт важности (saliency maps).
Ссылка 👉🏻https://arxiv.org/abs/2305.11616

🔸Рекомендательные системы для изображений

Методы контентной фильтрации (изображения схожи по визуальным характеристикам) и коллаборативной фильтрации (учитываются предпочтения пользователей).
Ссылка 👉🏻https://bigdataschool.ru/blog/recommender-systems.html?utm_source

#DSC_articles@reu_data_science_club
🔥1
Всем привет! 👋🏻
Приглашаем вас 20 марта на лекцию по теме "Графовые нейросети: ИИ на неструктурированных данных"💥

🗣️ Спикер: Сергей Шумилин,

🎯 Руководитель исследовательской группы в Центре искусственного интеллекта Сколтеха
🎯 Занимается физически-информированным машинным обучением
🎯 Руководит проектами по построению мультиагентных ИИ систем для крупных индустриальный компаний
🎯 Окончил аспирантуру Института Системных Исследований РАН.

🗓️ Дата: 20 марта (четверг), 19:30

🔗 Ссылка на регистрацию
👉🏻 https://forms.gle/aLBYG2amCoqMPgjg6

❗️Внимание! Для гостей НЕ из РЭУ регистрация закрывается 18 марта в 23:59❗️

Аудитория будет указана в комментариях.

#DSC_events@reu_data_science_club
🔥8👏3👍21
Всем привет! Сегодня мы хотим поделиться с вами дайджестом на март📝

1. IT purple conf
📅 Когда: 15 марта

🔮Это конференция от Физтеха, где выступят лучшие спикеры IT индустрии (а их будет более 100!) Они выступят по направлениям Math, ML, DEV, AI, Edu, R&D. На конференции будут HR точки, где можно будет пообщаться с работодателями. Также планируются панельные дискуссии, круглые столы и нетворкинг-сессии. В общем, будет познавательно и для карьеры полезно.

Для кого: школьники, студенты, выпускники, учителя в области ML, программирования и математики.

Ссылка👉🏻 https://it-purple.ru/

2. Семинар от стажера-исследователя ВШЭ
📅 Когда: 17 марта
📜Это семинар на тему “От букв к последовательностям: использование метода анализа последовательностей для текстов биографий”. Метод анализа последовательностей (sequence analysis) позволяет сделать выводы о трендах изменений состояний объектов – например, об изменениях состояний жизненного пути и карьеры. Кроме того, будет рассмотрен вопрос как из неструктурированных данных (биографии) сделать табличные данные. В общем, будет интересно.

Ссылка👉🏻 https://anr.hse.ru/announcements/1016660815.html

3. Найти IT
📅 Когда: 18 марта

Найти IT - карьерный форум, на котором проходят лекции, Q&A сессии и мастер-классы с работодателями. Приглашено более 40 IT компаний. В рамках форума можно получить отзыв на резюме, пообщаться лично с HR и руководителями команд. Словом, помочь своей карьере.

Для кого: студенты IT направлений и все, кто хочет развиваться в IT

Ссылка👉🏻 https://careerday.fut.ru/findit_msk/?utm_source=fut&utm_medium=vk&utm_campaign=group&utm_content=mainpost#advantages

4. Yandex ML Party
📅 Когда: 18 марта
🌙Это вечерний митап про ML. Общение будет про тренды, новые подходы и вызовы индустрии с экспертами в области машинного обучения.
Это мероприятие из Санкт-Петербурга, для Москвы доступен только онлайн-формат. Планируется три технических доклада от ведущих инженеров Яндекса и нетворкинг на темы LLM, RecSys, Speech и не только.

Ссылка👉🏻 https://events.yandex.ru/events/ml-party-18-03-2025/

5. Лекция от выпускницы ВШЭ
📅 Когда: 19 марта
🍀На Лектории выпускница ВШЭ Эмилия расскажет:
- Как подготовиться к переходу из гуманитарной сферы в IT
- Какие профессии на стыке этих двух областей актуальны сегодня
- Почему не существует универсальной стратегии транзита и как выбрать свою.
После официальной части планируется нетворкинг с выпускниками Высшей школы экономики.

Ссылка👉🏻 https://alumni.hse.ru/meetup/polls/1022066363.html

6. Yandex Product Party
📅 Когда: 20 марта
🎯Это встреча для опытных продуктовых менеджеров от Яндекса. Темы обсуждения:
🔸 Вывод продукта на рынок
🔸 Запуск B2B-сегмента для B2C-продукта
🔸 Поиск новых решения для зрелых проектов.
Участников ждут четыре доклада, афтепати и знакомство с экспертами из разных компаний.

Ссылка👉🏻 https://events.yandex.ru/events/yandex-product-party-2025/?utm_source=yandex_events&utm_medium=social&utm_campaign=product_party0325&utm_content=landing

#DSC_digest@reu_data_science_club
1
2🔥2👍1
Reu data science club на IT Purple conf 2025 🧡
🥰10🔥7❤‍🔥5😍21👍1🏆1😇1💘1
Вы готовы к онлайн-ликбезу хэда Калинкиной Полины по решению задач по CV? 🔥

Она объяснит все термины сверток для слушателя любого уровня, а также решение задач на них. Если вдруг почувствуете, что ваш мозг начинает «свертываться»😵‍💫, не переживайте - вы просто глубоко погрузились в квинтэссенцию компьютерного зрения.😎

🗓️ Дата: 25 марта (вторник), 21:00

🔗 Ссылка будет в комментариях 💬

#DSC_events@reu_data_science_club
🔥53👍1🐳1
🔗 Ссылка на регистрацию
👉🏻 https://forms.gle/aLBYG2amCoqMPgjg6

❗️Внимание! Для гостей НЕ из РЭУ регистрация закрывается 18 марта в 23:59❗️

🗓️ Дата лекции: 20 марта (четверг), 19:30
Всем привет! 👋🏻 Сегодня приготовили для вас подборку вопросов с собеседований 🔥 Бегите скорее изучать 🔍

Как изменится ROC-AUC, если мы при текущем 80% умножим все скоры на 1.25?
✔️ROC-AUC не изменится. ROC-кривая строится на основе рангов предсказаний, а умножение всех скоринговых значений на одно и то же положительное число не меняет их порядок. Следовательно, ROC-AUC останется 80%.

Что такое токен в обучении BERT?
✔️В контексте BERT токен — это минимальная единица текста, используемая в модели. Перед обработкой текста он сначала разбивается на токены с помощью токенизатора (например, WordPiece), затем каждый токен превращается в числовой идентификатор, который подается в нейросеть. Также существуют специальные токены, такие как [CLS] (для классификации) и [SEP] (разделитель предложений).

Что находится на осях кривой обучения?
✔️- По оси X (горизонтальная ось) обычно откладывается количество обучающих примеров или итераций/эпох.
- По оси Y (вертикальная ось) отображается ошибка или метрика качества (например, accuracy, loss) на обучающем и валидационном наборах.

Чем метрика микро отличается от макро в многоклассовой классификации?
✔️- Micro-averaging: суммирует TP, FP и FN по всем классам, а затем вычисляет метрику (например, Precision, Recall, F1). Это делает микро-метрики более чувствительными к классам с большим количеством примеров.
- Macro-averaging: вычисляет метрики отдельно для каждого класса, а затем усредняет их. Это придает равный вес каждому классу, независимо от его представленности в данных.

#DSC_interview@reu_data_science_club
А мы продолжаем делиться с вами лайф контентом!
Reu data science club на карьерном форуме найти IT 🧡
10❤‍🔥2🔥1🥰1😍1
Дорогие друзья! 🧡

Мы рады сообщить вам, что открываем новый вид постоянного набора! 💥

Чтобы стать частью нашей команды вне основного набора, вам нужно выполнить несколько условий:

🎯 Изучить рекомендуемые материалы, которые помогут понять основы машинного обучения и аналитики.
🎯 Реализовать небольшой индивидуальный проект на платформе Kaggle.
🎯 Пройти собеседование, на котором вы защитите проект, объяснив свое решение и ответив на вопросы.

Всю подробную информацию и материалы для изучения вы можете найти в приложенном файле👇🏻
https://docs.google.com/document/d/1eNqIQ0yUvZriEddiGsGr-CfY51Jv-fUdcfPKFvsTTlM/edit?usp=sharing

🌟 Даже если вы планируете дожидаться основного набора, мы советуем изучить материалы — это станет хорошим преимуществом при отборе!

Не упустите свой шанс стать частью нашего сообщества! 🐱
🥰6👍42🔥1