DeepSchool – Telegram
DeepSchool
10.3K subscribers
77 photos
1 video
1 file
432 links
Это канал школы deepschool.ru. Здесь мы будем:
- напоминать вам теорию ML/DL в виде коротких постов,
- задавать вопросы с собеседований,
- рассказывать про полезные фреймворки
- и делиться советами, которые помогут вам в работе.

@deepschool_support
Download Telegram
ModelSoups: варим суп из моделей

Если вы когда-нибудь участвовали в хакатоне или пытались повысить качество продуктового решения — скорее всего, вы уже сталкивались с усреднением предсказаний нейронных сетей. Но что делать, если мы хотим улучшить точность решения, не потратив при этом дополнительного времени на инференс нескольких моделей? Ответ есть: усреднение весов моделей, а не их выходов.

В 2022 году вышла статья, поймавшая тогда большой хайп: “Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time”. Авторы показали, как можно из нескольких моделей получить одну — лучшую по качеству модель за счет усреднения весов. В нашей статье мы подробно разобрали теорию и результаты, чтобы вы могли применять этот подход в своих задачах 🙂

Сегодня мы рассмотрим:
- Model Soups подход к усреднению весов модели и его результаты
- теорию подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/ModelSoups-2a26f819d3964a61ac7bdde0e48897c8?pvs=4
25🔥13👏7👍2🎉2🤩2🍾1
Как применяют CV в сейсморазведке

Есть малоизвестный (в силу своей специфики) домен, где можно применять CV — сейсморазведка. Сегодня мы познакомимся с этой наукой и расскажем, как в ней можно применить глубокие нейронные сети. А еще докажем, что многие задачи возможно представить как хорошо нам знакомые задачи компьютерного зрения.

Из статьи вы узнаете:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов

Если хотите узнать, как компьютерное зрение помогает находить нефть и другие полезные ископаемые — скорее переходите по ссылке: https://www.notion.so/deepschool-pro/CV-0ec38f8cd403420ab5570cdd4785503e?pvs=4
👍2714🔥12🤯4🐳1
5 инструментов эффективного DS-инженера

Выше мы писали, что любому DS-инженеру важно перенимать навыки и инструменты от разработчиков.

Ведь мы тоже пишем код, правим бизнес-логику, стараемся снижать bus factor и хотим, чтобы в проектах не было багов. Разве что следить нам приходится не только за кодом, но и за данными, экспериментами, моделями и прочими артефактами.

Чтобы упростить нашу жизнь, есть множество инструментов. Часть DS-специфичны (DVC, CML, MLFlow, etc), а часть просто перенята от коллег-разработчиков (CI/CD, тесты, конфиг-файлы, docker, etc).

🔥 И на ближайшей лекции мы расскажем о 5 важных инструментах!

А именно обсудим:
1️⃣ как использовать makefile для автоматизации рутины
2️⃣ какие тесты писать для моделинга
3️⃣ чем хорош lightning и как его использовать
4️⃣ как повысить качество кода с помощью линтеров
5️⃣ трекинг и визуализацию в CML

А также представим программу курса CV Rocket и подарим скидки на обучение!

🙋‍♂️ Спикер лекции — Егор Осинкин, Lead CV Engineer, EPAM
🗓 Встречаемся 21 марта, чт, 18:00 МСК!

Регистрируйтесь по ссылке!

После регистрации мы пришлем вам список полезных библиотек и сервисов для CV-инженеров!
Также в телеграм-боте будет краткий анализ CV-вакансий, где мы изучили, как менялись зарплаты, как они зависят от требований и от грейдов.

Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥97🐳2
Где грань между синдромом самозванца и адекватной оценкой навыков и как планировать своё развитие как специалиста

Об этом мы поговорим на прямом эфире с Андреем Шадриковым сегодня 19 марта

Коротко об Андрее:
- Head of R&D Verigram
- команда Андрея занимает топовые места в главном бенчмарке по распознаванию лиц от NIST
- большую часть карьеры посвятил задачам биометрии
- организует митапы и выступает на них (BeeTech, Sberloga, Samsung AI Campus)
- преподает блок по распознаванию лиц на CV Rocket

🗓 19 марта в 18:00 МСК проведём интервью с Андреем, где обсудим:

- как адекватно оценить свой уровень
- какие задачи брать в первую очередь
- как составить роадмап развития в индустрии
- и как это развитие ускорить

Эфир пройдёт в нашем канале DeepSchool | CV Rocket

Переходите в канал и присоединяйтесь к нашему интервью!
До встречи на прямом эфире!🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤‍🔥5👍52👏1
Повышаем эффективность DS-инженеров

Напоминаем, что уже завтра проведём лекцию, на которой расскажем об инструментах, которые позволяют развиваться CV-инженеру и решать задачи эффективнее.

Обсудим:
1️⃣ как использовать makefile для автоматизации рутины
2️⃣ какие тесты писать для моделинга
3️⃣ чем хорош lightning и как его использовать
4️⃣ как повысить качество кода с помощью линтеров
5️⃣ трекинг и визуализацию в CML

Регистрируйтесь и приходите завтра в 18.00 МСК!

🔥 Ещё после регистрации вы получите список полезных библиотек и сервисов для CV-инженеров

До встречи на лекции!😉
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥9👏7👍1
🔥Начинаем через 15 минут

Вы ещё успеваете зарегистрироваться!

На лекции разберём:
1️⃣ как использовать makefile для автоматизации рутины
2️⃣ как помогают тесты
3️⃣ чем хорош lightning и как его использовать
4️⃣ как повысить качество кода с помощью линтеров
5️⃣ трекинг и визуализацию в CML

И представим программу курса «CV Rocket»

Присоединяйтесь к лекции!
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥5👏4
DETR

Для 2024 года трансформеры в различных задачах CV — частое явление, которым мало кого удивишь. Тем интереснее первые шаги ресёрчеров на пути использования знаменитой encoder-decoder архитектуры.

В середине 2020 года миру представили детектор DETR, или DEtection TRansformer. Он оказался способным решать задачу детекции напрямую: предсказывать список боксов и соответствующих им классов по изображению.

В этой статье мы:
- узнаем, как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детально разберем архитектуру DETR
- и посмотрим на результаты её применения в downstream задачах

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/DETR-ce96a32c90974db5825a3b6698a9ae2b?pvs=4
👍25🔥1911
4
Как научиться решать end-to-end задачи в CV

Недавно мы провели лекцию об инструментах для ML-инженеров.
Спасибо, что пришли, задавали вопросы и делились впечатлениями!

На встрече мы представили программу курса CV Rocket.
И рады приветствовать всех, кто уже присоединился к 7-му потоку!🎓

Если вы хотите закрыть пробелы в знаниях Computer Vision и освоить весь путь создания DL-проектов: от сбора данных до деплоя веб-сервисов — приходите учиться на программу CV Rocket от нашей команды.

После обучения вы повысите свою ценность на рынке, улучшите процессы в команде и научитесь решать полный цикл CV-задач:
🔹собирать чистые данные
🔹быстрее обучать модели
🔹ускорять нейросети
🔹создавать веб-сервисы
🔹автоматизировать их деплой
🔹настраивать мониторинг приложений
🔹решать задачи распознавания лиц, текстов, генерации и многое другое

Что особенного в нашей программе:
🔸12 спикеров из разных отраслей и компаний
🔸много фидбека и общения со спикерами: на zoom-лекциях, в рамках code review, на семинарах и в чате
🔸сложные задачи: 2 больших end-to-end проекта, которые с гордостью можно добавить в резюме

До 28 марта у вас есть возможность присоединиться к обучению со скидкой 10.000 ₽ по промокоду 10CVR!
Или можете внести предоплату и зафиксировать за собой скидку и место на курсе до 1 апреля.

Подробнее о программе и спикерах читайте на сайте.

Присоединяйтесь к CV Rocket!🚀
И до встречи на лекциях!
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥8👍5
Grounding Dino

Мультимодальность сегодня — одна из самых популярных вещей в глубоком обучении. В новой статье мы рассмотрим, как на основе Grounding Dino можно добавить язык к задаче детекции объектов на изображениях. А ещё узнаем, что включение дополнительной модальности позволяет не только создавать запросы вида “самая правая кошечка”, но и находить объекты классов, которых нет в обучающей выборке.

Из этой статьи вы также узнаете:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino
- как запустить и потрогать модель сегментации на основе Grounding Dino
- и как с помощью сегментации и диффузии заменить объект на картинке

Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Grounding-DINO-054a72d301d840ec99611cd76acba169?pvs=4
👍22🔥1612❤‍🔥1😁1
Дайджест статей за март

Встречайте первый дайджест статей на канале!
Мы собрали вместе все статьи за последний месяц и получилось очень разнообразно — от обучения сетей до 3D, от разбора трансформера для детекции до составления ансамбля моделей. Надеемся, что вы не упустите то, что вам интересно 🤗

Negative learning
Рассказываем, как обучиться с хорошими результатами на неидеальных датасетах с ошибками и противоречивыми данными:
- в чём ключевая идея подхода
- его плюсы и минусы
- и как добиться очень хороших результатов на шумных данных

3D Gaussian Splatting
Разбираемся, как обеспечить высокое качество сгенерированных 3D сцен вместе с быстротой обучения и отрисовки:
- как Gaussian Splatting использует гауссианы для представления трёхмерного пространства
- как позволяет эффективно отрисовать новые изображения для сцены
- как обучается создавать детализированное представление сцены

ModelSoups: варим суп из моделей
Изучаем, как усреднение весов моделей может улучшить точность итогового ансамбля:
- Model Soups подход к усреднению весов модели и его результаты
- теория подхода, а также границы применимости и сопутствующие требования
- применение подхода в СV и NLP направлениях

Как применяют CV в сейсморазведке
Познакомимся с применением DL в прикладной науке — сейсморазведке:
- что такое сейсморазведка
- как в ней применить подходы на основе глубоких нейронных сетей
- примеры открытых сейсмических данных
- как можно решить задачу их интерпретации с помощью CV
- и какие есть известные соревнования по МО на базе сейсмических датасетов

DETR
Препарируем пионера CV детекции на базе архитектуры трансформер:
- как решать задачу детекции напрямую — без дополнительных методов по типу NMS (non-maximum suppression) или генерации анкоров
- детальный разбор архитектуры DETR
- результаты её применения в downstream задачах

Grounding Dino
Выясняем, как мультимодальность улучшает детекцию объектов с помощью Grounding Dino:
- зачем нужна “дружба” между языком и картинками и какие у неё бонусы
- какая архитектура у Grounding Dino
- как соединить модальности
- каким образом можно запустить и потрогать Grounding Dino

✌️Что вам было интересно в этом месяце? О чём вы бы хотели прочитать на канале? Пишите в комментарии!
28🔥23👍13🐳1
Diffusion Models

Сегодня поговорим о моделях диффузии и их превосходстве над Generative Adversarial Networks (GANs) при создании высококачественных синтетических изображений. Познакомимся со статьёй “Diffusion Models Beat GANs on Image Synthesis”, авторы которой доказали: диффузионные модели помогают обеспечить наилучшее качество генерации изображений.

В статье также рассмотрим:
- процесс диффузии (forward и reverse)
- Denoising Diffusion Probabilistic Models (DDPM)
- большое количество ablation study
- обучение
- математику в первом приближении
- и ещё много чего :)

Читайте нашу новую статью по ссылке: https://www.notion.so/deepschool-pro/Diffusion-Models-Beat-GANs-on-Image-Synthesis-b178e701e6d44cac9df11a501067d666?pvs=4
🔥37👍96👏2
Полезные Linux-команды

Linux — неотъемлемая часть инструментария каждого Data Scientist'а.

В этой статье мы рассмотрим полезные команды, которые позволят:
- создавать виртуальные сессии
- профилировать ресурсы
- добавлять переменные окружения

А в конце вы найдёте шпаргалку с основными Linux-командами 😊

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Linux-715cb84e836f402a911f28fa3c4e753a?pvs=4
🔥2710👍7
Запускаем наш новый подкаст «Под капотом»!

В нём мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.

Первый выпуск: 3D, SLAM и лидары 🚗
Нашим гостем стал Игорь Ильин, Senior SLAM разработчик и спикер курса 3D CV от DeepSchool.

Вместе мы обсудили:
- что такое SLAM и как он связан с теорией управления
- принципы работы лидаров
- отличия компьютерного зрения в 3D от 2D
- сложно ли найти работу в 3D CV

Выпуск получился насыщенным, поэтому мы разделили его на две части. Скоро запостим следующую, там больше поговорили о жизни, карьере и будущем человечества 🙂

Смотрите подкаст на youtube!

Делитесь в комментариях, о чём бы вы хотели услышать в следующем выпуске!
Please open Telegram to view this post
VIEW IN TELEGRAM
19🔥16👍6
Прекрасное далёко. Где мы на пути к Метавёрсу

Сегодня построение Метавёрса — приоритетное направление для многих крупных компаний, таких как Epic Games. В статье мы рассмотрим, на каком этапе развития он находится, и какие задачи стоят перед разработчиками. А ещё представим обзор 3DCV алгоритмов и инструментов. Сейчас они уже широко применяются как для строительства Метавёрса, так и для решения более прикладных задач.

Из статьи вы узнаете:
- какие недостатки и преимущества NeRF
- почему учёные создали 3D Gaussian Splatting и зачем объединили его с NeRF
- какие бывают аватары людей и чем они отличаются
- какие инструменты позволяют использовать NeRF и 3D Gaussian Splatting в ваших проектах
- и какие актуальные задачи стоят перед 3DCV исследователями

Читайте статью по ссылке: https://deepschool-pro.notion.site/c181878b1532401a801fb995ab44d4f5
🔥18😍98👍1😁1
Новая программа курса 3DCV

Недавно закончился 2 поток курса по 3DCV, на этой неделе проведём выпускной🍬

Мы уже обновили программу и добавили новые лекции по Gaussian Splatting, а сейчас готовим новый поток. Скоро будем подробнее знакомить вас с направлением 3D, формируем подборку статей, не пропустите🔥

С последнего набора накопилось много желающих попасть на обучение, некоторые уже успели записаться в лист ожидания и даже присоединиться к новому потоку. Мы решили провести встречу, чтобы познакомить вас с обновлённой программой 3DCV и тем, какие направления есть в области 3DCV.

В среду 17 апреля проведём zoom-презентацию курса. На ней расскажем о курсе, представим обновленную программу и подарим самые большие скидки тем, кто готов присоединиться раньше всех. Если вам интересна тема 3DCV и вы хотите начать развиваться в этом направлении компьютерного зрения, регистрируйтесь и приходите на встречу!

Запишитесь в анкету по ссылке, чтобы попасть на презентацию, и мы отправим вам приглашение.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥188👍6
Диффузия на трансформерах

До недавнего времени самые популярные диффузионные модели имели архитектуру UNet (например, всеми любимый Stable Diffusion). В феврале 2024 года OpenAI написали про свою видео-диффузию SORA, а затем и Stability анонсировали StableDiffusion3, где основной архитектурой уже выступил трансформер. Оказывается, это совсем не первый случай работы диффузионной модели на трансформере.

В нашем обзоре мы:
- вспомним, что такое Vision Transformer
- разберём несколько статей, где применили эту архитектуру для диффузионной генерации
- рассмотрим результаты улучшения качества генерации с помощью такого подхода

Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/187d749559ae4717a13f0cc8c708ced2?pvs=4
🔥43👍1312❤‍🔥5
Подборка статей 3DCV от DeepSchool

Собрали коллекцию постов по теме 3D Computer Vision, опубликованных в нашем канале. Теперь в них проще ориентироваться и перечитывать интересующие 🔥

Основы
🔹 Знакомство с 3D CV: обзор основных задач и способов их решения.
🔹 Геометрия формирования изображения: обсуждение модели камеры и матриц, нужных для превращения 3D-объекта в изображение.
🔹 Калибровка камеры: анализ краеугольного камня всего CV, который играет важную роль в 3D-задачах.

Научные статьи
🔹 SIGGRAPH: обзор интересных статей по случаю самой известной конференции по 3D.
🔹 NeRV: Neural Reflectance and Visibility Fields for Relighting and View Synthesis: обсуждение возможности изменять освещение сцены в NeRF-представлениях.
🔹 3D Gaussian Splatting: Revolutionizing Real-Time Radiance Filed Rendering: разбор недавно нашумевшего Gaussian Splatting’а.

LiDAR
🔹 Виды представления лидарных данных. Часть 1: анализ работы лидара и видов данных, в которых мы можем их представлять.
🔹 Виды представления лидарных данных. Часть 2: разбор трансформации данных в многоканальные изображения и Bag-of-Points представление.
🔹 Виды представления лидарных данных. Часть 3: обзор представления в виде вокселей.

Решаемые задачи
🔹 Сегментация поверхности земли: туториал по тому, как определять плоскость земли с помощью лидарных данных (чтобы уверенно стоять на ногах в области 3D 😉).
🔹 Как применяют CV в сейсморазведке: изучение 3D не только вдаль, но и вглубь.
🔹 Особенности 3D медецинских данных: обзор задачи анализа 3D-данных в медицине.
🔹 Прекрасное далёко. Где мы на пути к Метавёрсу: обсуждение вызовов, которые стоят перед инженерами 3D CV при строительстве Метавёрса.
26👍11🔥9🤔1