Жизнь CV-модели после релиза
После релиза работа не заканчивается — и именно здесь начинаются реальные сложности. Как понять, что модель начала деградировать? Как построить поддержку, если в команде нет лишних рук? Как мониторить предсказания CV-модели?
Мы подготовили открытую лекцию, на которой разберём, где и что может пойти не так после релиза, как это вовремя заметить, и что делать, если количество моделей растёт, а команда всё та же.
На лекции расскажем:
- как в реальности выглядит цикл жизни CV-модели
- как выстраивать поддержку: что можно автоматизировать, а что — нет
- как следить за качеством модели: дрифты, аутлаеры, шум, ключевые метрики
- какие есть подходы для автоматизации мониторинга модели
- и спроектируем возможное решение на примере реальной задачи
А также представим программу курса CV Rocket и подарим скидки на обучение всем участникам лекции!
Обо всём этом расскажут:
— Анастасия Старобыховская — руководитель CV-направления НЛМК ИТ
— Тимур Фатыхов — основатель DeepSchool, ex Lead CV Engineer, KoronaPay
🗓 24 апреля, четверг, 18:00 МСК.
Регистрируйтесь по ссылке — увидимся в четверг!
После релиза работа не заканчивается — и именно здесь начинаются реальные сложности. Как понять, что модель начала деградировать? Как построить поддержку, если в команде нет лишних рук? Как мониторить предсказания CV-модели?
Мы подготовили открытую лекцию, на которой разберём, где и что может пойти не так после релиза, как это вовремя заметить, и что делать, если количество моделей растёт, а команда всё та же.
На лекции расскажем:
- как в реальности выглядит цикл жизни CV-модели
- как выстраивать поддержку: что можно автоматизировать, а что — нет
- как следить за качеством модели: дрифты, аутлаеры, шум, ключевые метрики
- какие есть подходы для автоматизации мониторинга модели
- и спроектируем возможное решение на примере реальной задачи
А также представим программу курса CV Rocket и подарим скидки на обучение всем участникам лекции!
Обо всём этом расскажут:
— Анастасия Старобыховская — руководитель CV-направления НЛМК ИТ
— Тимур Фатыхов — основатель DeepSchool, ex Lead CV Engineer, KoronaPay
Регистрируйтесь по ссылке — увидимся в четверг!
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥13👍8❤6
Сбор данных и разметка: как с нуля собрать хорошие данные под реальную ML-задачу?
Хорошие данные — залог успеха. Но на практике это недели и месяцы разметки, потраченные ресурсы, спорные инструкции и баги.
Хорошая новость: эти проблемы уже решаются — с помощью LLM, гибридных пайплайнов и продуманных процессов.
В статье расскажем, как меняется подход к разметке и что уже работает на практике:
- как использовать LLM в роли разметчика и быстро получить данные
- где всё ещё нужен человек и зачем
- как выстроить крауд-пайплайн, которому можно доверять
Плюс: советы, хаки и кейсы с цифрами.
Читайте подробнее по ссылке!
🪔 DeepSchool
Хорошие данные — залог успеха. Но на практике это недели и месяцы разметки, потраченные ресурсы, спорные инструкции и баги.
Хорошая новость: эти проблемы уже решаются — с помощью LLM, гибридных пайплайнов и продуманных процессов.
В статье расскажем, как меняется подход к разметке и что уже работает на практике:
- как использовать LLM в роли разметчика и быстро получить данные
- где всё ещё нужен человек и зачем
- как выстроить крауд-пайплайн, которому можно доверять
Плюс: советы, хаки и кейсы с цифрами.
Читайте подробнее по ссылке!
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSchool
Сбор данных и разметка: как с нуля собрать хорошие данные под реальную задачу? - DeepSchool
В статье рассмотрим новый стандарт разметки данных с использованием LLM и синтетических данных, лучший крауд-пайплайн и хаки в разметке.
4❤22🔥14👍8😁2
DeepSchool
Жизнь CV-модели после релиза После релиза работа не заканчивается — и именно здесь начинаются реальные сложности. Как понять, что модель начала деградировать? Как построить поддержку, если в команде нет лишних рук? Как мониторить предсказания CV-модели? …
Начинаем через 3 часа
Сегодня на лекции расскажем, зачем нужна поддержка модели, с какими проблемами сталкиваются инженеры и как выстраивать работу!
И в конце представим программу курса Computer Vision Rocket🔥
Участники лекции смогут занять место на программе на выгодных условиях!
Регистрируйтесь и приходите сегодня в 18:00 МСК!
Сегодня на лекции расскажем, зачем нужна поддержка модели, с какими проблемами сталкиваются инженеры и как выстраивать работу!
И в конце представим программу курса Computer Vision Rocket
Участники лекции смогут занять место на программе на выгодных условиях!
Регистрируйтесь и приходите сегодня в 18:00 МСК!
Please open Telegram to view this post
VIEW IN TELEGRAM
Жизнь CV-модели после релиза | DeepSchool
Онлайн-лекция "Жизнь CV-модели после релиза"
❤8🔥6👍4😍4
Как стать сильнее как CV-инженер
Работая с CV-задачами, вы наверняка сталкивались с нестабильными данными, компромиссами между качеством и скоростью, ошибками разметки, сложными кейсами, в которых нет однозначного решения.
Мы подготовили курс Computer Vision Rocket для практикующих инженеров, чтобы вы могли разобраться с такими задачами и освоить цикл создания и поддержки CV-моделей: от сбора данных до поиска ошибок и интерпретируемости.
В рамках курса вы научитесь:
🔹готовить данные под реальные задачи: искать, размечать, синтезировать
🔹находить и устранять ошибки в данных и разметке, улучшать качество
🔹настраивать пайплайны metric learning и векторного поиска, включая построение индексов
🔹адаптировать детекторы, сегментаторы и OCR-системы под сложные кейсы
🔹диагностировать деградацию моделей и находить проблемы через интерпретируемость
🔹проектировать CV-систему целиком: от данных до поддержки
Лекции проходят онлайн в Zoom, поэтому вы сможете задавать вопросы по ходу занятия.
Вы узнаете про подходы и best pratices от senior-инженеров из разных доменов и компаний. Они проверят ваши домашние задания и дадут развёрнутый фидбек!
CV Rocket цифрах:
4 месяца, 13 лекций, 13 заданий с фидбеком от опытных инженеров.
🗓 Начинаем 13 мая!
🔥 До 12 мая вы можете присоединиться к обучению со скидкой!
Переходите по ссылке, изучайте подробности и записывайтесь на обучение!
Если у вас есть вопросы, то пишите в нашу поддержку @deepschool_support, будем рады помочь.
До встречи на курсе!🎓
Работая с CV-задачами, вы наверняка сталкивались с нестабильными данными, компромиссами между качеством и скоростью, ошибками разметки, сложными кейсами, в которых нет однозначного решения.
Мы подготовили курс Computer Vision Rocket для практикующих инженеров, чтобы вы могли разобраться с такими задачами и освоить цикл создания и поддержки CV-моделей: от сбора данных до поиска ошибок и интерпретируемости.
В рамках курса вы научитесь:
🔹готовить данные под реальные задачи: искать, размечать, синтезировать
🔹находить и устранять ошибки в данных и разметке, улучшать качество
🔹настраивать пайплайны metric learning и векторного поиска, включая построение индексов
🔹адаптировать детекторы, сегментаторы и OCR-системы под сложные кейсы
🔹диагностировать деградацию моделей и находить проблемы через интерпретируемость
🔹проектировать CV-систему целиком: от данных до поддержки
Лекции проходят онлайн в Zoom, поэтому вы сможете задавать вопросы по ходу занятия.
Вы узнаете про подходы и best pratices от senior-инженеров из разных доменов и компаний. Они проверят ваши домашние задания и дадут развёрнутый фидбек!
CV Rocket цифрах:
4 месяца, 13 лекций, 13 заданий с фидбеком от опытных инженеров.
🗓 Начинаем 13 мая!
🔥 До 12 мая вы можете присоединиться к обучению со скидкой!
Переходите по ссылке, изучайте подробности и записывайтесь на обучение!
Если у вас есть вопросы, то пишите в нашу поддержку @deepschool_support, будем рады помочь.
До встречи на курсе!
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool.ru
Научитесь решать сложные задачи в Computer Vision — DeepSchool
❤10🔥6👏4❤🔥1😍1
Ванильный RAG не работает. Как исправить?
RAG — один из самых популярных подходов для интеграции LLM в реальные продукты. Его выбирают, когда нужно давать точные, верифицируемые ответы на основе собственной базы знаний. Но на практике такие решения почти никогда не работают «из коробки»: вместо полезных ответов — галлюцинации, поверхностные обобщения или просто тишина.
Причин много: эмбеддер не улавливает смысл запроса, поиск не находит нужные документы, генератор не может извлечь то, чего нет в извлеченном контексте. А когда всё ломается — непонятно, с чего начать: тюнить эмбеддер? дообучать генератор? улучшать данные?
В эту среду мы проведём открытую лекцию, на которой разберём, как в этой системе навести порядок: что действительно влияет на качество ответов, как выстроить пайплайн правильно и превратить RAG из хаотичного набора компонентов в надёжный рабочий инструмент.
На лекции расскажем:
- почему ванильная схема «ретривер + генератор» почти никогда не даёт нужного качества
- с чего начинать улучшения: эмбеддер, поиск, реранкер, генератор, данные или что-то ещё
- какие задачи приходится решать, чтобы RAG действительно работал
- как из разрозненных компонент собрать надежный RAG-продукт
Также на лекции мы представим курс LLM Pro — продвинутую программу, на которой вы научитесь строить системы, которые работают в реальном мире!
А участникам лекции подарим скидки на обучение 🎁
📅 Лекция пройдёт 30 апреля в 18:00 МСК
Регистрируйтесь по ссылке и до встречи на лекции в среду!
RAG — один из самых популярных подходов для интеграции LLM в реальные продукты. Его выбирают, когда нужно давать точные, верифицируемые ответы на основе собственной базы знаний. Но на практике такие решения почти никогда не работают «из коробки»: вместо полезных ответов — галлюцинации, поверхностные обобщения или просто тишина.
Причин много: эмбеддер не улавливает смысл запроса, поиск не находит нужные документы, генератор не может извлечь то, чего нет в извлеченном контексте. А когда всё ломается — непонятно, с чего начать: тюнить эмбеддер? дообучать генератор? улучшать данные?
В эту среду мы проведём открытую лекцию, на которой разберём, как в этой системе навести порядок: что действительно влияет на качество ответов, как выстроить пайплайн правильно и превратить RAG из хаотичного набора компонентов в надёжный рабочий инструмент.
На лекции расскажем:
- почему ванильная схема «ретривер + генератор» почти никогда не даёт нужного качества
- с чего начинать улучшения: эмбеддер, поиск, реранкер, генератор, данные или что-то ещё
- какие задачи приходится решать, чтобы RAG действительно работал
- как из разрозненных компонент собрать надежный RAG-продукт
Также на лекции мы представим курс LLM Pro — продвинутую программу, на которой вы научитесь строить системы, которые работают в реальном мире!
А участникам лекции подарим скидки на обучение 🎁
📅 Лекция пройдёт 30 апреля в 18:00 МСК
Регистрируйтесь по ссылке и до встречи на лекции в среду!
🔥15❤12👍5🤩2
DeepSchool
Ванильный RAG не работает. Как исправить? RAG — один из самых популярных подходов для интеграции LLM в реальные продукты. Его выбирают, когда нужно давать точные, верифицируемые ответы на основе собственной базы знаний. Но на практике такие решения почти…
Через 3 часа встречаемся на лекции
Сегодня расскажем, что действительно влияет на качество ответов, как выстроить пайплайн правильно и превратить RAG из хаотичного набора компонентов в надёжный рабочий инструмент!
А также представим программу курса LLM Pro и подарим скидки🔥
Регистрируйтесь и приходите сегодня в 18:00 МСК!
Сегодня расскажем, что действительно влияет на качество ответов, как выстроить пайплайн правильно и превратить RAG из хаотичного набора компонентов в надёжный рабочий инструмент!
А также представим программу курса LLM Pro и подарим скидки
Регистрируйтесь и приходите сегодня в 18:00 МСК!
Please open Telegram to view this post
VIEW IN TELEGRAM
Что делать если RAG не работает | DeepSchool
Онлайн-лекция "Ванильный RAG не работает. Что делать?"
🔥9❤4🤝3👍1😍1
LLM-системы, которые реально работают
Вчера на открытой лекции мы представили наш новый курс LLM Pro🎉
Это продвинутая программа для тех, кто уже работает с LLM и хочет решать сложные задачи!
На обучении вы соберёте полноценные LLM-системы с учётом требований к качеству и нагрузке, разберёте сложные кейсы и дизайны NLP-решений: от кластеризации и эмбеддеров до сложных RAG-систем и агентов.
В рамках курса вы научитесь:
🔹проектировать и запускать NLP-системы под реальные продуктовые задачи
🔹адаптировать LLM и эмбеддинги под специфичный домен и «живые» данные
🔹собирать и размечать датасеты — даже если данных изначально почти нет
🔹решать задачи классификации, поиска, кластеризации и NER — с ограничениями продакшн-среды
🔹собирать свою RAG-систему: от ретривера и реранкера до генератора и оценки качества
🔹строить AI-агентов с нуля — на основе сценариев, функций и взаимодействия с внешней средой
Вы разберёте реальные кейсы и научитесь применять похожие подходы в своих проектах, получите фундамент для уверенного прохождения NLP system design интервью и перехода на следующий грейд.
🤖 Старт 22 мая, а до 21 мая для вас действует скидка 5%
Переходите на сайт, изучайте подробности и присоединяйтесь к обучению!
Пишите в нашу поддержку @deepschool_support, если остались вопросы!
И до встречи на курсе!
Вчера на открытой лекции мы представили наш новый курс LLM Pro
Это продвинутая программа для тех, кто уже работает с LLM и хочет решать сложные задачи!
На обучении вы соберёте полноценные LLM-системы с учётом требований к качеству и нагрузке, разберёте сложные кейсы и дизайны NLP-решений: от кластеризации и эмбеддеров до сложных RAG-систем и агентов.
В рамках курса вы научитесь:
🔹проектировать и запускать NLP-системы под реальные продуктовые задачи
🔹адаптировать LLM и эмбеддинги под специфичный домен и «живые» данные
🔹собирать и размечать датасеты — даже если данных изначально почти нет
🔹решать задачи классификации, поиска, кластеризации и NER — с ограничениями продакшн-среды
🔹собирать свою RAG-систему: от ретривера и реранкера до генератора и оценки качества
🔹строить AI-агентов с нуля — на основе сценариев, функций и взаимодействия с внешней средой
Вы разберёте реальные кейсы и научитесь применять похожие подходы в своих проектах, получите фундамент для уверенного прохождения NLP system design интервью и перехода на следующий грейд.
Переходите на сайт, изучайте подробности и присоединяйтесь к обучению!
Пишите в нашу поддержку @deepschool_support, если остались вопросы!
И до встречи на курсе!
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool.ru
Научитесь создавать LLM-системы, которые реально работают
🔥15🤩13❤7⚡1
DeepSchool Digest⚡️
Собрали материалы за апрель в одном посте⬇️
✔️ Score Distillation Sampling в задаче text-to-3D - разбираем основную идею метода, а также, в каких ещё задачах применяется такой подход.
✔️ Masked Image Modeling - знакомимся с одним из самых перспективных направлений SSL в Computer Vision — Masked Image Modeling и рассказываем, что это, как появилось и где стоит использовать.
✔️ Сбор данных и разметка: как с нуля собрать хорошие данные под реальную задачу? - рассказываем, как меняется подход к разметке и что уже работает на практике. Плюс: советы, хаки и кейсы с цифрами.
✔️ Из ML в разработку. Почему? Подкаст «Под Капотом» с Константином Носоревым - поговорили с Костей Носоревым, senior backend-разработчиком Yandex Pay и спикером курса «Деплой DL-сервисов», обсудили, почему Костя решил перейти в высоконагруженный backend из машинного обучения, почему исследовательский МЛ подходит далеко не всем и как общение с близкими людьми помогает принимать верные карьерные решения.
Собрали материалы за апрель в одном посте
✔️ Score Distillation Sampling в задаче text-to-3D - разбираем основную идею метода, а также, в каких ещё задачах применяется такой подход.
✔️ Masked Image Modeling - знакомимся с одним из самых перспективных направлений SSL в Computer Vision — Masked Image Modeling и рассказываем, что это, как появилось и где стоит использовать.
✔️ Сбор данных и разметка: как с нуля собрать хорошие данные под реальную задачу? - рассказываем, как меняется подход к разметке и что уже работает на практике. Плюс: советы, хаки и кейсы с цифрами.
✔️ Из ML в разработку. Почему? Подкаст «Под Капотом» с Константином Носоревым - поговорили с Костей Носоревым, senior backend-разработчиком Yandex Pay и спикером курса «Деплой DL-сервисов», обсудили, почему Костя решил перейти в высоконагруженный backend из машинного обучения, почему исследовательский МЛ подходит далеко не всем и как общение с близкими людьми помогает принимать верные карьерные решения.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍10❤8👏1
Скоро стартует курс «Ускорение нейросетей»
Если вы сталкивались в работе с оптимизацией инференса и ускорением нейросетей, пробовали фреймворки вроде ONNX, TensorRT, OpenVINO, знаете про квантование, прунинг и дистилляцию, но при этом:
— большинство решений приходится собирать на ощупь
— гайды не работают на ваших моделях
— не уверены, как сочетать методы без потери качества
— возникают сложности при деплое на CPU, мобильные устройства или одноплатники
Или если только начинаете погружаться в тему ускорения нейросетей и хотите в ней разобраться — тогда приходите на ближайший поток «Ускорения нейросетей», который стартует 11 июня! ⚡
На курсе вы научитесь:
- ускорять нейросети, понимая теорию каждого алгоритма
- комбинировать разные подходы: квантизацию, дистилляцию, прунинг
- оптимизировать инференс, сохраняя точность
- запускать сети на различных устройствах: как на GPU/CPU, так и на мобильных телефонах и одноплатниках
- использовать особенности железа и фреймворков OpenVino, TensorRT, RKNN
👨🏫 Лекции ведут опытные инженеры, а хэдлайнер курса — Александр Гончаренко, CTO ENOT.аi, стартапа по ускорению нейросетей.
📅 Обучение начинается 11 июня и продлится 4 месяца.
Изучайте подробности на сайте и записывайтесь в лист ожидания, чтобы первыми узнать подробности о курсе и получить самые большие скидки на обучение!
Если вы сталкивались в работе с оптимизацией инференса и ускорением нейросетей, пробовали фреймворки вроде ONNX, TensorRT, OpenVINO, знаете про квантование, прунинг и дистилляцию, но при этом:
— большинство решений приходится собирать на ощупь
— гайды не работают на ваших моделях
— не уверены, как сочетать методы без потери качества
— возникают сложности при деплое на CPU, мобильные устройства или одноплатники
Или если только начинаете погружаться в тему ускорения нейросетей и хотите в ней разобраться — тогда приходите на ближайший поток «Ускорения нейросетей», который стартует 11 июня! ⚡
На курсе вы научитесь:
- ускорять нейросети, понимая теорию каждого алгоритма
- комбинировать разные подходы: квантизацию, дистилляцию, прунинг
- оптимизировать инференс, сохраняя точность
- запускать сети на различных устройствах: как на GPU/CPU, так и на мобильных телефонах и одноплатниках
- использовать особенности железа и фреймворков OpenVino, TensorRT, RKNN
👨🏫 Лекции ведут опытные инженеры, а хэдлайнер курса — Александр Гончаренко, CTO ENOT.аi, стартапа по ускорению нейросетей.
📅 Обучение начинается 11 июня и продлится 4 месяца.
Изучайте подробности на сайте и записывайтесь в лист ожидания, чтобы первыми узнать подробности о курсе и получить самые большие скидки на обучение!
deepschool.ru
DeepSchool — Ускорение нейросетей
Поймёте теорию, узнаете про основные сложности и отточите знания на практике
5⚡11❤7🔥5😍2
Как обучить текстовый эмбеддер на домен?
Представьте: перед вами, как перед ML-инженером, стоит задача — нарастить качество в некотором сервисе. У вас есть доступ к текстовым данным в домене решаемой задачи, а аналитики собрали вам разметку. Вы взяли любимую BERT-like модель, которую всегда использовали, завели обучение и уже потираете руки в ожидании хорошей оценки на ревью, но… Качество на тесте не растёт. Вы крутите параметры, а ничего не помогает.
Решить эту проблему вам поможет наша статья по обучению текстового эмбеддера под домен.
В этой статье мы разберём последовательность действий, которую стоит предпринимать при обучении текстового эмбеддера на домен, узнаем, как обернуть специфику задачи вам на пользу и всё-таки нарастить конечное качество. Подробнее остановимся на этапе предобучения, рассмотрим RetroMAE, модификацию MLM для retrieval-моделей и контрастное обучение с InfoNCE, основной подход к улучшению семантики представлений в области.
Читайте новую статью по ссылке
🪔 DeepSchool
Представьте: перед вами, как перед ML-инженером, стоит задача — нарастить качество в некотором сервисе. У вас есть доступ к текстовым данным в домене решаемой задачи, а аналитики собрали вам разметку. Вы взяли любимую BERT-like модель, которую всегда использовали, завели обучение и уже потираете руки в ожидании хорошей оценки на ревью, но… Качество на тесте не растёт. Вы крутите параметры, а ничего не помогает.
Решить эту проблему вам поможет наша статья по обучению текстового эмбеддера под домен.
В этой статье мы разберём последовательность действий, которую стоит предпринимать при обучении текстового эмбеддера на домен, узнаем, как обернуть специфику задачи вам на пользу и всё-таки нарастить конечное качество. Подробнее остановимся на этапе предобучения, рассмотрим RetroMAE, модификацию MLM для retrieval-моделей и контрастное обучение с InfoNCE, основной подход к улучшению семантики представлений в области.
Читайте новую статью по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSchool
Как обучить текстовый эмбеддер на домен - DeepSchool
Как использовать контрастивное обучение для эффективной доменной адаптации
❤22🔥14⚡6👍5😍2
Начался курс Computer Vision Rocket 🚀
Вчера на курсе прошла вводная встреча, а через неделю будет первая лекция — про подготовку данных. На ней мы разберём основные источники открытых данных: научимся находить и курировать датасеты. Обсудим инструменты для inhouse-разметки и формирование ТЗ, а также внедрение авторазметки.
CV Rocket — это продвинутый курс для CV-инженеров, на котором вы разберёте большинство задач компьютерного зрения, погрузитесь в сложные случаи, возможные проблемы с данными и интересные корнер-кейсы, узнаете лучшие практики и получите ответы на накопившиеся вопросы.
Вы ещё успеваете присоединиться! Для этого переходите на сайт, изучайте подробности и присоединяйтесь к обучению🎓
Если у вас есть вопросы, то будем рады помочь в нашей поддержке @deepschool_support
Вчера на курсе прошла вводная встреча, а через неделю будет первая лекция — про подготовку данных. На ней мы разберём основные источники открытых данных: научимся находить и курировать датасеты. Обсудим инструменты для inhouse-разметки и формирование ТЗ, а также внедрение авторазметки.
CV Rocket — это продвинутый курс для CV-инженеров, на котором вы разберёте большинство задач компьютерного зрения, погрузитесь в сложные случаи, возможные проблемы с данными и интересные корнер-кейсы, узнаете лучшие практики и получите ответы на накопившиеся вопросы.
Вы ещё успеваете присоединиться! Для этого переходите на сайт, изучайте подробности и присоединяйтесь к обучению
Если у вас есть вопросы, то будем рады помочь в нашей поддержке @deepschool_support
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool.ru
Научитесь решать сложные задачи в Computer Vision — DeepSchool
👍10🔥7❤6
Как превратить текст в структурированные данные?
Распознавание именованных сущностей (Named Entity Recognition, NER) — ключ к превращению сырого текста в структурированные данные. Но как выбрать подходящий инструмент, когда вокруг десятки библиотек? Когда стоит брать готовое решение, а когда — учить свою модель? Правда ли, что LLM уже умеют всё сами?
В нашей новой статье разберём:
✔️ Постановку задачи NER
✔️ Существующие коробочные решения и их ограничения
✔️ Рецепты, когда и как стоит обучать свой NER
✔️ Применимость LLM для решения задачи
А также конкретные примеры и лайфхаки для тех, кто хочет выжать максимум из своих данных.
Читайте по ссылке и узнайте о современных подходах к решению задачи NER! 🙂
Распознавание именованных сущностей (Named Entity Recognition, NER) — ключ к превращению сырого текста в структурированные данные. Но как выбрать подходящий инструмент, когда вокруг десятки библиотек? Когда стоит брать готовое решение, а когда — учить свою модель? Правда ли, что LLM уже умеют всё сами?
В нашей новой статье разберём:
✔️ Постановку задачи NER
✔️ Существующие коробочные решения и их ограничения
✔️ Рецепты, когда и как стоит обучать свой NER
✔️ Применимость LLM для решения задачи
А также конкретные примеры и лайфхаки для тех, кто хочет выжать максимум из своих данных.
Читайте по ссылке и узнайте о современных подходах к решению задачи NER! 🙂
DeepSchool
Современные подходы к NER - DeepSchool
Задача распознавания именованных сущностей (NER) и современные методы её решения.
🔥23👍11❤5🤔1
Скоро стартует летний поток курса LLM
Если вы только знакомитесь с LLM или уже работаете с ними и хотите разобраться, как устроены современные LLM, как их обучать, запускать и оптимизировать — приходите на ближайший поток курса LLM, который начинается в июне.
На курсе вы научитесь:
— использовать доступные LLM под свои задачи
— работать с RAG, агентами и tool calls
— эффективно тюнить свои модели
— деплоить и ускорять инференс LLM
А если до этого не работали с доменом NLP, то разберетёсь в нём и его особенностях.
📅 Старт — 25 июня, а сейчас вы можете записаться в лист ожидания, чтобы первыми занять место на курсе и получить самые выгодные условия на обучение.
Изучайте подробности о программе и спикерах и записывайтесь на новый поток!
Напоминаем, что места ограничены, часть уже занята! Поэтому если планировали обучение летом, то рекомендуем не откладывать ✍️
Если возникают вопросы — пишите нам в @deepschool_support
Если вы только знакомитесь с LLM или уже работаете с ними и хотите разобраться, как устроены современные LLM, как их обучать, запускать и оптимизировать — приходите на ближайший поток курса LLM, который начинается в июне.
На курсе вы научитесь:
— использовать доступные LLM под свои задачи
— работать с RAG, агентами и tool calls
— эффективно тюнить свои модели
— деплоить и ускорять инференс LLM
А если до этого не работали с доменом NLP, то разберетёсь в нём и его особенностях.
Изучайте подробности о программе и спикерах и записывайтесь на новый поток!
Напоминаем, что места ограничены, часть уже занята! Поэтому если планировали обучение летом, то рекомендуем не откладывать ✍️
Если возникают вопросы — пишите нам в @deepschool_support
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool.ru
LLM Курс | DeepSchool
Промптинг, дообучение, RAG, агенты и деплой — освойте полный цикл работы с LLM при поддержке опытных инженеров
🔥13❤🔥4❤3👏1
Как построить RAG?
Знания LLM ограничены данными, которые она видела в процессе обучения. Поэтому ответы на вопросы по актуальным новостям могут быть неполными или неточными. Чтобы решить эту проблему без частого и дорогого дообучения на новых данных, придумали RAG — технику, добавляющую в контекст LLM внешнюю информацию.
В новом ролике Илья Димов показал, как собрать простейшую RAG-систему. Смотрите новый выпуск по ссылке!
А больше о том, как строить реальные RAG-системы, типовых проблемах и их решении рассказываем на наших курсах: LLM и LLM Pro.
🪔 DeepSchool
Знания LLM ограничены данными, которые она видела в процессе обучения. Поэтому ответы на вопросы по актуальным новостям могут быть неполными или неточными. Чтобы решить эту проблему без частого и дорогого дообучения на новых данных, придумали RAG — технику, добавляющую в контекст LLM внешнюю информацию.
В новом ролике Илья Димов показал, как собрать простейшую RAG-систему. Смотрите новый выпуск по ссылке!
А больше о том, как строить реальные RAG-системы, типовых проблемах и их решении рассказываем на наших курсах: LLM и LLM Pro.
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Как построить RAG?
Знания LLM ограничены данными, которые она видела в процессе обучения. Поэтому ответы на вопросы по актуальным новостям могут быть неполными или неточными. Чтобы решить эту проблему без частого и дорогого дообучения на новых данных, придумали RAG — технику…
🔥22⚡11❤10❤🔥2👍2😁1🤯1
Большой обзор LLM-бенчмарков
Чтобы выбрать подходящую под задачу LLM, надо сравнить разные модели➡️ чтобы сравнить модели, надо выбрать бенчмарки ➡️ чтобы выбрать бенчмарки, надо в них разобраться.
Но их так много, что непонятно с чего начать. Мы решили вам в этом помочь и сравнили популярные бенчмарки в одной новой статье.
Читайте по ссылке!
Чтобы выбрать подходящую под задачу LLM, надо сравнить разные модели
Но их так много, что непонятно с чего начать. Мы решили вам в этом помочь и сравнили популярные бенчмарки в одной новой статье.
Читайте по ссылке!
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSchool
Большой обзор LLM-бенчмарков - DeepSchool
Подготовили большой обзор, чтобы ориентироваться во многообразии бенчмарков для LLM
😁21🔥16❤8👏5
DeepSchool Digest⚡
Собрали материалы за май в одном посте:
✔️ Как обучить текстовый эмбеддер на домен — разобрали последовательность действий для обучения текстового эмбеддера на домен, рассказали, как обернуть специфику задачи вам на пользу и всё-таки нарастить конечное качество.
✔️ Современные подходы к NER — разобрали постановку задачи NER, существующие коробочные решения и их ограничения, рецепты, когда и как стоит обучать свой NER, применимость LLM для решения задачи.
✔️ Как построить RAG с нуля — вместе с Ильей Димовым показали, как собрать простейшую RAG-систему.
✔️ Большой обзор LLM-бенчмарков — сравнили популярные бенчмарки в одной статье.
Собрали материалы за май в одном посте:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23👍13🔥10😁1
How to: детектор лиц на Android
Детекция лиц на смартфоне — популярная задача, для которой существует много решений «в пару кнопок». Но мы решили пойти по хардкору и показать, как запустить детектор лиц на Android, используя только C++ , OpenCV и NCNN.
Это видео поможет:
1. Узнать нюансы при деплое своих моделей на Android-устройстве.
2. Понять, как работают под капотом готовые решения.
3. Запустить свои кастомные модели на платформе Android.
Смотрите новый выпуск по ссылке!
А больше о том, как ускорять инференс моделей под различные устройства рассказываем на курсе «Ускорение нейросетей».
Детекция лиц на смартфоне — популярная задача, для которой существует много решений «в пару кнопок». Но мы решили пойти по хардкору и показать, как запустить детектор лиц на Android, используя только C++ , OpenCV и NCNN.
Это видео поможет:
1. Узнать нюансы при деплое своих моделей на Android-устройстве.
2. Понять, как работают под капотом готовые решения.
3. Запустить свои кастомные модели на платформе Android.
Смотрите новый выпуск по ссылке!
А больше о том, как ускорять инференс моделей под различные устройства рассказываем на курсе «Ускорение нейросетей».
YouTube
How to: детектор лиц на Android
Детекция лиц на смартфоне — популярная задача, для которой существует много решений «в пару кнопок». Но мы решили пойти по хардкору и показать, как запустить детектор лиц на Android, используя только C++ , OpenCV и NCNN.
Это видео поможет:
1. Узнать нюансы…
Это видео поможет:
1. Узнать нюансы…
🔥23❤16😁6👍1
4 проблемы при решении задач с LLM
Мы подготовили лекцию, на которой расскажем:
— как сделать чатбота, который уместно использует факты из диалога и ведёт себя как человек
— как научить агента выполнять комплексные задачи
— когда действительно стоит обновлять модель
— и какие фреймворки выбрать, чтобы не тратить время зря
Спикер — Илья Димов, Senior NLP Engineer в Яндексе расскажет, какие проблемы возникают при построении LLM приложений и как их исправить.
Приходите, чтобы узнать решения своих проблем и задать вопросы!
А ещё мы представим новый поток курса LLM, на котором вы разберётесь в том, как работают LLM, как дообучать их под свои сценарии и как с их помощью строить RAG и агентские системы!
Всем участникам лекции мы подарим скидки на обучение 🎁
📅 Встречаемся в четверг, 19 июня в 19:00 МСК!
Регистрируйтесь по ссылке и до встречи на лекции в четверг!
Мы подготовили лекцию, на которой расскажем:
— как сделать чатбота, который уместно использует факты из диалога и ведёт себя как человек
— как научить агента выполнять комплексные задачи
— когда действительно стоит обновлять модель
— и какие фреймворки выбрать, чтобы не тратить время зря
Спикер — Илья Димов, Senior NLP Engineer в Яндексе расскажет, какие проблемы возникают при построении LLM приложений и как их исправить.
Приходите, чтобы узнать решения своих проблем и задать вопросы!
А ещё мы представим новый поток курса LLM, на котором вы разберётесь в том, как работают LLM, как дообучать их под свои сценарии и как с их помощью строить RAG и агентские системы!
Всем участникам лекции мы подарим скидки на обучение 🎁
Регистрируйтесь по ссылке и до встречи на лекции в четверг!
Please open Telegram to view this post
VIEW IN TELEGRAM
4 проблемы при решении задач с LLM| DeepSchool
4 проблемы при решении задач с LLM | Онлайн-лекция
На примере бизнес-кейсов разберём подводные камни LLM
🔥18👍9⚡4❤🔥2
Данные важнее моделей? Подкаст «Под Капотом» c Дарьей Воронкиной
Мы приглашаем в подкаст экспертов из различных областей, чтобы понять, как работают сложные системы изнутри.
Гость этого выпуска Дарья Воронкина — тимлид в медицинском стартапе OneCell.ai и спикер курса «Computer Vision Rocket». В OneCell Дарья руководит построением и оптимизацией процесса разметки медицинских данных и аналитики вокруг них.
В этом выпуске мы обсуждаем:
- как создать масштабируемый процесс аннотации терабайтов гистологических данных для сотен задач
- почему подготовка датасета часто сложнее и интереснее обучения моделей
- как превратить хаотичную разметку в предсказуемый и воспроизводимый процесс
Смотрите выпуск по ссылке: https://youtu.be/4ufQITw-cOI
Мы приглашаем в подкаст экспертов из различных областей, чтобы понять, как работают сложные системы изнутри.
Гость этого выпуска Дарья Воронкина — тимлид в медицинском стартапе OneCell.ai и спикер курса «Computer Vision Rocket». В OneCell Дарья руководит построением и оптимизацией процесса разметки медицинских данных и аналитики вокруг них.
В этом выпуске мы обсуждаем:
- как создать масштабируемый процесс аннотации терабайтов гистологических данных для сотен задач
- почему подготовка датасета часто сложнее и интереснее обучения моделей
- как превратить хаотичную разметку в предсказуемый и воспроизводимый процесс
Смотрите выпуск по ссылке: https://youtu.be/4ufQITw-cOI
YouTube
Данные важнее моделей? Дарья Воронкина | Под Капотом
Мы приглашаем в подкаст экспертов из различных областей, чтобы понять, как работают сложные системы изнутри.
Гость этого выпуска Дарья Воронкина — тимлид в медицинском стартапе OneCell.ai и спикер курса «Computer Vision Rocket». В OneCell Дарья руководит…
Гость этого выпуска Дарья Воронкина — тимлид в медицинском стартапе OneCell.ai и спикер курса «Computer Vision Rocket». В OneCell Дарья руководит…
🔥21❤18⚡13😁2
Осталось 3 часа до лекции по LLM
Сегодня Илья Димов на примере бизнес-кейсов разберёт подводные камни LLM!
На лекции вы узнаете:
- как устроена память у LLM, зачем она нужна и почему “погуляй с собакой в лесу” может звучать зловеще
- как построить рабочую RAG-систему, где LLM действительно извлекает нужное из базы знаний, а не галлюцинирует
- зачем разбивать задачу между несколькими LLM, что умеют агенты, и когда они начинают вредить
- как выбирать модель, если завтра выйдет новая и все побегут её катить — по каким метрикам, с какими ограничениями и как протестировать
В конце представим программу курса LLM и откроем запись со скидкой!
🕕 Регистрируйтесь и приходите сегодня в 19:00 МСК
Сегодня Илья Димов на примере бизнес-кейсов разберёт подводные камни LLM!
На лекции вы узнаете:
- как устроена память у LLM, зачем она нужна и почему “погуляй с собакой в лесу” может звучать зловеще
- как построить рабочую RAG-систему, где LLM действительно извлекает нужное из базы знаний, а не галлюцинирует
- зачем разбивать задачу между несколькими LLM, что умеют агенты, и когда они начинают вредить
- как выбирать модель, если завтра выйдет новая и все побегут её катить — по каким метрикам, с какими ограничениями и как протестировать
В конце представим программу курса LLM и откроем запись со скидкой!
🕕 Регистрируйтесь и приходите сегодня в 19:00 МСК
4 проблемы при решении задач с LLM| DeepSchool
4 проблемы при решении задач с LLM | Онлайн-лекция
На примере бизнес-кейсов разберём подводные камни LLM
❤13🔥7😁5👍2
Как наконец-то закрыть все вопросы с LLM
Приходите на летний поток нашего курса LLM!
Вы разберётесь, как устроены современные LLM, как они обучаются, как с ними работать и сможете избежать типичных проблем при решении реальных задач.
На программе вы научитесь:
— выбирать LLM под задачу, а не по популярности
— строить работающий RAG и снижать галлюцинации
— создавать агентов
— дообучать модели
— деплоить LLM и оптимизировать под нагрузку и бюджет
— и, главное — понимать, что и почему не работает из коробки
Курс ведут опытные инженеры, которые проверят ваши домашние задания и ответят на вопросы прямо во время лекций и QA-сессий!
Вас ждёт 4 месяца обучения, практики и общения с инженерами, которые работают с LLM в продуктовых командах и помогут вам избежать типичных ошибок💪
На этот поток осталось 19 мест, они быстро закончатся, поэтому успевайте записаться!
Начинаем 25 июня! А до 24 июня вы можете присоединиться со скидкой 5%🔥
Изучайте подробности на сайте и записывайтесь на выгодных условиях!
Если остались вопросы или вы сомневаетесь, подходит ли вам эта программа — пишите нам в поддержку @deepschool_support
Приходите на летний поток нашего курса LLM!
Вы разберётесь, как устроены современные LLM, как они обучаются, как с ними работать и сможете избежать типичных проблем при решении реальных задач.
На программе вы научитесь:
— выбирать LLM под задачу, а не по популярности
— строить работающий RAG и снижать галлюцинации
— создавать агентов
— дообучать модели
— деплоить LLM и оптимизировать под нагрузку и бюджет
— и, главное — понимать, что и почему не работает из коробки
Курс ведут опытные инженеры, которые проверят ваши домашние задания и ответят на вопросы прямо во время лекций и QA-сессий!
Вас ждёт 4 месяца обучения, практики и общения с инженерами, которые работают с LLM в продуктовых командах и помогут вам избежать типичных ошибок
На этот поток осталось 19 мест, они быстро закончатся, поэтому успевайте записаться!
Начинаем 25 июня! А до 24 июня вы можете присоединиться со скидкой 5%
Изучайте подробности на сайте и записывайтесь на выгодных условиях!
Если остались вопросы или вы сомневаетесь, подходит ли вам эта программа — пишите нам в поддержку @deepschool_support
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool.ru
LLM Курс | DeepSchool
Промптинг, дообучение, RAG, агенты и деплой — освойте полный цикл работы с LLM при поддержке опытных инженеров
❤15👍8🔥7