Варим МЛ – Telegram
Варим МЛ
2.94K subscribers
10 photos
2 videos
3 files
114 links
Этот канал — варево из разных ингредиентов машинного обучения в бизнесе. Здесь можно почитать про модельки, инструменты, дизайн систем и процессы ML-разработки. В этом канале пишет Жека Никитин (Цельс, @crazyfrogspb) и раньше писал Миша Киндулов
Download Telegram
Недавно Егор Шестопалов написал пост про MCP, и в комментариях сразу же начали обсуждать минусы этого подхода. Я как раз в отпуске немножко поизучал эту тему и написал свой пост про плюсы, минусы и уязвимости MCP. Разбираем, как подключить Notion к Курсору, из чего состоит каждый MCP-сервер, нужны ли они вообще, а главное чего стоит опасаться при их использовании в ваших приложениях.

Важное дополнение! Если кто помнит, в прошлом году я ездил на SouthHub - эвент в Красной Поляне для CTO/CEO/CPO, мне ооочень понравилось, так что в этом году я продолжаю сотрудничать с ребятами. Ближе к делу расскажу про саму тусовку, а пока немного про прикольный эвент, который будет уже завтра - мок-интервью на позицию CTO в ИИ-отдел. Жанр публичных мок-интервью у меня ассоциируется с Подлодкой, и это часто бывает весьма познавательно, особенно если вы никогда не проходили собес на таком уровне. На моей памяти это первое публичное интервью на CTO с ML-спецификой, так что любопытно будет посмотреть, как будут валить коллегу.

#Жека #LLM
👍15🔥112🤔1
Ещё пара анонсов

1. Масштабный
Мы открываем приём заявок на Ужасы Медицинских Данных 2025 в рамках ODS-датафеста! Ура!!! Присылайте любые заявки, которые касаются медицины, биоинформатики и схожих областей. Предварительная дата - 27 мая, как всегда в онлайне. Закрываем приём заявок 7 мая

2. Локальный
Помимо мок-интервью сегодня вечером будет ещё один интересный эвент для немного другой аудитории, и на этом эвенте я выступаю с докладом "Уровни сложности ML-инференса", расскажу про то, что происходит, когда ML-бог выгоняет вас из прекрасного райского мира облаков. Можно успеть зарегаться и прийти офлайн в Питере, можно послушать онлайн. А лучше всего послушать и интервью, и мой доклад)

#Жека
17🔥12👻4👍2👏1🐳1🍓1
Сегодня у меня для вас пост про интересную бизнес-проблему, про которую не так много говорят - как защитить свою интеллектуальную собственность (код, веса моделек) при деплое на чужих серверах. Меня бизнес регулярно мучает этим вопросом, я обычно отбиваюсь, мол, лучше юридически защититься, да и кому нужны эти модельки без команды, которая их поддерживает, обновляет и мониторит. Но в целом есть несколько простых способов, как усложнить воришкам жизнь.

А ещё пришла пора позвать моих дорогих подписчиков на SouthHub, который в этом году пройдёт с 11 по 15 июня. В прошлом году поездка стала для меня одним из самых ярких событий. Саусхаб - это
- весело - пивко, кальяны, прогулки по горам
- полезно - таких людей как там встретить где-то ещё, особенно всех вместе, очень сложно
- красиво - люблю Красную Поляну

В этом году я снова еду, так что подключайтесь, потрещим за ML за трофимычем.

В ТГ-канале ребят всякие детали про спикеров, кэмп, фотки, вот это всё

#Жека #mlops
🔥209💩2
ods teaser 2025.mp4
106.2 MB
Уже во вторник 27 мая в полдень мы стартуем очередные Ужасы Медицинских Данных в рамках ODS-датафеста. Проходить всё будет в спейшл-чате + трансляция на ютубе (пароли, ссылки добавлю сюда во вторник утром).

В этом году вас ждут доклады о:
- разметке медицинских речевых данных
- применении ChatGPT и других ML-моделей для личных медицинских целей
- работе с огромными медицинскими данными типа гистологических сканов
- структуризации медицинских документов с помощью OCR и LLM
- автоматическом анализе электрокортикограмм крыс
- генеративных моделях для трансформации между разными модальностями
- генерации синтетических данных диффузионками

Для разогрева представляем наш традиционный трэш-тизер "Morning routine of ML engineer" со специальным гостем в конце (в комментариях версия не файлом, а видео для удобства). Вдохновлено, конечно же, этим великолепным роликом.

#Жека
🔥28😁95🤣1
всем привет! ровно через час начинаем УЖАСЫ МЕДИЦИНСКИХ ДАННЫХ!

ссылка на спейшл-чат, пароль datafest2025_2705. лучше всего смотреть именно тут

ссылка на трансляцию в вк 😭️️️️️️простите, на ютуб своими силами решили не делать, многовато запары

расписание - постараемся придерживаться, но сами понимаете, возможные накладки

очень будем рады тем, кто сможет подключиться онлайн! хотя бы на часть докладов)

ведущие бессменные (мы всё-таки в РФ) - Жека Никитин и Антон Голубев

#Жека
🔥22🤗3
Что-то я совсем забросил личные нетехнические посты. Как раз только что был в Новосибирске, а в поездках лучше всего такие пишутся. Поэтому для вас сегодня мои рассуждения о том, как и почему я остаюсь в Цельсе, маленькой не особо известной компании, хотя в этом году будет уже семь лет на одном месте. Внезапно вдохновлённые книжкой про геймификацию.

Немного новостей и анонсов. Май выдался очень (слишком) насыщенным в плане эвентов:
- Выступил на IML, про свой доклад пост сделаю попозже
- Выступил на эвенте Яндекса с рассказом про текущее состояние ИИ в медицине
- Провели Ужасы на Датафесте, ура! Спасибо, всем кто готовил и смотрел
- Съездил в Новосиб на Кодфест в качестве члена программного комитета МЛ-секции второй год подряд, всё ещё моя любимая офлайн-конфа
- Как будто что-то ещё забыл...

А ещё я параллельно успеваю работать, обещаю.

В июне отдыхаю от выступлений! Ну почти.

Сначала Саусхаб, это реально чилл. Да, опять про SH, но мне очень понравилось в прошлом году, поеду в этом, так что ещё немного покомпостирую мозги. Это одновременно и отдых, и прикольный нетворк. Подойдёт и для расслабления, и для ненавязчивого поиска работы. В эфире можно узнать про кэмп подробнее, чтоб понять, стоит ли он свою кучу денег. Кто поедет, ищите меня в кальянной зоне Яндекса или Хука Плейсе с 11 по 15 июня.

После кэмпа сразу мой день рождения, потом день рождения ML-отдела, а 25 июня участвую в крутой дискуссии про управление неопределенностью в больших и маленьких командах. Я, как вы понимаете, отвечаю за маленькие. Офлайн, Питер.

А потом всё лето только работа, ураааа. И, конечно, посты в канал. В планах обзоры на книги, текстовые версии докладов, размышления про развитие ИИ в медицине и не только. Спасибо, что остаётесь с Варим МЛ!

#Жека
🔥40👍128
Предложили поучаствовать в подборке МЛ-каналов. Я свой канал нигде кроме собственных докладов не пиарю, так что почему нет. Подборка нормальная, зашкварных каналов нет, разнообразные темы - просто мл, применение мл в бизнесе, вакансии, эвенты. Например, Юра Кацер делает прикольные доклады про ML в промышленности, а у него, оказывается, ещё и канал есть. В общем, посмотрите, авось что-то найдете, да и на меня кто-нибудь подпишется.

Ещё проходите опрос по DS-индустрии, результаты прошлого года мне лично помогли понять, чё и как в индустрии, какие зарплаты, где люди хотят работать. Оказывается, ещё не у всех зарплата 500к, можно нанимать и на 400!

#Жека
19🤬2
Всем привет! А мне сегодня аж 33 года! Из них уже 10 лет в МЛ, а варю его в этом канале уже 3.5 года. Очень рад, что вы остаётесь со мной, и особенно приятно встречать подписчиков на конфах)

В качестве контента сегодня ссылка на прикольный гайд по борьбе с СДВГ. На самом деле мне он кажется подходящим для многих людей, даже без диагноза, особенно раздел Tactics. Вообще там многое напоминает книжки Дорофеева, так что техники проверены мной годами.

Я вот записываю вообще всё, даже если планирую это сделать через 3 секунды. Поверьте, за это время вас могут успеть отвлечь два раза)

Всем хорошего дня и лета! А кто будет в Питере 25 июня, приходите на прикольную дискуссию, поразгоняем про хаос

#Жека
🎉6427🔥13🍾42👎1
Сегодня у меня на обзоре книга "Карьера разработчика", которую мне в бумажном виде прислало издательство Питер. Такие коллаборации я очень люблю, пишите побольше с такими предложениями, а не с платной рекламой эвентов и курсов! Книгу я давно хотел прочесть, и в итоге она мне очень понравилась, ну где-то на 8.5 из 10, подробнее читайте по ссылке.

Ещё ребята из CS Space при ПОМИ РАН запустили (возродили) свой клуб и попросили упомянуть в каком-нибудь посте питерский офлайн-митап про LLM для решения математических и алгоритмических задач. Пока я рожал, места на митап закончились... Но ребятам я обещал упоминание, так что просто отрекламирую их сообщество, офлайны с такими спикерами и докладами - это всегда круто.

#Жека #books
🔥2312👍5
Канал аж на 5 недель ушёл в отпуск, потому что его автор усиленно работал после периода активных выступлений и поездок. Пора возвращаться - начинаем с объёмного обзора-дискуссии по поводу подходов и проблем внедрения ИИ в радиологию в России и в других странах.

#Жека #medicine
👍29🔥6👏5❤‍🔥311
Люблю поизучать канал "LLM под капотом" и дискуссии в комментариях - очень уж интересно, как LLM-агенты применяются в бизнес-кейсах, а главное - какие инженерные паттерны реально работают.

А что у нас с LLM-агентами в медицине? Сегодня на обзоре ряд статей с использованием агентских паттернов.

#Жека #llm
🔥26👍94
На внутреннем митапе сделал доклад про свой опыт использования ИИ-инструментов в разработке - какие есть виды, полезные советы, как сэкономить. Решил переложить его в текстовую форму - опытные вайб-кодеры, наверное, не найдут очень много полезного, но остальным может быть интересно.

Недавно с помощью ИИ как раз запилил интересный внутренний инструмент на основе LLM - алерт-менеджер, который помогает дежурным лучше работать с инцидентами. Если интересно - могу написать постик.

И ещё пара моментов.

Вопрос - мне надоел Телеграф, картинки неудобно вставлять, ссылки на разделы нельзя давать, где лучше писать посты, есть идеи? Или проще свой поднять сайт?

Предложение - пройти опрос State of Data 2025 от моего товарища из PT Олега Кочергина, результаты он подобьёт в инсайты на конфе SmartData в октябре.

#Жека #llm
🔥33🤔95👍21
Сегодня выступил на ИТМ с докладом про практики проектирования и разработки LLM-систем в медицине, а при подготовке доклада, естественно, использовал LLM. Рассказываю об этом, а также о других прикольных кейсах использования элэлэмок в работе в своём новом посте.

Ещё у моих друзей из издательства Питер вышло несколько новых книг об ML на бумаге, одну из них (Строим LLM с нуля) я читал на английском, вроде, даже в канале упоминал. У Рашки (хехе) всегда хорошие материалы, сейчас жду его Build a Reasoning Model (From Scratch). Если любите книги на бумаге или на русском - велком!

Обращаю ваше внимание, что как всегда рекомендую только бесплатно и только хорошие вещи) Теперь есть ещё одна веская причина не брать платную рекламу, если вы понимаете, о чём я.

#Жека #llm
👍22🔥1491👏1
Изначально я хотел опубликовать пост в стиле "Что я читаю этой осенью", но там получилось несколько десятков ссылок по самым разным темам (медицина, LLM и длинный контекст, агенты, вайб-кодинг, файнтюн/RL/LoRA, RAG), поэтому я решил остановиться на одной теме - парсинга документов и OCR. Остальным поделюсь попозже, если хватит времени и сил)

#Жека #llm
🔥24😍2🤝211
Сделал свежий докладик про добавление новых патологий в наши системы, в среду буду рассказывать его на митапе Positive Technologies в Питере, приходите, места ещё есть. Слайды потом выложу в комментарии

#Жека
👍23🔥197
Давненько хотел переехать с Телеграфа на свою платформу. Наконец-то сделал, а заодно написал про это пост. Из любопытного - добавил RAG-чат по постам, эмбеддинг-модель работает прямо в браузере на вашей стороне. Осторожно, при первом запуске загрузится порядка 150 мегабайт. Из минусов - теперь, вроде бы, не будет превьюшек прям в ТГ.

Пишите, если найдёте какие-то баги или проблемы, особенно с RAG-чатом, я его под нагрузкой пока особо не тестил, да и LLM там сейчас стоят бесплатные, может, в рейт-лимит уткнётся.

И ещё кое-что - в январе традиционно буду подводить итоги года по ML в медицине. Если кто-то желает присоединиться и покрыть часть, связанную с генетикой, лекарствами и всякой такой биоинформатикой - пишите в личку! А то я эту часть всегда пропускаю, так как не шарю.

И с наступающим Новым годом, конечно!

#жека #llm
🔥293😱2
Друзья, поздравляю вас с наступающим Новым годом! Работайте над интересными и полезными задачами, общайтесь с хорошими людьми и не забывайте отдыхать!

А здесь можно почитать мои итоги года, если вам интересно

#жека
38🎄20🔥9👍3🎉1🙉1