Дратути Антон – Telegram
Дратути Антон
4.11K subscribers
171 photos
30 videos
215 links
Мемы и личные размышления про управление, код, ml и здравый смысл.

Сейчас руковожу командой OCR in VLM в Яндексе.

Автор: @toshiknoscript
Download Telegram
Учиться быть руководителем

Тема весьма избитая, скорее всего, кто-то вам может тут вам выпулить супер курс с кучей ресурсов. Здесь лишь про моё мнение!

Я искренне убеждён, что нужно учиться быть руководителем 🌿. Нет такого, что у кого-то от природы дар вести проекты, строить процессы, развивать сотрудников и т.д.

Аналогия из разработки очень простая: ты можешь учиться пользоваться инструментом, а можешь методом тыка и интуиции попробовать им воспользоваться. И то, и друго работает, но есть нюанс 😀. Одно дело пользоваться браузером, а другое — ПО для управления атомным реактором. Вот управление для меня — это сродни второму примеру, где важен каждый компонент, где неверное решение может с одной стороны невелироваться сложностью системы, а с другой стороны запустить медленный процесс с большими последствиями 🤯.

Учиться можно по разному. Например, я выделяю для себя следующие ресурсы в порядке приоритетов:
— Мой руководитель и лиды в моей службе. Это самые ближайшие люди, которые имеют прямо здесь и сейчас очень богатый опыт и готовы им поделиться, нужно лишь только придти. Ребят, если читаете — спасибо вам, что помогаете мне 😍;
— Youtube. Я часто смотрю выступления со конференций, по типу Teamlead Conf, а также смотрю подкасты с разными руководителями, чтобы подчерпнуть их опыт, понять их образ мышления;
— Книги. У меня не получается много читать, но тем не менее, иногда получается подчерпнуть важную информацию. Особенно полезно возвращаться, когда хочешь проработать конкретный кейс.

Из того, что я не делаю, но пора бы начать 🔼:
— Нетворк. Слушать руководителей в команде хорошо, слушать умных людей в ютубе тоже хорошо. Но еще хорошо иметь товарищей не из моего отдела, не из компании, чтобы взаимоопыляться. Тут хорошо бы найти способы нетворкаться, если знаете — пишите в комментарии;
— Курсы. Хорошие курсы — это в первую очередь пришедшие туда люди и экспертиза наставников с большим стажем;
— Конференции. Одна из баз для нетворка и иногда нетривиальных выводов.

Какие навыки развивать? Оооооо, ну тут всё очень сложно. Нужно справедливо себе отвечать на вопрос — "а что проседает сейчас?". Это нормально, если всё пока около нуля (хотя скорее всего, вы себя недооцениваете). Как вариант придти к своему руководителю и попробовать вместе с ним выстроить приоритеты.

Какие навыки бывают? Разные. Я как-то смотрел на карту тимлида (https://tlroadmap.io/), общался с руководителем, и среди всех мнений выписал, а на что нужно фокусироваться.

Сколько времени надо? Много. Некоторые вещи и за год сложно сформировать (например, стратегическое мышление, как мне кажется), а что-то приходит в сознание относительно быстро (например, какие практики имеет смысл использовать в команде). К сожалению, руководителем нельзя стать за 21 день (тут я больше верю в обучении C++).

Какой бы я себе дал совет 5 лет назад (именно тогда я начал задумываться про руководство)? Начинай учиться. Удивительно, но когда начинаешь понимать образ мыслей руководителей, начинаешь понимать, чо они от тебя все хотят. Ретроспективно я проследил за собой, чего от меня хотели руководители в тех или иных ситуациях, когда я был разработчиком.

Ставьте 🔥, если хотите побольше такого материала. Пишите комменты, что думаете про эту тему сами.

Вы всегда можете побустить мой канал: https://news.1rj.ru/str/blog_toxa?boost
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥51👍4💯3🏆32💩2👾1
Визибилити

На выходных просмотрел роликов несколько роликов с канала: https://www.youtube.com/@tobecto. Мне, конечно, рано быть 😀, но всегда интересно послушать людей, которые думают на больших масштабах. Я кайфанул с многих роликов, но по вайбу заполнился Эмиль Абдулнасыров, CTO Ламоды. Ролик про человека, который явно что-то понял в этой жизни 🔼!

Но среди всего есть еще и видео про визибилити: https://www.youtube.com/watch?v=A8OK2mvH17Y. Он выбивается из формата, о чём ребята сразу же и говорят. Мне бы этот ролик, да года 4 назад 🥺.

Весь подкаст ребята пытаются построить определение, что же такое "визибилити". Это может быть прозрачность действий, это может быть личная видимость на разных уровнях. В общем, термин многогранен.

Для себя я подчерпнул следующее:
1. Модель для донесения информации о том, чем ты сейчас занимаешься, может быть следующей: продукт, технологии, люди.
2. Нужно понимать, на каком уровне мыслит руководитель и поставлять в понятном для него виде информацию. Ну, например, странно будет придти СТО и рассказывать 10 минут о том, как вы чинили какой-то мелкий баг 👨‍🦳;
3. Информация должна быть записана и доступна. У руководителя всегда должен быть доступ к информации о текущем статусе проекта.
4. Визибилити иногда решает, кому доверить проект. В ролике была озвучена аналогия с ремонтной бригадой: когда люди обычно выбирают, с кем делать ремонт, в первую очередь они спрашивают у знакомых, редко оперируя терминами, подходящими под KPI. Типа: "Ну норм ребятам сделали, да были пару косяков, но в целом хорошо".

Также было и правда много интересных мыслей между делом. Записал себе на проработку, через пару месяцев вернусь, гляну — ок не ок 😍.

Это, кстати, один из тех роликов про образ мышления людей старше. Рекомендую смотреть всем 🌿
Please open Telegram to view this post
VIEW IN TELEGRAM
💯8👍7🔥5
Forwarded from Segment@tion fault
Китайский ИИ DeepSeek за один день покорил Уолл-Стрит, потому что упорно отказывается программировать на С++, а значит имеет сознание
🤣3418🤡2👍1🤯1😢1
😀
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣2516🌭8🦄8🤡2👍1
Я всё пропустил, но получается так?
🤣38💯6👍4🤡21
Perforator — наконец-то в опенсорсе!

Одним прекрасным вечером я пытался понять, как нам снять профиль у сервиса в рантайме, для того, чтобы понять узкие места для оптимизации ресурсов. Я начал искать по интранету, чего у нас такое есть и нашёл ещё тогда никому не известный perforator. С тех пор мы с ним друзья.

Я видел, как всё больше и больше этот инструмент влезает к нам в инфраструктуру и позволяет делать важные выводы о производительности сервисов. Однажды это стало возможным делать без каких-либо приседаний: любой человек мог натыкать себе сервис и посмотреть, как у этого сервиса дела.

А потом большие запуски, рассказы на всю компанию и вот сегодня — релиз в опенсорс. Я очень рад за ребят, большой фундаментальный труд! Спасибо им большое!

P.S. Ребята в статье расскажут лучше меня, что это вообще такое: https://habr.com/ru/companies/yandex/articles/875070/
🔥27🌭4👍3👾31
Channel photo updated
Channel name was changed to «Дратути Антон»
Привет! Меня зовут Антон Клочков — и ко мне можно на ты! Сейчас руковожу R&D командой в Яндексе. Про нас лучше всего расскажет этот лендинг!

В прошлом — ML инженер в области компьютерного зрения. Поделал всякое (детекторы, классификаторы, сегментаторы, SLAMы) для всякого: gpu-poor девайсов (например, rpi), gpu-rich серверов. Реализовал фичи как для себя, так и для миллионов пользователей по всему миру. Во всей деятельности меня привлекала прежде всего инженерная сторона вопроса.

Люблю говорить про оптимизации и ускорения, находить странности в языках программирования, а также высказываться на интересующие меня топики.

В этом блоге вы можете почитать душные посты про разработку, непонятные мысли про управление, и даже очень понятные мемы, к которым питаю слабость!
1025🔥9👾6💩4
Дратути Антон pinned «Привет! Меня зовут Антон Клочков — и ко мне можно на ты! Сейчас руковожу R&D командой в Яндексе. Про нас лучше всего расскажет этот лендинг! В прошлом — ML инженер в области компьютерного зрения. Поделал всякое (детекторы, классификаторы, сегментаторы, SLAMы)…»
Дратути Антон
Готовлю для вас пост по итогам моей недельной поездки на родину! А пока, надеюсь, что фоточки донесут немного вайба до вас☺️
Про итоги

А теперь, наконец-то — про итоги поездки.

Я весьма классно пообщался с бабушкой. Это было невероятно, потому что весь день можно было общаться, а вчером-ночью поработать!

Меня просто закормили холодцами, пирогами, борщами и всем тем, чем любят потчевать внуков их бабушки 😁!

Я подзарядился воздухом и атмосферой абсолютного спокойствия. Замедлился настолько маскимально, насколько это возможно в современном мире. Этого правда очень сильно не хватало.

Кроме того, я немного работал. Когда я общался с ребятами по зуму — все положительно отзывались о ковре, который был не фоном, а настоящим!

После этого я подумал, что пора произвести редизайн канала. И вот оно случилось 😂!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍63💯3
Forwarded from Банкста
This media is not supported in your browser
VIEW IN TELEGRAM
Коротко об успехах Deepseek. @banksta
18🤡6🔥3😢3
MLE шатает Produnction — В С Ё

Антон поменял канал — ИЗМЕНИЛ название и аватарку. Люди негодуют и не понимают КАКОГО ХРЕНА?

😶😶😶 😶😶😶😶😶😶

Антон продолжит деятельность канала под новым названием. Почему это произошло уже разобрали в этом посте.

P.S. Протите котика 😊
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9😁7🤡5🤣41💔1😭1
Комментаторы в интернете нашли логотип для полноценного релиза o3 от OpenAi
33🤡5
Forwarded from AbstractDL
DeepSeek-R1 для чайников

Ну и наделала же DeepSeek шуму. Мне пришлось целый хабропост написать 😁

TLDR: мало слов про сравнение с ChatGPT и метрики, много слов про технические детали обучения, датасеты, GRPO и якобы эмерджентный «Aha! moment».
🔥6👍5🤡53🌭1
How to Scale Your Model

По наводке @epsiloncorrect делюсь вам прекрасным чтивом о том, как делать вычисления эффективными на разных масштабах для разных размеров ваших моделек: https://jax-ml.github.io/scaling-book/.

Естественно, я не успел так быстро всё прочитать, но там ещё много чего нужно осознать на самом деле. Правда полистал и посмотрел. В гайде есть классные картинки, интересные задачки на размять мозги, много (на первый взгляд) реально полезных выводов и выкладок.

Меня в целом настолько поразил контент, что обязательно выделю время изучить весь материал, хоть это и не так просто в последнее время. 😊

Зачем вам это? Отвечу словами из гайда, с которыми я очень солидарен:
Three or four years ago, I don’t think most ML researchers would have needed to understand any of this. But today even “small” models run so close to hardware limits that doing novel research requires you to think about efficiency at scale. A 20% win on benchmarks is irrelevant if it comes at a 20% cost to roofline efficiency. Promising model architectures routinely fail either because they can’t run efficiently at scale or because no one puts in the work to make them do so.
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍63🤡3🔥2
Особый вклад в найм

Вчера была совершенно неожиданная для меня тусовка, которую устроила компания для тех, кто очень много приносит пользы в процессе найма. И это так классно, что за такую штуку, которую ты просто считаешь своей работой, к тебе приходят и говорят — спасибо 😍!

Нам подарили классную джинсовку и подложили карточку, что сейчас вы можете наблюдать на фотографии.

Что же я такого сделал для найма? Если честно — просто делал свою работу. Собеседования — это очень интересное занятие, на мой вкус. Мне кажется, очень сложно найти такое место, где можно услышать сотню разных (и правильных!) мнений по тому или иному вопросу.

Ну и на самом деле я успел пообщаться уже с большим количеством людей: кто-то только начал свой путь, а кто-то уже тёртый калач, кто-то просит советов, а у кого-то ты во время собеседования и сам учишься.

С другой стороны — это дело трудозатратное. К собеседованию нужно готовиться, потом его нужно оценить и дать внятный фидбек. Это всё занимает времени, но оно того стоит. Я очень рад, что часть людей, которая прошла через меня, уже работает в компании, а с кем-то мы работаем даже бок-о-бок!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2616👍5🤡4🤣1
Structured Output в LLMках

Скорее всего все уже знают про то, что с помощью LLMок можно генерить не просто какой-то текст, а даже структурированную информацию (например, json) 🌿. Этакий llm json mode.

Мне стало интересно, как это работает на самом деле (привет Коннор) под капотом, поэтому решил погуглить чего есть для json. Итак, что я нагуглил:

1. https://blog.dottxt.co/coalescence.html
Спойлер: по сути, мы ограничиваем генерацию стейт-машиной. Из-за этого модель жестко ограничена только тем, что заложили в грамматику этой стейт-машины. Приходится напрягаться и подчиняться.

2. https://github.com/noamgat/lm-format-enforcer#how-does-it-work
Спойлер: строят префиксное дерево для токенизатора и парсер для схемки json. Потом ходят двумя указателями (по одному в каждом дереве) и ходят туда, куда могут пойти сразу оба.

У первого способа есть проблема холодного старта и нужно построить стейт-машину, что дольше, чем строить деревья. Но если всё же словарь огромный, то деревья становятся жирнючими и долгими (в построении) 👨‍🦳, поэтому дешевле стейт-машину завозить.

Вендоры же стараются просто заюзать подобные подходы и либы, просто оптимизируя узкие места (например, стейт-машину) 🤯.

Вопросики 😍: может кто-то еще знает каких-то подробностей, как оно работает? Может быть еще какие-то либы, примеры, алгоритмы?
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥4🤡3
Сгенерировал пару мемов с помощью @AIMemeArenaBot на основе текстов из прошлых постов.

Мой мир просто: 🤯
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👾4🤡32👍1😍1