ITипичные аспекты Артёма – Telegram
ITипичные аспекты Артёма
524 subscribers
16 photos
3 videos
1 file
12 links
Robotics->python backend->computer vision->RnD team->GenAI->Lead универсал

И вот мы здесь
Download Telegram
Чем занимаются приличные люди в отпуске? 

Я занимался примерно этими самыми нормальными делами, пока не наступил сентябрь. В сентябре случилось осознание, что неплохо бы размяться-вспомнить, как буквы в питончике складываются.
Тут как раз случилось случайное общение с Валерой , шо там ещё люди придумали из новомодного и современного (а именно, SGR). Я уже был на низком старте чтобы по традиции засрать всё и злорадно аргументировать, что +- такой концепт работы с ризонингом LLMок гуляет ещё со времён начала популярности Structured Output. Ну может без шага натягивания совы выбора тулзов на глобус SO схемы. В этом и новизна, собственно.

Наш культурный спор дошёл до кода и примеров сниппетов, и вот тут возник нешуточно интересный вопрос - как себя будут вести экстрамелкие LLMки в SGR-специфически построенном флоу? Результаты опытных запусков прототипчика оказались любопытными, а значит к коллайдеру!

Ииии вот так я обнаружил себя на полшишечки в опенсорсе, третий день подряд переписывающим концептик Валеры(и ещё группы интересных людей) на нормальные код-рельсы и архитектуру. Иногда  кажется, что это у меня особая форма стокгольмского синдрома - ходить и переписывать порочные артефакты вайб-кода, причём чужие. Но ладно.

Было бы хорошо - меня бы не позвали ⓒ

Не могу без удовлетворения смотреть на результаты своей работы. Получилось на мой вкус симпатично. Дальше слегка подразвить и прикрутить бенчмарки. Можно ощущать себя полноценным практикующим ресёрчером, ещё и в опенсорсе. Сплошная позитивная карма

https://github.com/vakovalskii/sgr-deep-research - сам репо
https://github.com/vakovalskii/sgr-deep-research/pull/10 - практический кейс перепиливания архитектуры, 1500+ 4500- в одном PR и меня за такое даже не послали!
🔥83👍2🥰1🤩1
По мотивам обсуждения в чятиках

В копилку идей для петпроектов, которые я, разумеется, не реализую:

Собрать бенчмарк исключительно из мемасиков уровня 80тикилограммовой курицы или перепутанных кроссовок и отслеживать, как модели с ними разбираются. И шахматы. В бенче обязательно должны быть шахматы. Можно замерять количество ходов до того как что-то пойдёт не так
upd: как я мог забыть про кружку с запаянным верхом!

И можно ещё метрику по генерации кринжовых шуток добавить, но я не уверен, как её проверять
😁6🤡4💩3
Weeell, сегодня я буду сравнивать кодинг с эксгибиционизмом😊

Вчерашний вечер (и позавчерашний тоже. И часть сегодня тож) я опять развлекался тем, что вкидывал в опенсорс очень своеобразные вещи. Посмотреть на них можно тут
https://github.com/vakovalskii/sgr-deep-research/pull/18

Изначально план был неторопливо покрутить структурные изменения кода в пользу выделения kit_а из абстракций, над которыми можно удобнее пересобрать всех дальнейших агентов и бенчмарк.

Потом мы дежурно схлестнулись с @vakovalskii на тему агентских флоу, в процессе я докопался ещё до пары людей из команды. И тут желания кому-то что-то доказать в интернете подприбавилось.

Так за два дня родилась эта бомба +1300-700
Оно мне неиллюзорно нравится: в процессе рефакторинга испытываешь специфически одухотворëнные чувства, когда из изначального хаоса формируешь более стройные концепции.
У меня ещё с курсором как-то не задалось на этом проекте - все происходило лампово вручную


Теперь к опенсорсному эксгибиционизму. Чек-лист:
- Приличные люди таким не занимаются
- Делаешь это публично
- Ожидаешь, что все посмотрят
- При этом боишься общественного осуждения
- Тебе есть что показать миру
- Показываешь всю свою потенцию весь потенциал
- Если увлекаешься, приходит полиция кода и объясняет, что ты извращенец
- Находятся люди, ревьювящие и обсуждающие показанное
- Формируется комьюнити таких как ты
👍6🌚3
Что ни день то понедельник, что ни горе - то беда


Штош, вроде благополучно сходил в отпуск (ещё в сентябре на самом деле), надо какую-то активность в канале возобновить.

За это невеликое время у нас ушёл СТО, прошёл аудит безопасности, собралась генеральная демо, была произведена уже 6ая по счёту попытка команды совладать с астериском.
И прочие приятно тонизирующие рабочие активности, ну вы знаете, чтоб совсем уж не расслабляться.

Что-то в мире происходило, что всенепременно надо осветить... Я б для себя выписал
- Не очень интересная презентация OpenAI
- Очень любопытный релиз πthon.

Самый насущный вопрос - кто-то уже тестил/читал статейки, как он по метрикам?
По моим последним гуглоданным ~15-20% медленнее в обычных задачах и ожидаемо удобнее в требующих параллелизма (но руками ещё не тестил). Уже предчувствую, как мы стоим на входе в дивный новый мир кокблоков и race conditions

Ну и главное событие, вызвавшее во мне жгучее желание написать что-то прям здесь и сейчас:
сегодня на редкость тёплый денёк https://downdetector.com/
Тёплый - потому что я прям чувствую глобальное потепление от повсеместно полыхающих девопсов, ибо таких глобальных проблем не помню, емнип, с момента как некто подорвал интернет-кабельную магистраль в районе Красного моря.
🔥4💯31🥰1🦄1
https://news.1rj.ru/str/neuraldeep/1675
> стабильный

кхе кхе


Обычно я стараюсь сильно не повторяться, но вот этим я не похвастаться просто не могу!
Фиг бы с ним с релизом, он обеспечил мне внушительное количество бодрых вечеров за кодом и холиварами на тему, почему надо развиваться/бенчмаркаться/описываться именно так, а не иначе. Это не главное.

Вы только посмотрите на эту прекрасную схему.
О, Мадонна! Как оно красиво, как оно хорошо, упорядоченно, как же мне нравится моё дизайнерское видение. Явно лучшее из всего сотворённого на этом проекте
💯7🔥4👍3
Экспериментальные посты!
Долго не мог придумать, как лучше показывать некоторые интересные практические части своей работы. Когда дело доходит до донесения идеи в коде, тебя начинают преследовать три страшных вещи - объём, сложность и NDA.

Вместе с тем, аж разрывает как хочу поделиться с миром результатами предыдущей недели своих изысканий

Попробуем так
https://github.com/virrius/tts_intonation_research

Чтоб вспомнить как работать с ноутбуками и преобразовать всё в удобоваримую статейку ушло 6 часов помимо самой, собственно, работы. Жууть
❤‍🔥5👍3🔥3
Решение из разряда "А почему я сразу так не сделал?!"

Последние две недели в свободное от срочной работы время поддерживаю и потихоньку рефакторю часть платформы интерактивного общения, а потому на этот раз делюсь способом сократить задержку до ответа на нелишних 0.2-0.4с.

Здесь случай, когда подумал на шажок дальше тривиального in-memory кэша, и за счёт persistent части можно при обнаружении проблемных частей генерации на лету их подменять более качественными прегенами просто дозагрузив их с ключом соответствующей фразы. Для сценариев с детерминированными ответами можно бесшовно полностью заиспользовать преген диктора к примеру

Любопытный технический элемент здесь, увлёкший меня на пару часов дак точно, как хранить озвучку?

Первым порывом было закидать монгу бинарниками, разумеется. Но как-то сумел себя сдержать, подраскинул мозгами и грустно осознал, что без S3 не обойтись. Вот так и обрастают проекты кучей инфры.
Следующей возникла не менее(не более?) здравая идея паковать весь неймспейс (по логике все записи, относящиеся к одному сценарию разговора) всё также в бинарку и хранить уже в s3. И это звучало прекрасно, за один запрос вытягивать и распаковывать всё необходимое, но когда бы возник сценарий апдейта одной фразы из пака - случился бы оверхед. Так что время инициализации было решено принести в жертву. Впрочем, ничего нового

П.с. И ещё чуть было не использовал питоновские футуры по назначению, но тоже передумал и остановился на коллбэке. Возможно это только мои загоны, но раньше практически не доводилось их использовать для выдачи результата работы асинхронного кода в явном виде.
🔥5👍1🤔1
На практике это выглядит примерно так.
Среди всего этого цветастого безобразия можно заметить исчезновение ярко зелёных TTS колбасок. Это задержки до выдачи первой фразы пользователю

Тут не совсем чистое сравнение ибо первый скрин с локального окружения и там накладные расходы сетевого долёта до серваков. Но в целом концепция, я думаю, понятна
2
После решения конфликтов в команде конфликты в гите кажутся такими понятными, милыми и приятными.

А вообще, если правильно помню, первая IT паника на рабочем месте была связана именно с ребейзом. Я тогда ещё более смутно представлял, как оно работает и просто пытался заменить ctrl+c ctrl+v всю цепочку коммитов на финальный вариант.
А оно постоянно пропадало и пыталось перезаписаться каким-то старым состоянием!
😁9