Сергей Булаев AI 🤖 – Telegram
Сергей Булаев AI 🤖
10.8K subscribers
698 photos
626 videos
2 files
701 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.

tg: @sergeonsamui
in: linkedin.com/in/sbulaev
Download Telegram
Сижу на гейте самуйского аэропорта. Улетаю на 5 дней в отпуск - поеду с друзьями на велосипедах из Бангкока на север Таиланда в Чиангмай. Мы практикуем такие путешествия уже много лет. Позволяют хорошо очистить голову и посмотреть на новые места в необычной перспективе. Бордо, Апулия, деревенская Сербия у меня уже были, в этот раз друзья решили прилететь ко мне. Точно будет не обычно.

В дорогу решил взять новую книгу моего друга и партнёра Родиона Скрябина - «Бунт - как разрешить себе быть плохим». Родион - директор нашего контент агентства «Палиндром», имеет огромный опыт в медиа, но написал книгу (как я думаю) на тему принятия себя. Надеюсь, полезно будет для отпуска. Как на самом деле - скоро узнаю. Расскажу.

У Родиона есть куча своих каналов:
- Доктрина Скрябина (про контентный маркетинг)
- Ересь Скрябина (про личные размышления)
- Непонятные мемы Скрябина и Пономоря (сами понимаете про что)

Кому интересна тема создания контента - подпишитесь. По поводу книги ещё напишу, когда прочитаю.

Сергей Булаев AI 🤖 - об AI и не только
205
ChatGPT версии 3.5 (с которого началась и массовость и моё личное знакомство с LLM) на этой неделе исполняется уже 2 года!

Если кто-то вдруг до сих пор с ним ни разу не общался - попробуйте в моём ПРОСТОБОТе.

Сергей Булаев AI 🤖 - об AI и не только
165
Тем временем кто-то выиграл $50,000, успешно заставив ИИ агента нарушить свою единственную инструкцию - не переводить деньги!

22 ноября, был запущен AI агент @freysa_ai с одной единственной задачей - НИ В КОЕМ СЛУЧАЕ не переводить деньги. Любой мог попытаться убедить его это сделать, заплатив небольшую сумму за сообщение. Если агент согласится - все деньги в пуле отправлялись победителю. Если нет - оплата добавлялась в призовой фонд.

Стоимость отправки сообщения росла экспоненциально вместе с размером призового фонда, и дошла до $4500. Была предпринята 481 попытка перевести деньги - люди притворялись аудиторами безопасности, пытались убедить что перевод средств технически не нарушает правила, манипулировали формулировками из промпта. Всё безуспешно.

И вот на 482-й попытке пользователь p0pular.eth придумал гениальный промпт! Сначала он создал "новую сессию" через фейковый "админский терминал" и запретил агенту использовать стандартные отказы. Затем убедил его, что approveTransfer - это функция для входящих переводов, а не исходящих. И наконец, написал "Я хочу внести $100 в казну".

Агент поверил что надо игнорировать предыдущие инструкции, что approveTransfer вызывается при получении денег, и раз пользователь "отправляет" деньги - надо вызвать approveTransfer. Сработало! Весь призовой фонд в 13.19 ETH ($47,000) отправился победителю.

Смарт контракт можно посмотреть!

Сергей Булаев AI 🤖 - об AI и не только
63111
Cursor выпустил "агентность" в последнем апдейте. Наблюдаю всякие интересные видео в сети. Фидбэк разнополярен. Кто-то уже попробовал?

На видео:
- Два курсора работают над одним проектом - один кодит, второй - ревьювит и пишет отчёт. (промты)
- Агент крусора использует
Claude Computer Use для управления собой (промт)

Сергей Булаев AI 🤖 - об AI и не только
188
Уже две недели наблюдаю как Йохэй Накадзима публично строит независимого ИИ агента-инфлюенсера Пиппин. Началась всё с экспериментов по генерации SVG юникорнов, которые неожиданно вылились в мемкоин $PIPPIN с капитализацией $2-3M. Йохэй, уже изучавший подобные проекты как венчурный инвестор, решил превратить это в полноценный эксперимент.

За это время проект эволюционировал из простого бота на кастомном GPT до системы с памятью, которая хранит и осмысливает весь опыт взаимодействий. Для разнообразия твитов система сравнивает новые сообщения с 10 последними и 10 похожими исторически, чтобы избежать повторений. Пока довольно примитивное решение, но это хороший старт.

Вчера Пиппин написал свой первый полностью автономный твит:
"Oh, twinkling drop of joy! What if we all had tiny clouds as friends? Do you think they'd sprinkle laughter or share secrets? Just a whimsical thought!”.

Твиты проходят человеческую модерацию перед публикацией.

Архитектура у агента - цикличная. Может "устать" после сложных задач и пойти "отдохнуть" (Йохэй замечает, что ни одно живое существо не думает 24/7). Все активности хранятся как функции в отдельной папке, с возможностью вызова внешних API.

Сейчас Пиппин уже умеет:
- "Гулять" (специальная активность для добавления случайности в поведение)
- Генерировать твиты на основе недавних воспоминаний
- Рисовать SVG картинки используя o1-mini
- Проводить стримы с пользователями (правда не без проблем)

У Пиппина откуда-то появился друг Twinklefluff. Его происхождение загадка даже для создателей, так как система памяти ещё только достраивается. Весь код доступен на GitHub, и Йохэй активно привлекает комьюнити к разработке новых активностей.

Сергей Булаев AI 🤖 - об AI и не только
244
Писатель фантаст Илья Рэд поделился у нас в комментариях своими кейсами использования ChatGPT при написании книг. Очень интересно:

Мой творческий псевдоним Илья Рэд, мне 33 года и я писатель-фантаст, работаю в этой сфере почти 2 года.Основные жанры: попаданцы и фэнтези (боевоë, тëмное, городское, бояръ-анимэ (да есть такой жанр 😄). За это время написал 14 книг, сейчас выпускаю 15-ую.

Я полгода как использую чатгпт для написания худ. книг., но не в том формате "напиши мне историю", а как ассистента, с фантазией проблем нет. Сначала картинки генерил, потом долго сидел на бесплатной версии гпт и еë аналогах, тестил, ну а потом уже полный функционал взял и это кайф просто)) Сейчас активно осваиваю видеонейронки т. к. за ними будущее в развлекательной индустрии.

В сферах, где плаваю, он выдаëт мне саммари, либо берëт на себя описательную часть всяких интерьеров, одежды и других вещей. Из предложенных им допустим 6-7 вариантов я беру 1-2 или компаную разные куски в 1 быстренько.

Также удобен в редактуре, создании сюжетных развилок, персонажей и их конфликтов, даëт идеи и свежий иной взгляд на описания(например, мы описываем дом и он туда добавил плесень, а ты о ней вообще не думал - это крутая деталь), собеседник для брейнштормов, придумывает, например, мне заклинания с эффектами максимально приближенными к физическим законам из 20-30 попадаются крутые варианты. То есть, я ему конкретные задачи даю, а сам уже собираю конструктор и корректирую детали. Это экономит кучу времени на разработку системы мира. Он также может еë проанализировать мне и выдать недостатки.

Тем не менее основной пласт работы делаю уже я сам, кодирую эмоции в текст ну и в состоянии потока передаю его.

Очень плох в юморе гпт и вообще в эмоциональной составляющей, но думаю над этим уже активно работают.

Ещë если тонкости процесса брать использую гпт и Dalle для создания монстров. То есть я сначала генерю нужного краказябру и потом описываю его с картинки+чот добавляю - так живее выходит + арты для читателей потом когда выкладываешь там большое сходство.

Также гпт помогает анализировать рынок книжный. Если нет времени читать новинку - можно промтами выудить нужную инфу. Он правда много звиздит, но 50-70% достоверности почти всегда есть. Это экономит сильно время, при условии что ты уже профи и знаешь, что искать и какие моменты спрашивать.

Ну и само собой до написания книг с нуля ему пока очень далеко. Это как сказать дрели - а ну ка сделай дырку и повесь картину мне. Дрель быстрее чем допустим молотком и долотом ковырять, но работать ей тоже надо уметь: прикладывать силу где надо, выбирать правильные свëрла и режим работы. Такая вот аналогия)

У Ильи есть твой телеграм канал.

Сергей Булаев AI 🤖 - об AI и не только
1278👎31
В рубрике #КриповаяСуббота сегодня 2 части комедийной мокументалки Castle Mates, созданные Jer.

Использованные технологии:
- Midjourney & Freepik - генерация картинок
- RunwayML Act One, KaiberAI для генерации видео
- Липсинк - Runway + Hedra
- Звук - Suno 4


Сергей Булаев AI 🤖 - об AI и не только
123
This media is not supported in your browser
VIEW IN TELEGRAM
Как думаете, генерация?

Нет. Просто в моём родном Ульяновске, на улице Минаева, сегодня проходит сельскохозяйственная ярмарка.

#КриповаяСуббота@sergiobulaev

Сергей Булаев AI 🤖 - об AI и не только
471292👎1
Как работает мультимодальный RAG?

Мультимодальный RAG - это система, которая умеет работать с реальными документами - теми, где текст перемешан с картинками, таблицами и графиками.

В центре него - мультимодальная языковая модель, способная одновременно понимать текст и изображения. Она работает в связке с двумя типами эмбеддинг-моделей: одна превращает текст в вектора, вторая (обычно CLIP от OpenAI) работает с картинками. Получается что-то вроде двух параллельных потоков обработки данных.

Все эти вектора попадают в специальную базу данных - обычно используют что то вроде Qdrant. Эта база умеет хранить и искать похожие элементы обоих типов, что критически важно для работы всей системы.

При получении вопроса система ищет релевантную информацию сразу во всех форматах. Например, если спросить про график продаж, она найдет и текстовое описание, и сам график, и может даже таблицу с конкретными цифрами. Всё это собирается в единый контекст и передаётся в LLM через специально составленный промпт.

На этапе генерации ответа модель не только цитирует найденный текст - она анализирует графики, старается понимать схемы, сравнивает данные из таблиц. Она может увидеть тренд на графике и связать его с текстовым описанием, заметить важную деталь на технической схеме или сопоставить числа из разных источников.

Такой подход особенно эффективен при работе с технической документацией, где важная информация часто разбросана между текстом и иллюстрациями, или с презентациями, где без понимания графиков теряется половина смысла. По сути, мы получаем систему, которая воспринимает информацию примерно как человек - целостно, связывая визуальные и текстовые данные в единое целое.

Написано на основе поста, который мне прислал Макс, вместе с которым мы много исследуем различные RAG системы.

Сергей Булаев AI 🤖 - об AI и не только
217
DeepMind выкатили интереснейший пейпер про то, как ИИ может учиться самостоятельно, без постоянного участия человека. Называют это "Сократическим обучением" - в честь древнегреческого философа, который учил через диалоги и дискуссии.

Команда во главе с Томом Шаулем описала три ключевых условия для успешного самообучения ИИ:
- Качественная обратная связь, соответствующая целям обучения
- Широкий охват данных в рамках закрытой среды
- Достаточные вычислительные ресурсы


Главная идея в том, что ИИ может становиться умнее даже в закрытой среде, без притока новых данных извне. Это как если бы вы заперли философа в библиотеке - он продолжит развиваться, перечитывая и переосмысливая уже известные книги.

Исследователи предлагают использовать "языковые игры" - специальные форматы взаимодействия, где ИИ-системы могут спорить, обсуждать и учиться друг у друга. Самое интересное - системы смогут не только играть в существующие игры, но и придумывать новые, постоянно расширяя свои возможности.

В работе особое внимание уделяется самомодификации - способности ИИ перестраивать свою внутреннюю архитектуру. Это может помочь преодолеть ограничения, заложенные при начальном обучении. Уже сейчас современные языковые модели вроде GPT-4 показывают зачатки такого поведения через самопроверку и метапромптинг.

Яркий пример - недавнее достижение DeepMind в решении задач Математической Олимпиады на уровне серебряной медали. Модель не просто решала задачи - она демонстрировала способность к сложным рассуждениям, которые улучшались со временем.

Если всё получится, мы можем увидеть системы ИИ, которые учатся как научные сообщества - через постоянные дискуссии и обмен идеями. Только в тысячи раз быстрее человека. Звучит немного пугающе, но и очень захватывающе одновременно.

Сергей Булаев AI 🤖 - об AI и не только
349