Сергей Булаев AI 🤖 – Telegram
Сергей Булаев AI 🤖
10.8K subscribers
698 photos
626 videos
2 files
701 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.

tg: @sergeonsamui
in: linkedin.com/in/sbulaev
Download Telegram
Markdown to Poster - react компонент, преобразующий Markdown в баннеры (изображения). Так же в проекте реализован веб редактор. Можно посмотреть и попробовать демо, а тут - исходный код.

Сергей Булаев AI 🤖 - об AI и не только
113
This media is not supported in your browser
VIEW IN TELEGRAM
MagicQuill - ИИ редактор изображений с максимально простым, но мощным интерфейсом, где для вставки объектов, удаления элементов или изменения цветов достаточно буквально пары движений.

Система использует мультимодальную языковую модель, чтобы в реальном времени угадывать, что вы хотите сделать с изображением, избавляя от необходимости писать промпты. Для работы нужна видеокарта с 8GB VRAM, но можно попробовать и в онлайн-демо на Huggingface или веб-версию, где можно отключить автоматическое заполнение промптов.

Доступны исходники и пейпер.

Сергей Булаев AI 🤖 - об AI и не только
175
Продолжаем потихоньку двигаться к сингулярности. А вы уже интегрировали хотя бы одного агента в своей повседневный рабочий процесс? (Ну или не рабочий)

Сергей Булаев AI 🤖 - об AI и не только
1884
Anthropic, после получения $4 млрд инвестиций от Amazon, продолжает удивлять. Они представили Model Context Protocol (MCP) - открытый протокол для интеграции LLM с внешними источниками данных и инструментами.

Если Computere Use позволял Клоду работать в браузере, то MCP даёт возможность десктопной версии напрямую взаимодействовать с кодом на вашей машине. Выглядит как Language Server Protocol, но для ИИ.

Что умеет MCP:
- Работать с любыми данными: файлы, базы данных, API, системные логи, скриншоты
- Использовать переиспользуемые шаблоны и многошаговые рабочие процессы
- Интегрироваться с системными операциями и инструментами обработки данных
- Поддерживать двустороннюю коммуникацию через JSON-RPC 2.0


Интересный момент - протокол позволяет серверам запрашивать у клиента completion'ы от LLM, что намекает на скорый запуск роутера моделей от Anthropic (с приоритетами по цене, скорости и интеллекту).

Отзывы в основном положительные, хотя некоторые на Hacker News уже вспоминают знаменитый комикс XKCD 927 про стандарты 😅

Очевидно, выстраивание полноценной экосистемы вокруг Клода продолжается.

Сергей Булаев AI 🤖 - об AI и не только
1752
This media is not supported in your browser
VIEW IN TELEGRAM
Алекс Альберт рассказывает как попробовать MCP самому на собственном компьютере:

1. Скачать последнюю версию десктопного приложения Клода.
2. Получить ключ Brave Search API (бесплатно 2000 запросов)
3. Открыть файл настроек Клода:
- macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
- Windows: %APPDATA%\Claude\claude_desktop_config.json

4. Добавить туда строчки:
{
"mcpServers": {
"brave-search": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-brave-search"],
"env": {
"BRAVE_API_KEY": "ADD_YOUR_API_KEY_HERE"
}
}
}
}

5. Перезапустить десктопного Клода загрузки настроек. Можно проверить их во вкладке Developer, Claude > Settings.
6. Теперь Клод сможет искать в сети для вас!

Если хотите сами попробовать сделать интеграцию или другие сервера - смотрите GitHub. Там куча примеров.

Сергей Булаев AI 🤖 - об AI и не только
2081
Runway жжёт! Зарелизили Frames - новую базовую модель для генерации изображений, встроенную в Gen-3 Alpha. И это буквально через 72 часа после выкатывания расширения видео кадров!

Frames - это как Midjourney SREF на стероидах. Главная тема - полный контроль над стилем и возможность создавать вариации, оставаясь в рамках выбранной эстетики. Runway называет это "Мирами". Посмотрите на несколько примеров:

Мир 1089 "Mise-en-scène": Переосмысление цифровых портретов через визуальный стиль классического кино. Мастерская игра света и тени.
Мир 4027 "Japanese Zine": Ретро-аниме встречается с научной фантастикой - техноцветные цветы, летающие тарелки и смелые линии манги 70-х.
Мир 3190 "1980s SFX Makeup": Возвращение в эпоху, когда монстры создавались латексом и краской, а не пикселями.
Мир 3204 "1970s Album Art": Величественные животные и драматические фотографии в сочетании с экспериментальной типографикой. Прямо как обложки виниловых альбомов тех времён.


Примеры других миров можно посмотреть на сайте.

Frames постепенно раскатывают через Gen-3 Alpha и API Runway. Экосистема для творчества растёт.

Сергей Булаев AI 🤖 - об AI и не только
1095
Тем временем мне прислали новый комп! Прямиком с завода в Китае всего за 2-е суток! 🎧🎧🎧

Посоветуйте как испытать получше?

Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3566
Runner H - специализированная 3B модель для веб-автоматизации. В отличие от Claude Computer Use, это не просто API для браузера, а полноценный визуальный агент, который как будто бы реально понимает что происходит на экране и умеет с этим работать. Ребята подняли $200M на сид-раунде и сразу выкатили интересный продукт.

Модель показывает интересные результаты - 67% успеха на бенчмарке WebVoyager (для сравнения - у Anthropic всего 52%, у Emergence - 61%). При этом она использует в 10 раз меньше параметров чем конкуренты. Runner H работает со скриншотами страниц, понимает контекст интерфейса и может точно определить координаты для клика мышкой по нужному элементу. А ещё она умеет самовосстанавливаться при изменении интерфейса.

Runner H ищет научные статьи на arxiv.org, находит автобусные остановки в Google Maps, получает спортивную статистику с ESPN и даже решает сложные математические задачи через Wolfram Alpha. Всё это просто по текстовым командам на естественном языке. Обратите внимание на пример сложного поиска по рецептам - агент не только находит рецепт, но и анализирует отзывы и рейтинги.

Studio - часть проекта, - платформа для создания автоматизаций. Нужно только описать сложный процесс вроде покупки в интернет-магазине или заполнения документов, а Runner H сам разберётся как это сделать. В будущем обещают добавить возможности для обучения агента специфическим задачам и создать комьюнити разработчиков.

Открыт вейтлист на закрытую бету, и я, конечно же, записался!

Сергей Булаев AI 🤖 - об AI и не только
27104