This media is not supported in your browser
VIEW IN TELEGRAM
База для разработчиков нейросетей — в одном месте собрали 120 бесплатных (!) библиотек для обучения, файн-тюнинга, оценки и разработки ваших нейронок.
Всё удобно разбито по категориям с описанием и ссылкой на GitHub.
Подарок разрабам — здесь.
—
@ai_for_dev — самые полезные AI-инструменты для обучения и образования.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot 💬
Всё удобно разбито по категориям с описанием и ссылкой на GitHub.
Подарок разрабам — здесь.
—
@ai_for_dev — самые полезные AI-инструменты для обучения и образования.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Парсим ЛЮБЫЕ данные с онлайн-ресурсов — нашли топовую хакерскую тулзу Pipet, которая соберет ВСЁ ЧТО УГОДНО с сайтов, онлайн-магазинов, маркетплейсов и социальных сетей.
• Написан на Go — работает очень шустро. Любые данные можно получить буквально за одну команду.
• Поддерживает три режима работы: анализ HTML, JSON и проверку JavaScript на стороне клиента.
• Можно юзать сервис для парсинга ЛЮБЫХ данных, получения уведомлений о доступности товаров, наличия билетов, изменения цен на маркетплейсах, скрейпить фотки, аудио, видео и вообще ВСЁ, что можно разместить в интернете.
• Устанавливается за один клик.
• БЕЗ ограничений.
Тестируем — здесь.
—
@ai_for_dev — самые полезные AI-инструменты для обучения и образования.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot 💬
• Написан на Go — работает очень шустро. Любые данные можно получить буквально за одну команду.
• Поддерживает три режима работы: анализ HTML, JSON и проверку JavaScript на стороне клиента.
• Можно юзать сервис для парсинга ЛЮБЫХ данных, получения уведомлений о доступности товаров, наличия билетов, изменения цен на маркетплейсах, скрейпить фотки, аудио, видео и вообще ВСЁ, что можно разместить в интернете.
• Устанавливается за один клик.
• БЕЗ ограничений.
Тестируем — здесь.
—
@ai_for_dev — самые полезные AI-инструменты для обучения и образования.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1👎1
Claude Code демонстрирует возможности автономной работы с IoT-инфраструктурой
Андрей Карпатый протестировал Claude Code на задаче интеграции с системой домашней автоматизации Lutron.
Агент самостоятельно выполнил полный цикл работ:
— Обнаружил контроллеры в локальной сети
— Провёл сканирование портов
— Нашёл техническую документацию через поиск
— Объяснил процедуру сопряжения устройств
— Подключился к системе и получил список всех устройств
— Верифицировал работу, включив и выключив освещение
Результат: Карпатый разрабатывает собственный command center для управления умным домом, отказываясь от штатного приложения Lutron.
🔧 Кейс показывает, как LLM-агенты могут автоматизировать reverse engineering и интеграцию с недокументированными API.
@ai_for_dev
Андрей Карпатый протестировал Claude Code на задаче интеграции с системой домашней автоматизации Lutron.
Агент самостоятельно выполнил полный цикл работ:
— Обнаружил контроллеры в локальной сети
— Провёл сканирование портов
— Нашёл техническую документацию через поиск
— Объяснил процедуру сопряжения устройств
— Подключился к системе и получил список всех устройств
— Верифицировал работу, включив и выключив освещение
Результат: Карпатый разрабатывает собственный command center для управления умным домом, отказываясь от штатного приложения Lutron.
🔧 Кейс показывает, как LLM-агенты могут автоматизировать reverse engineering и интеграцию с недокументированными API.
@ai_for_dev
🔥1
«Топ за свои деньги» теперь и в мире LLM — Xiaomi выкатили MiMo-V2-Flash, и она реально впечатляет 🔥
Что имеем:
— 73,4% на SWE-Bench Verified (кодерские задачки из GitHub) — рекорд среди open source
— Топ-2 в математике и науках среди открытых моделей
— Цена: $0,1/$0,3 за миллион токенов. Это примерно в 30 раз дешевле Claude 4.5 Sonnet
А ещё занятный инсайд: разработкой занимается Ло Фули — бывший ключевой разработчик DeepSeek. У китайцев там свои нейросетевые войны 😏
Анонс: https://mimo.xiaomi.com/mimo-v2-flash
Hugging Face: https://huggingface.co/XiaomiMiMo/MiMo-V2-Flash
@ai_for_dev
Что имеем:
— 73,4% на SWE-Bench Verified (кодерские задачки из GitHub) — рекорд среди open source
— Топ-2 в математике и науках среди открытых моделей
— Цена: $0,1/$0,3 за миллион токенов. Это примерно в 30 раз дешевле Claude 4.5 Sonnet
А ещё занятный инсайд: разработкой занимается Ло Фули — бывший ключевой разработчик DeepSeek. У китайцев там свои нейросетевые войны 😏
Анонс: https://mimo.xiaomi.com/mimo-v2-flash
Hugging Face: https://huggingface.co/XiaomiMiMo/MiMo-V2-Flash
@ai_for_dev
❤1🥰1
Media is too big
VIEW IN TELEGRAM
Raycast наконец-то вышел на Windows 🎉
Если вы завидовали макбучникам с их Raycast — ждать больше не нужно. Бета для Windows уже доступна.
Что это такое? Представьте Alfred/Spotlight на стероидах + AI-агент. Вызываете launcher горячей клавишей и делаете всё, не отрываясь от клавиатуры:
• Запуск приложений и поиск файлов — мгновенно
• Буфер обмена с историей (наконец-то можно вернуться к тому, что скопировали час назад)
• Калькулятор прямо в строке поиска
• Управление окнами — 58 вариантов раскладки
• Интеграции с GitHub, календарем, Spotify
• AI для поиска, генерации текста, перевода
• Можно подключить локальные модели
Вся фишка в скорости — интерфейс откликается за миллисекунды, 99.8% стабильности. Плюс огромный каталог расширений: от поиска GIF до мониторинга CI/CD.
Был macOS-эксклюзивом годами, теперь доступен всем. Если работаете с кодом, это seriously меняет workflow.
🔗 raycast.com
🔗 Windows версия
@ai_for_dev
Если вы завидовали макбучникам с их Raycast — ждать больше не нужно. Бета для Windows уже доступна.
Что это такое? Представьте Alfred/Spotlight на стероидах + AI-агент. Вызываете launcher горячей клавишей и делаете всё, не отрываясь от клавиатуры:
• Запуск приложений и поиск файлов — мгновенно
• Буфер обмена с историей (наконец-то можно вернуться к тому, что скопировали час назад)
• Калькулятор прямо в строке поиска
• Управление окнами — 58 вариантов раскладки
• Интеграции с GitHub, календарем, Spotify
• AI для поиска, генерации текста, перевода
• Можно подключить локальные модели
Вся фишка в скорости — интерфейс откликается за миллисекунды, 99.8% стабильности. Плюс огромный каталог расширений: от поиска GIF до мониторинга CI/CD.
Был macOS-эксклюзивом годами, теперь доступен всем. Если работаете с кодом, это seriously меняет workflow.
🔗 raycast.com
🔗 Windows версия
@ai_for_dev
👏1
Spotify слили — и это интересно
Ребята из Annas Archive забэкапили весь Spotify. Да, все 300TB музыки. Но для нас, как разработчиков, самое вкусное — это не сами треки.
🎵 Что там есть:
— 86 млн треков (это 99.6% от всех прослушиваний)
— Метаданные по всем 256 миллионам треков — архив на ~4TB
— Обложки альбомов отдельным торрентом на 2.2TB
По сути — готовый датасет для анализа одного из крупнейших сервисов в мире. Уже накопали, что 70% треков имеют меньше 1000 прослушиваний.
Кто давно хотел покопаться в данных музыкальной индустрии — вот ваш шанс.
Блог с деталями: https://annas-archive.li/blog/backing-up-spotify.html
@ai_for_dev
Ребята из Annas Archive забэкапили весь Spotify. Да, все 300TB музыки. Но для нас, как разработчиков, самое вкусное — это не сами треки.
🎵 Что там есть:
— 86 млн треков (это 99.6% от всех прослушиваний)
— Метаданные по всем 256 миллионам треков — архив на ~4TB
— Обложки альбомов отдельным торрентом на 2.2TB
По сути — готовый датасет для анализа одного из крупнейших сервисов в мире. Уже накопали, что 70% треков имеют меньше 1000 прослушиваний.
Кто давно хотел покопаться в данных музыкальной индустрии — вот ваш шанс.
Блог с деталями: https://annas-archive.li/blog/backing-up-spotify.html
@ai_for_dev
🔥1😁1
Anthropic сделали подарок на праздники — удвоили все лимиты в платных тарифах Claude 🎁
Если у вас Pro или Team подписка, можно гонять запросы в два раза активнее. Временная акция, но приятно.
https://x.com/claudeai/status/2003918730833608902
@ai_for_dev
Если у вас Pro или Team подписка, можно гонять запросы в два раза активнее. Временная акция, но приятно.
https://x.com/claudeai/status/2003918730833608902
@ai_for_dev
X (formerly Twitter)
Claude (@claudeai) on X
Starting at midnight PT tonight, all Pro and Max plans have 2x their usual usage limits through New Year's Eve.
🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
AppAlchemy — AI-сервис для генерации UI мобильных приложений
Платформа позволяет создавать дизайн интерфейсов через текстовые запросы. Основные возможности:
• Генерация UI по текстовому описанию
• Итеративная доработка через чат
• Создание дизайна на основе скриншотов существующих приложений
• Клонирование из готовых шаблонов
Сервис ориентирован на быстрое прототипирование и создание MVP для демонстрации инвесторам. Согласно отзывам, инструмент помогает lean-стартапам экономить на разработке на этапе тестирования гипотез.
Технология находится в версии V2. Доступ к сервису: https://appalchemy.ai/
@ai_for_dev
Платформа позволяет создавать дизайн интерфейсов через текстовые запросы. Основные возможности:
• Генерация UI по текстовому описанию
• Итеративная доработка через чат
• Создание дизайна на основе скриншотов существующих приложений
• Клонирование из готовых шаблонов
Сервис ориентирован на быстрое прототипирование и создание MVP для демонстрации инвесторам. Согласно отзывам, инструмент помогает lean-стартапам экономить на разработке на этапе тестирования гипотез.
Технология находится в версии V2. Доступ к сервису: https://appalchemy.ai/
@ai_for_dev
🤯1
CheatSheets.zip — когда нужно вспомнить синтаксис за 30 секунд 🔍
Открытая библиотека шпаргалок, которую собирает dev-комьюнити. Вместо того чтобы гуглить "python list comprehension syntax" в сотый раз, просто открываешь CheatSheets.zip и находишь готовый ответ.
Что внутри:
- Для кодеров: Rust, Python, Go, C++, Java, Bash
- Для геймдевов: Unity, Unreal Engine
- Для всех остальных: Blender, Figma, Photoshop, Audacity
- Бонусом: промпты для ChatGPT и shortcuts для повседневных тулов (Telegram, Zoom, Gmail)
Всё бесплатно, всё от комьюнити. Добавляйте в закладки, пригодится.
@ai_for_dev
Открытая библиотека шпаргалок, которую собирает dev-комьюнити. Вместо того чтобы гуглить "python list comprehension syntax" в сотый раз, просто открываешь CheatSheets.zip и находишь готовый ответ.
Что внутри:
- Для кодеров: Rust, Python, Go, C++, Java, Bash
- Для геймдевов: Unity, Unreal Engine
- Для всех остальных: Blender, Figma, Photoshop, Audacity
- Бонусом: промпты для ChatGPT и shortcuts для повседневных тулов (Telegram, Zoom, Gmail)
Всё бесплатно, всё от комьюнити. Добавляйте в закладки, пригодится.
@ai_for_dev
😱1
📡 WiFi-роутер как рентген: трекинг людей сквозь стены
Вышла WiFi DensePose — библиотека для определения позы человека через WiFi без всяких камер. Работает на анализе Channel State Information от обычного роутера.
Что умеет:
- Реал-тайм отслеживание до 10 человек одновременно
- Задержка меньше 50ms, 30 FPS
- REST API + WebSocket для стриминга
- Детекция падений, распознавание активности
- Готовые Docker-образы
Установка через pip, работает с обычными роутерами. Идеально для IoT, умного дома, фитнес-трекинга — везде, где нужна приватность без камер.
Покрытие тестами 100%, продакшен-ready. Интересный кейс применения CSI-данных в ML.
@ai_for_dev
Вышла WiFi DensePose — библиотека для определения позы человека через WiFi без всяких камер. Работает на анализе Channel State Information от обычного роутера.
Что умеет:
- Реал-тайм отслеживание до 10 человек одновременно
- Задержка меньше 50ms, 30 FPS
- REST API + WebSocket для стриминга
- Детекция падений, распознавание активности
- Готовые Docker-образы
Установка через pip, работает с обычными роутерами. Идеально для IoT, умного дома, фитнес-трекинга — везде, где нужна приватность без камер.
Покрытие тестами 100%, продакшен-ready. Интересный кейс применения CSI-данных в ML.
@ai_for_dev
GitHub
GitHub - ruvnet/wifi-densepose: Production-ready implementation of InvisPose - a revolutionary WiFi-based dense human pose estimation…
Production-ready implementation of InvisPose - a revolutionary WiFi-based dense human pose estimation system that enables real-time full-body tracking through walls using commodity mesh routers - ...
❤1🤬1
Появился SkillsMP — маркетплейс скиллов для Claude Code, Codex и ChatGPT 😮
38,000+ готовых навыков в одном месте. Работает на открытом стандарте SKILL.md, все с поиском, категориями и метриками качества.
Что внутри:
• 12K+ скиллов для тулинга
• 12K+ для разработки
• 7K+ для Data & AI
• 5K+ DevOps-автоматизации
• 4K+ для тестирования и секьюрити
Вместо того чтобы искать нужный скилл среди тысяч GitHub-репо, теперь можно просто использовать AI-поиск и категории. Все навыки совместимы с популярными coding assistants из коробки.
Уже есть интеграция с Deep Agent CLI через команду
@ai_for_dev
38,000+ готовых навыков в одном месте. Работает на открытом стандарте SKILL.md, все с поиском, категориями и метриками качества.
Что внутри:
• 12K+ скиллов для тулинга
• 12K+ для разработки
• 7K+ для Data & AI
• 5K+ DevOps-автоматизации
• 4K+ для тестирования и секьюрити
Вместо того чтобы искать нужный скилл среди тысяч GitHub-репо, теперь можно просто использовать AI-поиск и категории. Все навыки совместимы с популярными coding assistants из коробки.
Уже есть интеграция с Deep Agent CLI через команду
skills --list. Удобно для быстрого расширения возможностей вашего AI-помощника.@ai_for_dev
😢1
Google выпустил крошечную модель для создания AI-агентов
FunctionGemma-LMStudio.ipynb) — это 270M параметров, заточенных под одну задачу: научить модель работать с инструментами. Не чат-бот, а заготовка под агента, который умеет дёргать API.
Ключевая фишка — размер. Модель влезает куда угодно: телефон, ноутбук, сервер. Запускаешь локально через LM Studio, обучаешь через Unsloth (они ускорили LoRA-обучение и сжали потребление VRAM).
Как попробовать:
• Открываешь готовый Colab-шаблон
• Обучаешь модель (10 минут для теста, час для норм результата)
• Конвертишь в GGUF
• Импортишь в LM Studio:
• Поднимаешь локальное API:
Результат — модель начинает понимать, когда нужно вызвать функцию, и корректно это делает. До обучения — полный отказ, после — работает.
Подходит для экспериментов с агентами без зависимости от облачных API.
@ai_for_dev
FunctionGemma-LMStudio.ipynb) — это 270M параметров, заточенных под одну задачу: научить модель работать с инструментами. Не чат-бот, а заготовка под агента, который умеет дёргать API.
Ключевая фишка — размер. Модель влезает куда угодно: телефон, ноутбук, сервер. Запускаешь локально через LM Studio, обучаешь через Unsloth (они ускорили LoRA-обучение и сжали потребление VRAM).
Как попробовать:
• Открываешь готовый Colab-шаблон
• Обучаешь модель (10 минут для теста, час для норм результата)
• Конвертишь в GGUF
• Импортишь в LM Studio:
lms import model.gguf• Поднимаешь локальное API:
lms server startРезультат — модель начинает понимать, когда нужно вызвать функцию, и корректно это делает. До обучения — полный отказ, после — работает.
Подходит для экспериментов с агентами без зависимости от облачных API.
@ai_for_dev
❤1🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
Один разработчик клонировал TypeForm за 35 минут с помощью Claude
Nader Dabit решил проверить, на что способен Claude Opus 4.5: скормил ему задачу склонировать TypeForm — популярный SaaS за миллиард долларов.
Итог: OpenForm — полнофункциональная копия, которая:
✨ Работает из коробки
✨ Стоит в ~100 раз дешевле оригинала
✨ Разворачивается за 15 минут
✨ Полностью open-source
Агент справился за ~35 минут. Без шуток.
💡 Что это значит:
Человек почти без технических навыков теперь может создать продукт, на который раньше нужна была команда из десятка инженеров и пара лет работы. Код доступен, можно посмотреть, как именно Claude это сделал.
Мир меняется быстрее, чем мы успеваем привыкнуть.
@ai_for_dev
Nader Dabit решил проверить, на что способен Claude Opus 4.5: скормил ему задачу склонировать TypeForm — популярный SaaS за миллиард долларов.
Итог: OpenForm — полнофункциональная копия, которая:
✨ Работает из коробки
✨ Стоит в ~100 раз дешевле оригинала
✨ Разворачивается за 15 минут
✨ Полностью open-source
Агент справился за ~35 минут. Без шуток.
💡 Что это значит:
Человек почти без технических навыков теперь может создать продукт, на который раньше нужна была команда из десятка инженеров и пара лет работы. Код доступен, можно посмотреть, как именно Claude это сделал.
Мир меняется быстрее, чем мы успеваем привыкнуть.
@ai_for_dev
🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Hugging Face собрали 400 000 бесплатных AI-моделей в одном месте 🔥
Spaces — это как App Store для нейросетей. Захотел протестить модель для генерации кода, OCR или video synthesis? Открываешь браузер, выбираешь приложение и сразу пробуешь.
Никаких pip install, CUDA setup или "works on my machine". Всё работает в облаке, ничего качать не нужно.
Особенно удобно:
• Сравнить несколько моделей для одной задачи
• Показать заказчику прототип без деплоя
• Найти готовое решение вместо написания с нуля
Большинство Space'ов с открытым кодом — можно форкнуть и допилить под себя.
@ai_for_dev
Spaces — это как App Store для нейросетей. Захотел протестить модель для генерации кода, OCR или video synthesis? Открываешь браузер, выбираешь приложение и сразу пробуешь.
Никаких pip install, CUDA setup или "works on my machine". Всё работает в облаке, ничего качать не нужно.
Особенно удобно:
• Сравнить несколько моделей для одной задачи
• Показать заказчику прототип без деплоя
• Найти готовое решение вместо написания с нуля
Большинство Space'ов с открытым кодом — можно форкнуть и допилить под себя.
@ai_for_dev
🤮1
Лайфхак от Google: дублируй промпт — получи +67% к качеству
Исследователи Google нашли странный, но работающий трюк: отправь промпт дважды подряд
Проверили на Gemini, GPT, Claude, DeepSeek — работает везде.
Почему так получилось?
LLM читают слева направо, и токены в начале промпта не видят, что будет дальше. Когда ты повторяешь промпт, модель "дочитывает" контекст дважды и начинает лучше понимать задачу.
Где НЕ работает:
Reasoning-модели (o1, o3) и так внутри себя "переспрашивают" — им дубль не нужен.
Где пригодится:
Классификация, парсинг данных, кодген по ТЗ. Если модель отвечает поверхностно — просто скопируй промпт в начало.
📄 Полная статья
@ai_for_dev
Исследователи Google нашли странный, но работающий трюк: отправь промпт дважды подряд
<prompt><prompt> — и в 67% случаев ответ будет лучше. Без лишних токенов, без задержек.Проверили на Gemini, GPT, Claude, DeepSeek — работает везде.
Почему так получилось?
LLM читают слева направо, и токены в начале промпта не видят, что будет дальше. Когда ты повторяешь промпт, модель "дочитывает" контекст дважды и начинает лучше понимать задачу.
Где НЕ работает:
Reasoning-модели (o1, o3) и так внутри себя "переспрашивают" — им дубль не нужен.
Где пригодится:
Классификация, парсинг данных, кодген по ТЗ. Если модель отвечает поверхностно — просто скопируй промпт в начало.
📄 Полная статья
@ai_for_dev
🙏1
GPT-5.2 в Copilot — новый уровень для разработчиков
Microsoft обновила Copilot, добавив туда свеженькую GPT-5.2 от OpenAI. Модель доступна в режиме Smart Plus (рядом с GPT-5.1 в режиме Smart) во всех версиях — веб, Windows, мобилки.
Что умеет для девелоперов:
✨ Пишет и ревьюит код
✨ Разбирается в длинных доках и спецификациях
✨ Генерит таблицы и презентации
✨ Работает с изображениями
Интересная деталь: OpenAI создала новую метрику GDPval, которая тестирует модель на реальных задачах из 44 профессий. GPT-5.2 Thinking показывает результат на уровне профессионалов в 70.9% случаев — это почти вдвое лучше, чем у предыдущей версии (38.8%).
По оценке OpenAI, для большинства офисных задач модель уже достигла экспертного уровня. Особенно хорошо справляется с четко определенными заданиями.
Детали тут
@ai_for_dev
Microsoft обновила Copilot, добавив туда свеженькую GPT-5.2 от OpenAI. Модель доступна в режиме Smart Plus (рядом с GPT-5.1 в режиме Smart) во всех версиях — веб, Windows, мобилки.
Что умеет для девелоперов:
✨ Пишет и ревьюит код
✨ Разбирается в длинных доках и спецификациях
✨ Генерит таблицы и презентации
✨ Работает с изображениями
Интересная деталь: OpenAI создала новую метрику GDPval, которая тестирует модель на реальных задачах из 44 профессий. GPT-5.2 Thinking показывает результат на уровне профессионалов в 70.9% случаев — это почти вдвое лучше, чем у предыдущей версии (38.8%).
По оценке OpenAI, для большинства офисных задач модель уже достигла экспертного уровня. Особенно хорошо справляется с четко определенными заданиями.
Детали тут
@ai_for_dev
🕊1
Alibaba выпустила MAI-UI — GUI-агенты нового поколения
Alibaba Tongyi открыла MAI-UI — семейство моделей для GUI-агентов от 2B до 235B параметров. Причём подход к обучению здесь действительно интересный.
Что внутри:
🔄 Self-evolving pipeline — модель сама расширяет обучающие данные через нативное взаимодействие с пользователем, вызовы инструментов по MCP и работу в реальных динамических окружениях.
☁️ Гибридная архитектура — система сама решает, выполнять задачу локально или в облаке. На выходе: производительность на устройстве +33%, облачных вызовов -40%.
🎯 SOTA в практических задачах: GUI Grounding (точное определение элементов UI), навигация по мобильным приложениям, обучение с подкреплением в реальном времени.
Модель решает четыре критичные проблемы GUI-агентов: отсутствие нативного взаимодействия с пользователем, ограничения UI-only подходов, сложность развертывания и хрупкость в динамических условиях.
Обучена через Online RL с оптимизациями для параллельных окружений и длинного контекста.
Куда применять: UI-автоматизация, тестирование, AI-ассистенты для навигации, агентные системы.
@ai_for_dev
Alibaba Tongyi открыла MAI-UI — семейство моделей для GUI-агентов от 2B до 235B параметров. Причём подход к обучению здесь действительно интересный.
Что внутри:
🔄 Self-evolving pipeline — модель сама расширяет обучающие данные через нативное взаимодействие с пользователем, вызовы инструментов по MCP и работу в реальных динамических окружениях.
☁️ Гибридная архитектура — система сама решает, выполнять задачу локально или в облаке. На выходе: производительность на устройстве +33%, облачных вызовов -40%.
🎯 SOTA в практических задачах: GUI Grounding (точное определение элементов UI), навигация по мобильным приложениям, обучение с подкреплением в реальном времени.
Модель решает четыре критичные проблемы GUI-агентов: отсутствие нативного взаимодействия с пользователем, ограничения UI-only подходов, сложность развертывания и хрупкость в динамических условиях.
Обучена через Online RL с оптимизациями для параллельных окружений и длинного контекста.
Куда применять: UI-автоматизация, тестирование, AI-ассистенты для навигации, агентные системы.
@ai_for_dev
👍1🤡1
Salesforce сворачивает LLM в бизнес-приложениях — что пошло не так
Salesforce признала: большие языковые модели оказались слишком непредсказуемыми для корпоративных продуктов 😬
Что не зашло в проде:
• Модели теряют контекст по ходу диалога
• Игнорируют инструкции или делают что-то странное
• Для критичных бизнес-процессов это неприемлемо
Компания планировала автоматизировать рутину через гибкие AI-решения. Реальность оказалась жестче — нестабильность моделей убивала UX и надежность систем.
Что делают теперь:
Отказываются от креативных возможностей LLM в пользу жестких сценариев. Никакой генерации текста с элементами творчества — только заранее определенные правила и логика.
Полезный инсайт для тех, кто думает встроить LLM в критичные системы. Иногда старые добрые rule-based подходы надежнее модных AI-агентов 🤷
@ai_for_dev
Salesforce признала: большие языковые модели оказались слишком непредсказуемыми для корпоративных продуктов 😬
Что не зашло в проде:
• Модели теряют контекст по ходу диалога
• Игнорируют инструкции или делают что-то странное
• Для критичных бизнес-процессов это неприемлемо
Компания планировала автоматизировать рутину через гибкие AI-решения. Реальность оказалась жестче — нестабильность моделей убивала UX и надежность систем.
Что делают теперь:
Отказываются от креативных возможностей LLM в пользу жестких сценариев. Никакой генерации текста с элементами творчества — только заранее определенные правила и логика.
Полезный инсайт для тех, кто думает встроить LLM в критичные системы. Иногда старые добрые rule-based подходы надежнее модных AI-агентов 🤷
@ai_for_dev
🥱1