Чернов пишет – Telegram
Чернов пишет
1.36K subscribers
807 photos
43 videos
168 files
1.01K links
Эй ай и вот это вот всё. Qlik
https://chernovdev.ru/
https://vkvideo.ru/@chernovdev
Download Telegram
🤖 Cursor провели кодовый марафон среди AI-агентов на недели и получили миллионы строк кода среднего качества

Cursor провёл эксперимент: можно ли масштабировать длительное автономное программирование, просто добавляя больше агентов? Оказалось — да, но с оговорками.

Что удалось навайбкодить в ходе эксперимента:
- Веб-браузер с нуля — 1М+ строк кода за ~неделю
- Миграция Cursor с Solid на React, - агенты работали 3 недели, +266K строк добавлено, удалено 193K.
- Эмулятор Windows 7 — 14.6K коммитов, 1.2М строк (в процессе)
- Клон Excel — 12K коммитов, 1.6М строк (в процессе)

Плоская структура с равнозначными агентами провалилась, - 20 агентов работали как 2-3, остальные ждали разблокировки очереди.

Без иерархии агенты избегали сложных задач и делали только безопасные мелкие правки.
Когда у общества нет цветовой дифференциации штанов, то нет цели! А когда нет цели — нет будущего!


Решение — разделение ролей:
- Планировщики — исследуют код, создают задачи, могут порождать суб-планировщиков
- Воркеры, - пилят свою задачу до конца, потом пушат в репу
- Судьи, - решают, продолжать или повторять цикл

Главный инсайт по моделям:
Codex
отменяем. GPT-5.2 оказался значительно лучше для длительной автономной работы,- лучше держит фокус, точнее следует инструкциям, не дрейфует.
Opus 4.5 склонен останавливаться раньше и срезать углы, быстро возвращая управление человеку.

Интересно, что GPT-5.2 оказался лучшим планировщиком, чем GPT-5.1-codex, хотя последний специально обучен написанию кода.

Вайб-косяки:
На Hacker News заметили — браузер не компилируется у внешних пользователей, CI не проходит.
PR миграции Solid→React назвали «невозможным для ревью». Код описывают как «крайне хрупкий».

Ключевые выводы Cursor:
- Промпты важнее архитектуры и выбора модели
- Упрощение системы часто давало лучшие результаты
- Периодические «свежие старты» обязательны чтобы не сваливаться в дрейф
- Под разные роли лучше использовать разные модели

#Cursor #агенты #GPT #Opus #AgenticCoding
———
@tsingular
🔥4
Опять про зайку
Немного математики - если вы еще думаете,
Я конечно не настаиваю, но по моей реф ссылке получите скидку дополнительную 10%

https://z.ai/subscribe?ic=LHVANAIHDE

Смотрим:
• я за 6 дней сжег 280 млн токенов, у меня годовой тариф за 288 баксов, условно я сейчас в диапазоне 1 бакс за 1 млн токенов
• зайка дает вам на max-тарифе примерно 2400 запросов на 5 часов и счетчик обнуляется
• вы можете писать код со скоростью - 8 запросов в минуту!
• у зайки почти все модели могут работать потоками, glm47 можно сейчас запускать в 3 "окна" одновременно!
• у вас куча других моделей у которых тоже есть свои потоки
• если строите агентскую систему - выдавайте разным моделям разные роли и пилим пайплан нон-стоп разработки
• есть 10 потоков для распознавания изображений! glm46v
• сейчас код пишет на уровне gpt52/sonet45
• ожидаем в феврале модель glm50 - которая должна стать еще сильнее


@chernovdev
🔥2
Конец эпохи ручного труда: как Vibe Coding переписывает DNS индустрии

Разрыв между идеей и рабочим продуктом исчезает. ИИ перестал быть просто калькулятором кода, превратившись в полноценного "со-разработчика". Однако за фасадом простоты скрывается новый уровень сложности, доступный лишь тем, кто понимает механику происходящего.

Вот 5 инсайтов из недр r/vibecoding и Hacker News:

1. Программирование на интуиции
Концепция vibe-coding на r/vibecoding ставит во главу угла не синтаксис, а намерение. Вы описываете "вайб" желаемого фичи, а AI agents через цепочки sub-agent команд сами генерируют app. Скилл сеньора теперь — это умение говорить с машиной, а не писать code.

2. Автономность Claude-code и Cursor
Инструменты вроде claude-code используют рекурсивный цикл: ИИ пишет код, тестирует его, ловит bug и патчит сам. Ваша задача — только review итогового результата. Это качественный скачок в automation разработки.

3. Разрыв между генерацией и инфраструктурой
Пока r/vibecoding учится瞬间 создавать webapp, r/devops напоминает о суровой реальности. Kubernetes и CI/CD не прощают халатности. Сгенерированный код нужно развернуть. Без глубоких знаний infrastructure ваш "вайб" не взлетит.

4. Экономика Indie-hacker
Скорость ship стала критическим фактором. Solo-founder использует prompt инженерию для выпуска project за один вечер. Те, кто игнорирует LLM в стэке, выбывают из гонки за revenue.

5. Проблема безопасности
Массовое использование generative кода рождает новые уязвимости. Security сообщество на Hacker News бьет тревогу: агенты могут вшить backdoor в open-source библиотеку. Доверяй, но проверяй. Vibe coding не отменяет ответственность.

Вердикт: Инженер будущего не тот, кто помнит все методы API, а тот, кто умеет оркестрировать AI. Прием?

Источник
@chernovdev
2
Запись экрана 2026-01-17 в 23.56.32.mov
3.5 MB
Очень и очень годное решение для многих вопросов - https://github.com/vakovalskii/LocalDesk

• впихнул туда работу через зайку
• прикрутил веб-поиск зайки
• прикрутил читалку страниц от зайки

Работает!

p.s. все правка исходного проекта у меня сделаны локально без пуша в гит
p.p.s. допиливал эту штуку прямо внутри ее же чата )
🔥2
Чернов пишет
Кинул pr с доработками для зайки https://github.com/vakovalskii/LocalDesk/pull/1
В общем как эта штука работает)))
Новая фича - рендеринг таблиц из markdown в нормальные таблицы в аутпуте
🔥31
This media is not supported in your browser
VIEW IN TELEGRAM
EIGent — open-source ответ на Anthropic Cowork

Давным-давно, аж 12 января (в начале недели) Anthropic выкатил Cowork, если кто забыл :).

Много чего интересного за эту неделю произошло, но этот кейс еще не обсуждали тут.

EIGent, стартап со схожим функционалом, решил не конкурировать на одной поляне и в середине недели выложил весь свой проект в open-source.

Умеет, в принципе, всё то же самое, что и Cowork:
Мультиагентная архитектура,- несколько специализированных агентов работают параллельно:
- Developer Agent — код, терминал
- Search Agent — веб-поиск
- Document Agent — документы
- Multi-Modal Agent — изображения, аудио

Ключевые фичи:
- 100% open-source (лицензия на базе Apache 2.0)
- Локальное развертывание — данные остаются у вас
- Поддержка кастомных моделей (включая локальные)
- MCP интеграция (browser, terminal, Notion, Slack и т.д.)
- Human-in-the-loop — агент запрашивает подтверждение у человека, если что не понятно
- Desktop-приложение (Electron) + web

Стек: FastAPI + React/TypeScript, построен на фреймворке CAMEL-AI.

Типовые сценарии:
- Планирование поездки с поиском, бронированием и отправкой итога в Slack
- Анализ банковских выписок → HTML-отчёт с графиками
- SEO-аудит сайта
- Поиск дубликатов в папках

Но самое вкусное, - дальше Z.ai поддержал проект
Предоставили интеграцию с GLM Coding Plan — можно использовать китайские модели GLM-4.5/4.7 через их API.
Инструкция в документации.

#EIgent #Cowork #ZAI #агенты #OSS
———
@tsingular
11
Чуток прокачал софтину https://github.com/vakovalskii/LocalDesk

Вот теперь я понимаю как нужно токены сжигать )))

• Изменил кнопку "+ New Chat" на "+ New Task"
• Изменил размер кнопки настроек
• Переработал расположение кнопок в сайдбаре
• Сделал todo-задачи привязанными к конкретным сессиям для изоляции между разными чатами
• Обновил функции управления todo для работы с sessionId
• Добавил логирование с идентификаторами сессий
• Реализовал систему много-поточных задач с двумя режимами: консенсус (одинаковые модели) и разные задачи (разные модели)
• Добавил отслеживание изменений файлов через интеграцию с git
• Создал веб-кеш для шаринга результатов между потоками
• Добавил возможности отмены изменений через git checkout
• Реализовал детекцию изменений с подсчётом добавленных и удалённых строк
• Добавил новые UI-компоненты для управления много-поточными задачами и просмотра изменений
• Реализовал проверку орфографии в Electron
• Добавил отображение токенов в сайдбаре и фильтрацию сессий
🔥62
LocalDesk 0.0.6 — Полный контроль без API-ключей

Йоу! Неделя выдалась жаркой

70+ коммитов, первые серьезные контрибьюторы и куча киллер-фич которые меняют правила игры

Что произошло

Пока я чинил баги с Telegram парсингом и TodoPanel, @abhaymundhara https://github.com/abhaymundhara принёс подарок 25 новых тулов без API-ключей
А @ChernovDev https://news.1rj.ru/str/ChernovDev вообще красавчик допиливал софтину прямо внутри её же чата через Z.AI
Его вклад: интеграция Z.AI (reader + web search), рендеринг markdown таблиц, session-based todos, много-поточные задачи, отслеживание изменений через git, spell check, UI улучшения
Это именно то как должен развиваться опенсорс ребята приходят и делают то на что у тебя руки не дошли

Новые тулы

DuckDuckGo Search 3 тула для поиска без API ключей: search, search_news, search_images
Browser Automation 11 тулов: navigate, click, type, select, hover, scroll, press_key, wait_for, snapshot, screenshot, execute_noscript
Git Integration 11 тулов: status, log, diff, show, branch, checkout, add, commit, push, pull, reset
HTTP/Fetch 4 тула: fetch, fetch_json, download, fetch_html

Tool Groups включай только нужное
Все новые тулы по умолчанию выключены, в Settings появилась секция Tool Groups
Зачем? Меньше тулов в контексте = модель лучше выбирает нужный, экономия токенов, меньше галлюцинаций
Базовых тулов 14: файловые операции, execute_js, render_page, manage_todos, search_web

Tool Name Pattern
Проанализировал 4 топ кодовых агента (Cursor/Codex/Kilo/OpenCode), скормил опусу, пришел к паттерну именования
Название = Действие + Объект + Уточнение
Примеры: read_file, write_file, search_text, execute_js, manage_todos
Такой подход кратно увеличил качество выполнения тестов на qwen3-4b-instruct-2507

Комментарий от @silent_ai_cto: в структурном анализе бизнес функция всегда глагол или глагольный оборот "Подписать договор", "Проконтролировать качество"

Мои фиксы
Telegram: посты берутся с новейших, пофиксил fallthrough баг
Todos: не теряются между сессиями, dynamic system prompt — отключенные тулы скрыты от модели
Core: MIT лицензия, request timeout 5 минут, loop detector, broadcast статусов
Репо: https://github.com/vakovalskii/LocalDesk

Поиск без API-ключей для локального запуска, теперь можно поднять агента имея только vLLM/Ollama, ноль внешних зависимостей

Ставьте звёзды на репо если зашло!

(Скрины сервиса https://news.1rj.ru/str/neuraldeepchat/33421)


Just For Fun!
2🏆1