Вайб-кодинг – Telegram
Вайб-кодинг
13.6K subscribers
1.46K photos
474 videos
30 files
632 links
Авторский канал по ВАЙБ КОДИНГУ

Ссылка для друзей: https://news.1rj.ru/str/+ll3pbl442dNkZmYy

Связь: @devmangx
По контенту: @codingpepe

РКН: https://clck.ru/3RRVfk
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи собрали новый подход к RAG, который:

* не требует vector DB
* не делает эмбеддинги
* не режет документы на чанки
* не выполняет similarity search

И он показал 98,7% точности на финансовом бенчмарке (SOTA).

Вот какую ключевую проблему классического RAG этот подход решает:

Обычный RAG режет документы на чанки, превращает их в векторы и достает фрагменты по семантической похожести.

Но похожесть ≠ релевантность.

Когда ты спрашиваешь: "Какие были тренды по долгу в 2023?", векторный поиск вернет куски, которые семантически похожи на запрос.

А реальный ответ может быть спрятан где-нибудь в Appendix, упомянут ссылкой на другой странице, в разделе, который вообще не пересекается по смысловым словам с твоим вопросом.

Классический RAG, скорее всего, это просто не найдет.

PageIndex это закрывает.

Вместо чанкинга и эмбеддингов PageIndex строит иерархическое дерево структуры документа, по сути умную "таблицу содержания".

А дальше модель рассуждением проходит по этому дереву.

То есть она не спрашивает: "Какой текст больше всего похож на мой запрос?"

Она спрашивает: "Судя по структуре документа, где бы человек-эксперт искал ответ?"

Это принципиально другой подход, у которого:

* нет произвольного чанкинга, который рвет контекст
* не нужно тащить и обслуживать vector DB
* retrieval трассируемый: видно, почему выбрали конкретный раздел
* можно нормально ходить по внутренним ссылкам документа ("см. Table 5.3"), как делает человек

Но глубже проблема вот в чем.

Векторный поиск воспринимает каждый запрос как независимый.

А документы имеют структуру и логику: разделы ссылаются друг на друга, контекст накапливается по страницам.

PageIndex уважает эту структуру, вместо того чтобы сплющивать все в эмбеддинги.

При этом важно: такой подход не везде имеет смысл, потому что классический vector search все еще быстрый, простой и отлично работает во многих кейсах.

Но для проф-документов, где нужна доменная экспертиза и многошаговые рассуждения, tree-based, reasoning-first подход реально раскрывается.

Например, PageIndex показал 98,7% точности на FinanceBench и заметно обогнал традиционные vector-based RAG системы в разборе сложных финансовых документов.

Все полностью в oпенсорс, можно посмотреть реализацию на GitHub и попробовать самому.
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь ты можешь делать анимации через промпт 🐱

Залетел новый скилл для генерации анимаций на Manim, примерно в духе 3Blue1Brown.

Ставится одной командой: npx skills add adithya-s-k/manim_skill. Дальше просто описываешь сцену текстом и получаешь готовую анимацию. Поддерживает ManimCE и ManimGL.

PS: пока в разработке, но в планах докрутить “director/composer”, чтобы он сам собирал сценарий и делал объясняющие видосы end-to-end. Проект опенсорсный, автор старается держать лицензии в порядке, если что можно писать в DM.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Вайб-кодинг
Представь: ты запускаешь “новую катку”, только вместо юнитов у тебя агенты. Автор с ником Ido Salomon выкатил тизер AgentCraft: оркестрация AI-агентов через интерфейс в стиле RTS. Типа StarCraft/Warcraft, но вместо “строим барак” ты запускаешь таски, спавнишь…
This media is not supported in your browser
VIEW IN TELEGRAM
AgentCraft получил апдейт: теперь это больше похоже на панель управления для пачки агентов.

По каждому агенту появляются рекомендации, можно быстро понять что происходит, на что стоит реагировать прямо сейчас, и переключаться без лишних кликов.

Первые инвайты начнут раздавать уже в эти выходные. Промт-промт! 😆
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Кто-то навайбкодил весь Нью-Йорк в интерактивный изометрический пиксельный мир 👍

Это сделано на реальных городских данных, которые потом превратили в маленький, “игровой” городок с помощью AI-инструментов и кода. Улицы, здания и районы совпадают с реальностью, но по ощущениям это скорее игра, чем карта.

Автор взял open map data, AI-кодинг-агентов и image-модели, и всё это завернул в гладкий веб-экспириенс, где можно панорамировать и исследовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
“Рим не за один день построили”.

Просто у них не было Claude Code.
4
This media is not supported in your browser
VIEW IN TELEGRAM
ollama launch это новая команда в Ollama 0.15, которая позволяет запускать Claude Code, Codex, Droid и OpenCode прямо через Ollama

GLM 4.7 Flash теперь оптимизировали так, чтобы он ел заметно меньше памяти на длинных контекстах (64k+).

Нужно больше железа? В облаке Ollama есть GLM 4.7 с полной точностью и нужной длиной контекста.

Старт здесь 😋
Please open Telegram to view this post
VIEW IN TELEGRAM
Добавь этот абзац в файл CLAUDE.md, чтобы превратить Claude Code в Claude Teacher. Каждый проект это урок, чтобы становиться более технически подкованным. 🙂

"For every project, write a detailed FOR[yourname].md file that explains the whole project in plain language. 

Explain the technical architecture, the structure of the codebase and how the various parts are connected, the technologies used, why we made these technical decisions, and lessons I can learn from it (this should include the bugs we ran into and how we fixed them, potential pitfalls and how to avoid them in the future, new technologies used, how good engineers think and work, best practices, etc).

It should be very engaging to read; don't make it sound like boring technical documentation/textbook. Where appropriate, use analogies and anecdotes to make it more understandable and memorable."
Please open Telegram to view this post
VIEW IN TELEGRAM
Опытные пользователи Claude Code, вам стоит это увидеть.

Есть публичный репозиторий, который по сути как полноценная ОС для Claude Code: агенты, skills, hooks, команды, правила, конфиги MCP, всё уже связали и можно просто подключать.

Можешь просто посмотреть (или забрать себе) целиком. Это мнение автора, которое уже обкатали на реальных проектах.
1
POV: январь 2026 года
4
Теперь хуки могут работать в фоновом режим, не блокируя выполнение Claude Code. Просто добавь async: true в конфиг хука.

Отлично подходит для логов, уведомлений и любых сайд-эффектов, которые не должны тормозить основной процесс.
Я сейчас поставил Clawdbot, про который сейчас очень много говорят. Первое впечатление: впервые почувствовал, что передо мной настоящий персональный ассистент. Опенсорсный и бесплатный.

Ставится очень просто, можно установить на сервер или на свой комп. (это не рекомендация к установке 😄)

▪️Может получить доступ ко всему на твоем компьютере и везде
▪️Я тестил с Claude Opus. Он каждый раз отправляет целиком весь .md файл, из-за этого токены улетают в космос. Перешел на Minimax
▪️Собирает информацию обо мне и складывает ее в отдельный .md файл
▪️Общаться можно через Telegram, WhatsApp, iMessage и его собственный интерфейс. В Telegram у меня сначала не отвечал, он сам посмотрел логи и починил проблему
▪️Попросил его кое-что сделать. Он сказал: “Дай Brave Search API и я смогу искать”. Я получил ключ и дал ему, он сам все подключил, мне не пришлось вручную где-то что-то добавлять
▪️ Может работать проактивно, например прислать уведомление, если пришло важное письмо
▪️ Идет с кучей готовых skills

Кстати про skills: вот репа Awesome Clawdbot Skills с 565+ skills, чтобы заранее понять, что Clawdbot реально умеет, еще до установки.

Ссылка тут ➡️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2
В Claude завезли интерактивные интеграции с рабочими тулзами.

Можно быстро накидать черновик сообщения для Slack, визуализировать идею в виде диаграммы для Figma и собрать или посмотреть таймлайн задач в Asana.

Плюс интеграции вроде Box (поиск и превью файлов с разбором содержимого), Clay (ресерч компаний и контактов + персонализированный outreach) и Hex (вопросы к данным с графиками, таблицами и источниками).

В списке еще Amplitude, Canva, Monday.com и другие.
Вышел Qwen3-Max-Thinking, и это их флагманская reasoning-модель.

Обучена на огромных масштабах и продвинутом RL, показывает сильные результаты в рассуждениях, знаниях, работе с инструментами и агент-сценариях.

Ключевые фишки:
Адаптивный tool-use. То есть вместо ручного выбора “искать/выполнить код/достать из памяти” модель сама решает, когда ей нужен Search, когда Memory, когда Code Interpreter.
Test-time scaling. Это когда модель делает несколько раундов самопроверки и “рефлексии” перед финальным ответом. По заявлению, такой режим на задачах на рассуждение обходит Gemini 3 Pro.
По цифрам они подсвечивают два полюса: математика (98.0 на HMMT Feb) и агентный поиск (49.8 на HLE)

Пощупать в чате, документация Completions API, совместимость с OpenAI Responses API, подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Cursor теперь может использовать несколько браузеров одновременно с помощью субагентов.