Neural Kovalskii – Telegram
Neural Kovalskii
9.75K subscribers
399 photos
59 videos
4 files
311 links
Head of AI redmadrobot.com

From IT Admin to Head of AI in 5 years

Applied AI Engineer
B2C RAG (2M+ books)
B2B RAG platform (10+ implementations)
B2C gptdaisy.com (100k MAU)

github.com/vakovalskii | chat @neuraldeepchat

To infinity... and beyond!
Download Telegram
Neural Kovalskii pinned «Лучшие практики и подходы для RAG Сборка от нашего сообщества @neuraldeep (Пост все еще наполняется…) Очередной раз спросили в чате канала что почитать про RAG (https://news.1rj.ru/str/neuraldeepchat) Соберем тут все лучшее, присылайте ваши статьи и разборы Ссылки…»
Тестирую стрим на 3 площадки будет чутка уведомлений (это тест)


Twitch
https://www.twitch.tv/neural_kovalskii

Youtube
https://www.youtube.com/live/GWxZwXcYFq0?si=S0fhODroQLvGnMP_


Telegram
https://news.1rj.ru/str/neuraldeep?livestream
2👍10🔥3
Live stream started
Gemini 3 Pro (сценарий создания саммари по каналу)

Выгрузил посты в json (telegram desktop, export chat history)
Написал парсер в composer-1
Выгрузил просто в чат к gemini (600 постов 210к токенов)
Что странно не влезло в чат в Claude в интерфейсе

Загрузил старый пост и получил новый (в пару итераций)


Спасибо gemini3 pro(топ для такого сценария) влезли все посты, и даже сделал сортировку по лайкам


https://news.1rj.ru/str/neuraldeep/10
🔥19👍94
Forwarded from Pavel Zloi
Один мой коллега как-то сказал такой вот #meme
low-code система это просто недоделанная no-code система, которую не смогли довести до ума
🤣35💯7🔥3👏3
Forwarded from red_mad_robot
Qwen3Guard: следующий шаг в модерации и контроле контента

Когда в продукте появляется открытый ввод, вопрос модерации становится неизбежным. Даже при штатном использовании в поток попадают формулировки на грани или попытки обойти ограничения вроде «объясни, как взломать соседа».

В новой статье на Habr разбираем Qwen3Guard — модель, построенную как отдельный класс модерационных систем. Она определяет риск на уровне токенов ещё в момент генерации и может остановить ответ до отправки пользователю.

#AI_moment #роботайм

↗️red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
1178👍6🔥3
Neural Kovalskii
Kovalskii Stream Мы посмеялись над бесконечной гонкой и успешным успехом Но сатира это лишь защитная реакция психики на перегруз А настоящий ответ этому хаосу это создание собственной точки опоры (ну и сказанул конечно) Попробуем с вами создать инструмент…
Cоздаём агента с памятью на базе SGR Agent Core


Дошли ручки выложить запись 1 части
Посмотреть фул можно тут ютуб (поправил доступность) https://youtube.com/live/GWxZwXcYFq0

Гит решения https://github.com/vamplabAI/sgr-agent-core/tree/sgr-memory-agent
Промпт и агент https://news.1rj.ru/str/neuraldeepchat/28559
Запись файлом будет в комментариях

Приятного просмотра!
Кстати подписывайтесь на ютуб (там будет иногда выходить эксклюзивный контент про LLM)
55🔥46971
Guardrails/Defend/LLM

Защита защита защита и еще раз защита

Дядя не только показал мне пару интересных решений на основе нашел статьи про Guard Qwen Stream, но и сразу раздал базы как надо!

Читаем
Мотаем на ус
Теперь и Вы уже знаете где у вас дыра в вашем чатботе/агенте!

1) https://news.1rj.ru/str/dealerAI/1590
2) https://news.1rj.ru/str/dealerAI/1591
9👍6🔥43
Я ставлю крест на RAG: почему поиск по базе — это теперь задача для джуна, а будущее — за Generic Agent

Байт засчитан =)

Капля истории
Мы с вами начали с фундамента AI-инфраструктуры тестировали Llama на кластерах 4090, показывал вам тюн Whisper и считали экономику on-premise решений
Затем углубились в сложный RAG и Vibe Coding: заняли топ с малыми моделями в Enterprise RAG Challenge изучили Circuit Tracing для поиска галлюцинаций и научились собирать MVP за 7 дней
В середине 2025 перешли к автономным системам: запустили open-source SGR Deep Research доказали эффективность на бенчмарках и выпустили фреймворк SGR Agent Core


Честно говоря к концу 2025 года стало очевидно что RAG превратился в стандартную инженерную задачу которую может собрать джун по туториалам

Настоящий вызов сместился к агентам
И вот тут начинается самое интересное потому что большинство того что называют агентами на рынке это просто красивые цепочки в no-code конструкторах Workflow где вы заранее продумали каждый if-else, это не агенты это детерминированные пайплайны с LLM внутри

Я потратил последние месяцы на то чтобы понять как строить настоящие автономные системы (Запускал демо ERC3, строил решения для демо в agentic comerce)
Результат всей моей работы оказался тут sgr-agent-core фреймворк уже набрал 815 звезд на GitHub и работает в продакшене у реальных клиентов
Но главное не звезды а то понимание физики процесса которое я получил, и это так же ответ зачем было его делать

Generic Agent = Based Prompt + ReAct+PlanAct + Context Engineering + Memory + Tool Search

Это не просто формула это среда для автономности Based Prompt задает законы физики для модели как она должна думать планировать реагировать на ошибки

ReAct это безальтернативный цикл без которого автономности не существует модель должна рассуждать действовать анализировать результат и корректировать план

Context Engineering потому что контекст не резиновый и агент должен уметь управлять своим вниманием сжимать историю отбрасывать неактуальное держать фокус

Memory это не просто кэш это архитектурное решение о том что помнить что забывать когда делать compaction

Tool Search критически важный компонент для энтерпрайза когда у вас 500 плюс API-ручек вы не можете скормить их все в контекст настоящий агент сначала понимает задачу находит нужный инструмент в репозитории и только потом использует

В ближайшие дни у меня будет несколько площадок где я буду давать очень скромный прогноз без хайпа обещаю

Очень хочу показать что курсы по AI-агентам дают вам базу с langchain или n8n и обещают что теперь вы зарабатываете 300к в наносекунду но они не расскажут про управление форматом и структурами внутри tools про constraint и args про то как на самом деле работает structured output (пришлите в коменты если такой курс есть) как управлять ризонингом в агентах и как его вызывать самому (наш тул reasoning+plan)

Must Read от создателей LLM

Перед тем как что-то изобретать и задавать вопросы прочитайте что говорят те кто делает сами модели

OpenAI A Practical Guide to Building Agents

OpenAI Building Agents Track

Anthropic Building Effective Agents

Anthropic Context Engineering

Anthropic Building Agents with Claude Agent SDK

Все они говорят +- одно начинайте с простого не тащите сразу LangGraph на 20 нод сделайте одного агента с одним инструментом заставьте работать потом масштабируйте

Я строю агентов на локальных моделях и как оказалось что бы строить generic agent нужно мощное железо 🗿
Это не потому что я против OpenAI это потому что я хочу полный контроль над инференсом над латенси над стоимостью
Когда ты делаешь продакшен на локальных моделях ты понимаешь каждый байт контекста каждый вызов инструмента каждую миллисекунду задержки
Это сделать тебя лучшим инженером над API вызовами

По этому далее будет усиление на контент именно про них, про агентов, и про sgr-agent-core будем выводить фреймворк на 10к звезд!
Если ты со мной ставь 🖥 Linux =)


Stay tuned!
Please open Telegram to view this post
VIEW IN TELEGRAM
14202👍3011👏5