NEW BOT Телеграм, страница

Neural Kovalskii

Sber Conf: Open Source & AI Agents

Open Source в российских компаниях: успешные кейсы

Завтра выступаю тут в 18:15 расскажу про SGR Agent Core а как нам пришла идея в голову его сделать

P.S в чате и к посту завтра прикреплю ссылку на онлайн

1🔥19👍6❤3

4.12K views17:07

Neural Kovalskii

ERC3-DEV

И так я взял 100% качества на своих подходах

Давайте сравним DEV со STORE (agentic commerce бенчмарку по затратам и сложности)

erc3-dev
Здесь развернута демо-среда компании "Aetherion Analytics GmbH" с определенным набором API (например, по сотрудникам, проектам и внутренней вики), моделирующих типичные процессы в корпоративной ИТ-системе

1) Сложность около 7/10 (есть хэши/задания меняются на лету при получении таски изменнеия в параметрах), усложняет простой перебор
2) Задания стали сложнее когнитивно при этом требуют менше перебора апишек по этому 6/10 но подождем офф старта там будут цепочки длинее (а значит надо будет умело работать с контекстом)

Полученный опыт за 2 недели теста нашего с вами фреймворка 100/10

В голове теперь идей на целый год по улучшению фрейворка и адаптивности

Затраченное время примерно 3 часа имея опыт в STORE для адаптации под новое АПИ

Нашел багу сразу зарепортил Ринату!

gpt-4.1 ~ $70
Cursor(Sonnet 4.5) ~ $56

Cпасибо Ринату за такой опыт!

🔥31👍16👏8❤2

4.47K viewsedited 09:04

Neural Kovalskii

Дошел до конфы, выступаю по теме Agentic RAG

Ссылка на трансляцию https://jazz.sberbank.ru/sber-ijucll?type=webinar&role=VIEWER&psw=OEEWHQtXBAIHURELVEMTEQhbDA

Скоро не буду влезать в кадр 😅

Please open Telegram to view this post

VIEW IN TELEGRAM

5🔥50😁6👏3

4.58K viewsedited 13:30

Neural Kovalskii

Codewiki google

Смотрите что нашёл

Наконец репо sgr-agent-core проиндексировали!

https://codewiki.google/github.com/vamplabai/sgr-agent-core

Наконец то есть документация

🔥36👍7❤1

4.2K viewsedited 14:59

Neural Kovalskii

Всем привет! OpenAI снова меняет правила игры: вышла GPT- (∞) Turbo MAX (AGI Reality) Пока мы спали реальность выкатила то чего ждал весь рынок а именно обновление физики и экономики без багов Что произошло? Теперь твой код в Курсоре пишет сам себя пока…

Kovalskii Stream

Мы посмеялись над бесконечной гонкой и успешным успехом
Но сатира это лишь защитная реакция психики на перегруз
А настоящий ответ этому хаосу это создание собственной точки опоры (ну и сказанул конечно)
Попробуем с вами создать инструмент который вернет нам контроль над потоком информации

Я решил перейти от философии к инженерии
И сделать то что давно откладывал
Мы соберем собственного AI-агента который станет расширением нашей памяти

Он будет жить там где мы проводим большую часть времени в телеграме
Но его мозги будут работать по принципам Obsidian создавая базу знаний с перекрестными ссылками и выделением сущностей

В этот вторник мы проведем практический стрим
Никаких слайдов и теории об AGI
Только код архитектура и сборка своими руками
Мы научим агента слышать нас через Whisper
Работать с документами чтобы не читать их глазами
И сделаем это на gpt-4.1-mini чтобы это было доступно каждому

Это моя попытка выйти из крысиных бегов
И начать строить свою личную систему эффективности (опять?)
Приходите смотреть как я буду строить своего цифрового двойника
Весь код будет в гитхаб

Вторник 2 декабря
18:00 – 21:00
Добавляйте в календарь чтобы не пропустить

Включайте уведомления из тг

https://calendar.google.com/calendar/u/0/r/eventedit/copy/NXQwcHA5aWNsYmkxdmZzdjU1bGxrYjg5cHQgdmFsZXJvbmRlc3RvZXJAbQ/dmFsZXJvbmRlc3RvZXJAZ21haWwuY29t

Google Workspace

Google Calendar - Easier Time Management, Appointments & Scheduling

Learn how Google Calendar helps you stay on top of your plans - at home, at work and everywhere in between.

5🔥82❤1410

4.45K viewsedited 17:48

Neural Kovalskii

Live stream scheduled for Dec 2 at 15:00

19:22

Neural Kovalskii

Лучшие практики и подходы для RAG

Сборка от нашего сообщества @neuraldeep

(Пост все еще наполняется…)

Очередной раз спросили в чате канала что почитать про RAG (https://news.1rj.ru/str/neuraldeepchat)

Соберем тут все лучшее, присылайте ваши статьи и разборы

Ссылки на предыдущие запросы и разборы

1. https://news.1rj.ru/str/neuraldeepchat/3176
2. Стрим про RAG от меня https://news.1rj.ru/str/neuraldeep/1124

Best RAG Practices
https://arxiv.org/abs/2407.01219

0) ETL
DATA>LLM (подготовить данные для RAG)
https://github.com/microsoft/markitdown

https://github.com/datalab-to/marker

https://github.com/docling-project/docling

1) Чанкование (sliding window) можно подглядеть концепты от langchain
https://github.com/langchain-ai/langchain/tree/master/libs/text-splitters

Tired of making your gazillionth chunker? Sick of the overhead of large libraries? Want to chunk your texts quickly and efficiently? Chonkie the mighty hippo is here to help!
https://github.com/chonkie-inc/chonkie

Статья
https://habr.com/ru/companies/raft/articles/954158/

2) Векторные бд от pgvector до qdrant можно начать с chroma (IVF_Flat или HNSW)

3) Векторные модели для ру
ai-forever/FRIDA
BAAI/bge-m3
intfloat/multilingual-e5-large
Qwen3-Embedding-8B

4) Реранкер после KNN сделать доп ранжирование
BAAI/bge-reranker-v2-m3
Qwen3-Reranker-8B

5) LLM + vLMM (база qwen-2.5-7b-instruct)
RefalMachine/RuadaptQwen2.5-14B-Instruct

По моему мнению лучшие модели для ру сегмента по соотношению (цена/качество/размер)
t-tech/T-lite-it-1.0
t-tech/T-pro-it-2.0
Релизы анонсы, Head of AI Витя Тарнавский(https://news.1rj.ru/str/singularityfm)
Затраты на разработку(https://news.1rj.ru/str/singularityfm/298)

6) Agentic RAG(Qwen3-30B-A3B-Instruct-2507)
РЕПО(https://github.com/vamplabAI/sgr-agent-core/tree/tool-confluence)

7) Eval
RAGAS
https://docs.ragas.io/en/stable/

ARES
https://github.com/stanford-futuredata/ARES

8) Security (собрал @artembakradze)
NVIDIA NeMo Guardrails (помогает удержать бота в рамках темы, даже если его пытаются сломать)
Lakera / Rebuff (детекторы инъекций - хорошо работают, если прогонять через них не только вопрос юзера, но и сами чанки документов перед отправкой в LLM)
Garak (сканер уязвимостей)

Дополнительные материалы

Презентация от Дяди
Построение RAG систем от исследований до индустрии

Создатель ERC (Rinat Abdullin https://news.1rj.ru/str/llm_under_hood)
https://abdullin.com/erc/ (Тут вы найдете кучу кейсов)

Хорошо описанные подходы от Богдана
https://news.1rj.ru/str/bogdanisssimo/2047

Лучшее решение РАГ по документации от Ильи(@IlyaRice) которое выиграло первое место на ERC2
https://github.com/IlyaRice/RAG-Challenge-2/tree/main

Статья
https://habr.com/ru/articles/893356/

Готовые фреймворки одобренные нашим сообществом
https://github.com/langgenius/dify/
https://github.com/Marker-Inc-Korea/AutoRAG
https://github.com/run-llama/llama_index
https://github.com/mastra-ai/mastra

Кейс red_mad_robot по RAG (DCD) для строительной компании (t-lite)
https://habr.com/ru/companies/redmadrobot/articles/892882/

Серия про file first от Рефата
https://news.1rj.ru/str/nobilix/182

Классика (Запись эфира по RAGу без эмбеддингов)
https://news.1rj.ru/str/oestick/397

#RAG
#best_rag_practice

Сохраняй в избранное чтобы не потерять

Чат Kovalskii Варианты?

Ask about ALL
Чат канала @neuraldeep
Kovalskii на все ответит!

Прошу общаться вежливо и дружелюбно, без политики

Реклама/Вакансии/Рефы через @VaKovaLskii или @mixaill76

9🔥83❤18👍52

11K viewsedited 19:19

Neural Kovalskii

Neural Kovalskii pinned «Лучшие практики и подходы для RAG Сборка от нашего сообщества @neuraldeep (Пост все еще наполняется…) Очередной раз спросили в чате канала что почитать про RAG (https://news.1rj.ru/str/neuraldeepchat) Соберем тут все лучшее, присылайте ваши статьи и разборы Ссылки…»

17:38

Neural Kovalskii

Тестирую стрим на 3 площадки будет чутка уведомлений (это тест)

Twitch
https://www.twitch.tv/neural_kovalskii

Youtube
https://www.youtube.com/live/GWxZwXcYFq0?si=S0fhODroQLvGnMP_

Telegram
https://news.1rj.ru/str/neuraldeep?livestream

2👍10🔥3

3.74K viewsedited 10:57

Neural Kovalskii

Live stream started

11:46

Neural Kovalskii

Kovalskii Stream Мы посмеялись над бесконечной гонкой и успешным успехом Но сатира это лишь защитная реакция психики на перегруз А настоящий ответ этому хаосу это создание собственной точки опоры (ну и сказанул конечно) Попробуем с вами создать инструмент…

Neural Kovalskii Stream

А мы плавно начинаем, посмотрим мемчики и потом поработаем)!

Забегай на стрим!
Запись будет
Есть чат со всех 3 площадок(пиши где хочешь тебя увидят!)

Twitch
https://www.twitch.tv/neural_kovalskii

Youtube
https://www.youtube.com/live/GWxZwXcYFq0?si=S0fhODroQLvGnMP_

Telegram
https://news.1rj.ru/str/neuraldeep?livestream

Twitch

neural_kovalskii - Twitch

Neural Kovalskii

1🔥11

3.47K views13:50

Neural Kovalskii

Neural Kovalskii Stream А мы плавно начинаем, посмотрим мемчики и потом поработаем)! Забегай на стрим! Запись будет Есть чат со всех 3 площадок(пиши где хочешь тебя увидят!) Twitch https://www.twitch.tv/neural_kovalskii Youtube https://www.youtube.…

Обсуждаем агентов и SGR

Youtube
https://www.youtube.com/live/GWxZwXcYFq0?si=S0fhODroQLvGnMP_

Telegram
https://news.1rj.ru/str/neuraldeep?livestream

🔥11

3.75K viewsedited 15:45

Neural Kovalskii

Обсуждаем агентов и SGR Youtube https://www.youtube.com/live/GWxZwXcYFq0?si=S0fhODroQLvGnMP_ Telegram https://news.1rj.ru/str/neuraldeep?livestream

А к нам присоединился

@virrius

@mixaill76

Задавайте вопросы

1🔥15👍1

3.98K viewsedited 16:32

Neural Kovalskii

Gemini 3 Pro (сценарий создания саммари по каналу)

Выгрузил посты в json (telegram desktop, export chat history)
Написал парсер в composer-1
Выгрузил просто в чат к gemini (600 постов 210к токенов)
Что странно не влезло в чат в Claude в интерфейсе

Загрузил старый пост и получил новый (в пару итераций)

Спасибо gemini3 pro(топ для такого сценария) влезли все посты, и даже сделал сортировку по лайкам

https://news.1rj.ru/str/neuraldeep/10

Neural Kovalskii

Всем привет! Меня зовут Валерий Ковальский

В 25 лет пришел в IT без опыта. За 6 лет дошел до Head of AI в red_mad_robot Специализируюсь на AI Infrastructure: от железа до production (DevOps/LLMops/Network/Local inference)

Что построил из крупного: Рекомендательную…

🔥19👍9❤4

3.96K viewsedited 13:33

Neural Kovalskii

Forwarded from Pavel Zloi

Один мой коллега как-то сказал такой вот #meme

low-code система это просто недоделанная no-code система, которую не смогли довести до ума

🤣35💯7🔥3👏3

2.93K views08:41

Neural Kovalskii

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

О, жиза

1😁34👍6💯2❤1

3.14K views17:43

Neural Kovalskii

Мы в rnd red_mad_robot чуть-чуть глубже(чем пару запусков тут https://news.1rj.ru/str/neuraldeep/1718 )протестировали qwen guard, и вот что вышло

https://habr.com/ru/companies/redmadrobot/articles/971388/

Лайк шер, коммент приветствуется

Кстати теперь с нами пингвин 🖥

Please open Telegram to view this post

VIEW IN TELEGRAM

Neural Kovalskii

Qwen3Guard-Stream: real-time модерация которая реально работает

Новый день новый тест Qwen!

Если вы пропустили специализированные модели для safety moderation, то вот есть три размера (0.6B, 4B, 8B) обученные на 1.19 млн промптов с разметкой на безопасность…

17❤4🔥1

2.91K viewsedited 18:37

Neural Kovalskii

Forwarded from red_mad_robot

Qwen3Guard: следующий шаг в модерации и контроле контента

Когда в продукте появляется открытый ввод, вопрос модерации становится неизбежным. Даже при штатном использовании в поток попадают формулировки на грани или попытки обойти ограничения вроде «объясни, как взломать соседа».

В новой статье на Habr разбираем Qwen3Guard — модель, построенную как отдельный класс модерационных систем. Она определяет риск на уровне токенов ещё в момент генерации и может остановить ответ до отправки пользователю.

#AI_moment #роботайм

↗️

red_mad_robot

Please open Telegram to view this post

VIEW IN TELEGRAM

117❤8👍6🔥3

2.74K views18:37

Neural Kovalskii

Cоздаём агента с памятью на базе SGR Agent Core

Дошли ручки выложить запись 1 части
Посмотреть фул можно тут ютуб (поправил доступность) https://youtube.com/live/GWxZwXcYFq0

Гит решения https://github.com/vamplabAI/sgr-agent-core/tree/sgr-memory-agent
Промпт и агент https://news.1rj.ru/str/neuraldeepchat/28559
Запись файлом будет в комментариях

Приятного просмотра!
Кстати подписывайтесь на ютуб (там будет иногда выходить эксклюзивный контент про LLM)

55🔥4697❤1

2.71K viewsedited 10:22

Neural Kovalskii

Guardrails/Defend/LLM

Защита защита защита и еще раз защита

Дядя не только показал мне пару интересных решений на основе нашел статьи про Guard Qwen Stream, но и сразу раздал базы как надо!

Читаем
Мотаем на ус
Теперь и Вы уже знаете где у вас дыра в вашем чатботе/агенте!

1) https://news.1rj.ru/str/dealerAI/1590
2) https://news.1rj.ru/str/dealerAI/1591

Dealer.AI

Про мониторы, модераторы, защитники и прочие модели цензоры в вашем продакшене.

После прочтения лекции в Agora club, про базированный RAG, ко мне пришло много желающих из корпоративной среды, чтобы я прочитал тоже самое для их сотрудников. Потом, на неделе…

❤9👍6🔥43

2.66K viewsedited 13:24

Neural Kovalskii

Я ставлю крест на RAG: почему поиск по базе — это теперь задача для джуна, а будущее — за Generic Agent

Байт засчитан =)

Капля истории
Мы с вами начали с фундамента AI-инфраструктуры тестировали Llama на кластерах 4090, показывал вам тюн Whisper и считали экономику on-premise решений
Затем углубились в сложный RAG и Vibe Coding: заняли топ с малыми моделями в Enterprise RAG Challenge изучили Circuit Tracing для поиска галлюцинаций и научились собирать MVP за 7 дней
В середине 2025 перешли к автономным системам: запустили open-source SGR Deep Research доказали эффективность на бенчмарках и выпустили фреймворк SGR Agent Core

Честно говоря к концу 2025 года стало очевидно что RAG превратился в стандартную инженерную задачу которую может собрать джун по туториалам

Настоящий вызов сместился к агентам
И вот тут начинается самое интересное потому что большинство того что называют агентами на рынке это просто красивые цепочки в no-code конструкторах Workflow где вы заранее продумали каждый if-else, это не агенты это детерминированные пайплайны с LLM внутри

Я потратил последние месяцы на то чтобы понять как строить настоящие автономные системы (Запускал демо ERC3, строил решения для демо в agentic comerce)
Результат всей моей работы оказался тут sgr-agent-core фреймворк уже набрал 815 звезд на GitHub и работает в продакшене у реальных клиентов
Но главное не звезды а то понимание физики процесса которое я получил, и это так же ответ зачем было его делать

Generic Agent = Based Prompt + ReAct+PlanAct + Context Engineering + Memory + Tool Search

Это не просто формула это среда для автономности Based Prompt задает законы физики для модели как она должна думать планировать реагировать на ошибки

ReAct это безальтернативный цикл без которого автономности не существует модель должна рассуждать действовать анализировать результат и корректировать план

Context Engineering потому что контекст не резиновый и агент должен уметь управлять своим вниманием сжимать историю отбрасывать неактуальное держать фокус

Memory это не просто кэш это архитектурное решение о том что помнить что забывать когда делать compaction

Tool Search критически важный компонент для энтерпрайза когда у вас 500 плюс API-ручек вы не можете скормить их все в контекст настоящий агент сначала понимает задачу находит нужный инструмент в репозитории и только потом использует

В ближайшие дни у меня будет несколько площадок где я буду давать очень скромный прогноз без хайпа обещаю

Очень хочу показать что курсы по AI-агентам дают вам базу с langchain или n8n и обещают что теперь вы зарабатываете 300к в наносекунду но они не расскажут про управление форматом и структурами внутри tools про constraint и args про то как на самом деле работает structured output (пришлите в коменты если такой курс есть) как управлять ризонингом в агентах и как его вызывать самому (наш тул reasoning+plan)

Must Read от создателей LLM

Перед тем как что-то изобретать и задавать вопросы прочитайте что говорят те кто делает сами модели

OpenAI A Practical Guide to Building Agents

OpenAI Building Agents Track

Anthropic Building Effective Agents

Anthropic Context Engineering

Anthropic Building Agents with Claude Agent SDK

Все они говорят +- одно начинайте с простого не тащите сразу LangGraph на 20 нод сделайте одного агента с одним инструментом заставьте работать потом масштабируйте

Я строю агентов на локальных моделях и как оказалось что бы строить generic agent нужно мощное железо 🗿
Это не потому что я против OpenAI это потому что я хочу полный контроль над инференсом над латенси над стоимостью
Когда ты делаешь продакшен на локальных моделях ты понимаешь каждый байт контекста каждый вызов инструмента каждую миллисекунду задержки
Это сделать тебя лучшим инженером над API вызовами

По этому далее будет усиление на контент именно про них, про агентов, и про sgr-agent-core будем выводить фреймворк на 10к звезд!
Если ты со мной ставь 🖥 Linux =)

Stay tuned!

Please open Telegram to view this post

VIEW IN TELEGRAM

3179👍27❤10👏5

2.02K viewsedited 14:30

About

Blog

Apps

Platform