NEW BOT Телеграм, страница

~~RUG~~ RAG

Первой практической штукой, которую мы сделаем, будет RAG система

RAG (Retrieval-Augmented Generation) – это подход, при котором искусственный интеллект сначала находит нужную информацию в базе данных или документах (retrieval), а затем использует её для генерации ответа (generation).

Простыми словами, это способ “научить” модель отвечать с опорой на реальные данные, а не только на то, что она запомнила при обучении.

RAG-системы применяются в чат-ботах, справочных ассистентах и корпоративных поисках — чтобы AI давал точные, актуальные и обоснованные ответы, цитируя источник, а не "выдумывал" их.

Чтобы перейти к практике, нам в любом случае придётся разобраться с тем что такое: AI модель, в чем разница между AI моделью и нейросетью и понять понять какие вообще бывают модели. Всё это я расписал в конспекте, который прикрепляю снизу

Скорее всего, это будет самая простая часть конспектов. Но она нужна чтобы заложить начальный фундамент и хотя бы не путаться в понятиях

Читать: AI модели для чайников

SemolinaCode | Chat | YouTube | HowToCode | Prop

14❤44🔥26👍12🥰1👌1

5.19K views18:57

Semolina Code (Python / TypeScript)

Похоже придётся повайбкодить

В своём лайв канале Криппи выложил пост:
https://news.1rj.ru/str/sdgsdfhdfdfh/1901

В этом посте Криппи написал, что у нас тут будет вайбкоддинг, а он не планировался))
Планировались чуть более сложные вещи (вплоть до файн-тюнинга моделей)

Но не суть. Уважим пирожка и подготовим инфу про вайбкоддинг.
Я уже накопал кое-какие инструменты, для помощи кодерам и затестил некоторые профильные модели:
– https://cursor.com/
– https://tabnine.com/
– https://kilocode.ai/
– https://codeassist.google/
– https://factory.ai/
– https://builder.io/ (хуже всех отработал)
– https://grok.com/
– https://claude.com/ (лучше всех себя показал)
– ...

Если вы ещё что-то тестили на +- сложных проектах и это вам реально помогло, то закиньте пожалуйста в комменты или в лс @ahillary

👇

Please open Telegram to view this post

VIEW IN TELEGRAM

❤34👏16👍14😁2🫡2

5.16K views17:14

Semolina Code (Python / TypeScript)

Запуск AI-моделей локально

Просто для понимания: ChatGPT 5, Gemini 3, Grok 3 и т. д. – это самые популярные AI-модели от крупных компаний

Но на самом деле этих моделей огромное количество. Только в открытом доступе на Hugging Face находится более 2.2 млн моделей под разные задачи (каждую из которых можно скачать и запустить у себя локально – если, конечно, хватит железа)

Один из самых простых способов запустить модель локально – использовать DMR (Docker Model Runner)
Если вы впервые слышите слово "Docker", ничего страшного. Чтобы скачать и запустить модель, вам не придётся писать код или вводить команды, так как у DMR есть понятный пользовательский интерфейс (см. скрин).

Без лишних слов – всё описал в конспекте:

Читать: DMR: запуск AI-моделей локально

P.S. А вообще, на канале есть урок про основы Docker и docker-compose для кодеров

SemolinaCode | Chat | YouTube | HowToCode | Prop

2❤45👍20🔥10🥰3

5.54K views18:51

Semolina Code (Python / TypeScript)

Запуск AI-моделей локально (способ 2)

Запускать ai модели ещё можно через ollama

Функции почти те же, что и у Docker:
– есть GUI
– устанавливается одной командой
– есть hub моделей
– гибкие настройки
– поддержка openai api
– есть возможность запуска моделей с Hugging Face (в формате GGUF)
– большое комьюнити

Читать: Запуск моделей локально через Ollama

SemolinaCode | Chat | YouTube | HowToCode | Prop

1👍27❤11🔥10😁1

5.53K views20:15

Semolina Code (Python / TypeScript)

Что за циферки?

Мы уже разобрались с тем как запускать модели локально (способ 1 и способ 2). Теперь надо понять как выбрать модель под свои нужды и как прочитать "паспорт модели", который выглядит примерно так:

Model
architecture gemma3
parameters 4.3B
context length 131072
embedding length 2560
quantization Q4_K_M

Capabilities
completion
vision

Parameters
temperature 1
top_k 64
top_p 0.95
stop "<end_of_turn>"

License
Gemma Terms of Use
Last modified: Feb 21, 2024

Всё это очень подробно разобрал в конспекте:

Читать: Как выбрать AI модель

SemolinaCode | Chat | YouTube | HowToCode | Prop

2🔥33❤10👍9

5.72K views17:59

Semolina Code (Python / TypeScript)

Всё, что вам нужно знать про HuggingFace

P.S. В этом посте я упомяну "huggingface" 10 раз. Заранее извиняюсь

Тут будет сразу серия статей!!

Обзор huggingface.co

– Что такое huggingface;
– Кто и как использует huggingface;
– Как пользоваться huggingface новичку.

Выбор модели под задачу на huggingface.co

– Какие есть фильтры на huggingface и как ими пользоваться;
– Разберём практические шаблоны для фильтрации.

Обзор карточки модели на huggingface.co

– Разберём все разделы карточки на huggingface;
– Протестируем модель прямо в браузере;
– Узнаем кто и как может подгрузить кастомный код на наше локальное устройство и как этого избежать.

SemolinaCode | Chat | YouTube | HowToCode | Prop

1👍35❤10🔥8👨‍💻1

5.77K viewsedited 17:40

Semolina Code (Python / TypeScript)

Как удалить свой диалог с ChatGPT? Никак

Я тут обнаружил, что если попытаться удалить свой диалог с ChatGPT, то под капотом у вас ничего не выйдет. Диалог просто перестанет у вас отображаться, но на сервере openai скорее всего всё будет сохранено

Откуда такая догадка?
Да просто во время запрос на удаление диалога отправляется PATCH запрос с параметром "is_visible: false".

Да и в принципе PATCH запрос предназначен для обновления информации, а для удаляния есть DELETE

Запрос PATCH используется для частичного обновления ресурса в API, отправляя только те данные, которые нужно изменить, а не весь объект целиком

SemolinaCode | Chat | YouTube | HowToCode | Prop

1❤33😁25👍12🤡6🔥1

5.17K viewsedited 14:44

Semolina Code (Python / TypeScript)

Пилотный тест

Супер простая статья про то как подготовить данные для тестирования модели

Читать: Как создать пилотный тест для модели

P.S. Данный урок потребуется для выполнения первого домашнего задания в обучении по RAG, которое начнется завтра в видеоформате на этом канале бесплатно (но со спонсором)

SemolinaCode | Chat | YouTube | HowToCode | Prop

2❤36❤‍🔥5🔥5👍3

4.2K views16:41

Semolina Code (Python / TypeScript)

Курс: RAG для новичков

Урок 1. Как LLM работает с документами и приватными данными (теория)

В уроке я простым языком объясняю, как ИИ “думает” под капотом и как сделать так, чтобы он начал отвечать по твоей информации, а не абстрактно. Пока что без математики и без кода

В уроке разбираем базу 😮:

– почему ChatGPT / Gemini / Claude не видят ваши документы и свежие данные;
– что такое RAG (Retrieval Augmented Generation) и какую проблему он решает;
– из каких этапов состоит RAG-pipeline: indexing → retrieval → generation;
– что такое embeddings, vector store и поиск по смыслу, а не по словам;
– почему RAG — это не дообучение модели, а работа с контекстом.

В курсе используем реальный продуктовый кейс – сервис Antarctic Wallet (оплата USDT по QR-коду в магазинах и сервисах), чтобы показать, как RAG применяется на практике (например, для автоматизации службы поддержки)

Домашнее задание:
– Составить пилотный тест для проверки качества RAG системы по данным со страницы F.A.Q.

🎞 Видео
📖 Методичка в Notion
❤️ Оплатить USDT по QR-коду

В следующем уроке — переходим к коду и собираем RAG-pipeline руками.

SemolinaCode | Chat | YouTube

Please open Telegram to view this post

VIEW IN TELEGRAM

11❤42🔥12👍8⚡2❤‍🔥1👏1

4.9K viewsedited 16:47

Semolina Code (Python / TypeScript)

Есть тут кто-то, кто:
- учился
- знает тех, кто учился
- просто слышал что-то про
Стартап Академию Сколково

Стоит ли сходить, поучиться?
Или есть какие-то альтернативы с хорошей экосистемой/комьюнити в направлении стартапинга/предпринимательства?

❤17😁11🔥3

3.54K views14:39

Semolina Code (Python / TypeScript)

Курс: RAG для новичков

Урок 2. Первый рабочий RAG pipeline

Вот и пришло время написать код, а именно RAG pipeline. ИИ начнёт отвечать по твоей информации, а не абстрактно. До сих пор без математики, но уже с кодом!!

В уроке напишем полностью рабочий и применимый на практике код:

– загрузка данных с сайта
– деление текста на чанки
– бесплатный embeddings (Ollama + HuggingFace)
– векторное хранилище (ChromaDB)
– поиск релевантных чанков (retriever c k ближайших соседей)
– prompt для LLM генерации
– сборка RAG цепочки через LangChain
– прогон по пилотному тесту: где всё хорошо, а где появляются галлюцинации (пример с KYC)

👩‍💻

Код с урока
❤️ Оплатить USDT по QR-коду

В следующем уроке – улучшим каждый узел пайплайна (retrieval, prompt, формат контекста и т.д.).

SemolinaCode | Chat | YouTube

Please open Telegram to view this post

VIEW IN TELEGRAM

11🔥22❤11❤‍🔥7👍2

3.61K viewsedited 16:27

Semolina Code (Python / TypeScript)

Курс: RAG для новичков Урок 2. Первый рабочий RAG pipeline Вот и пришло время написать код, а именно RAG pipeline. ИИ начнёт отвечать по твоей информации, а не абстрактно. До сих пор без математики, но уже с кодом!! В уроке напишем полностью рабочий и…

Случайно вставил ссылку на первый урок. Сейчас уже поправил, но вот на всякий случай:

https://youtu.be/FxCez4KeR0I

👍23❤14

3.64K viewsedited 17:17

Semolina Code (Python / TypeScript)

Курс: RAG для новичков

Урок 3. Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain)

Если в пошлом уроке мы просто написали простенький RAG pipeline, то в этом уроке мы попробуем довести его до "идеале", а именно этап индексации

Что конкретно сделаем:

– загрузим не одну страницу, а весь сайт через sitemap.xml
– попробуем второй способ: рекурсивный обход ссылок внутри домена
– научимся резать текст правильно: по структуре HTML или по токенам (а не “на глаз”)
– разберёмся с эмбеддингами: как выбрать модель под русский и зачем иногда нужны префиксы
– ускорим ChromaDB: чтобы индекс не пересобирался каждый запуск (запуск из минут → в миллисекунды)

Кейс тот же: Antarctic Wallet – оплата USDT по QR-коду в магазинах и сервисах.
Стараюсь сделать так, чтобы всё было максимально применимо к реальности – для базы знаний / саппорта / FAQ

🎞 Видео
📖 Методичка в Notion

👩‍💻

Код с урока
❤️ Оплатить USDT по QR-коду

В следующем уроке – улучшим этап поиска и генерации

SemolinaCode | Chat | YouTube

Please open Telegram to view this post

VIEW IN TELEGRAM

3❤24❤‍🔥10🔥6👍2

3.33K viewsedited 11:47

Semolina Code (Python / TypeScript)

Курс: RAG для новичков

Урок 4. Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain)

Тут мы наконец-то закончим создание нашего "идеального" RAG пайплайна: retriever, format_docs, prompt и LLM параметры.

Что конкретно сделаем:

– Retriever:
similarity vs MMR, пороги релевантности, фильтры по метаданным
– Post-processing:
собираем контекст правильно, добавляем source/page, лимитируем длину
– Prompt для RAG:
только по контексту, без выдумок, честное “нет данных”
– LLM настройки:
temperature, max tokens, top-p — простым языком, без магии
– Финальная LangChain цепочка:
защита от пустого контекста + готовность к LangSmith

👩‍💻

Код с урока
❤️ Оплатить USDT по QR-коду

В следующем уроке – LangSmith (визуальный дебаг) + подготовка к AI агенту

Накиньте реакций, если тема интересна ♥️

SemolinaCode | Chat | YouTube

Please open Telegram to view this post

VIEW IN TELEGRAM

2❤47🔥8👍5

3.44K viewsedited 10:25

Semolina Code (Python / TypeScript)

Курс: RAG для новичков

Урок 5. LangSmith: трассировка, отладка и тестирование приложений на базе LLM

Время отдохнуть от кода и улучшить то, что у нас уже есть. Для этого используем инструмент визуальной отладки, который также покажет нам что происходило на каждом этапе нашего приложения – LangSmith

Что конкретно сделаем:

– подключаем LangSmith к нашему RAG
– смотрим каждый этап цепочки: retriever → контекст → prompt → LLM → output
– видим tokens / latency / ошибки
– собираем online evaluator (LLM-as-a-judge): ChatGPT сам оценивает качество ответа
– делаем Playground и сравниваем 2 промпта (мини A/B)

👩‍💻

Код с урока
❤️ Оплатить USDT по QR-коду

В следующем уроке – LangSmith (визуальный дебаг) + подготовка к AI агенту

SemolinaCode | Chat | YouTube

Please open Telegram to view this post

VIEW IN TELEGRAM

2❤27👍5🔥4

3.52K viewsedited 15:19

Semolina Code (Python / TypeScript)

Курс: RAG для новичков

Урок 6 (финальный). Как засунуть настоящего AI агента в RAG цепочку

Ну тут вроде и по заголовку всё понятно. Разберём что такое AI агент и напишем своего. Потом соединим этого агента с RAG цепочкой (а потом удалим всё нахрен)))

Что конкретно сделаем:

– разберём, что такое AI-агент и чем он отличается от обычной LLM
– разберём основные архитектуры AI агентов
– напишем простого агента в LangChain
– пошагово посмотрим, как агент “думает” и что он вызывает
– попробуем встроить агента в RAG для переписывания вопросов пользователя
– разберём проблемы: лишние вызовы модели, нестабильность, сложность дебага

👩‍💻

Код с урока
❤️ Оплатить USDT по QR-коду

Это финальный урок мини-курса про RAG.
Подумайте почему я так вцепился в эту технлогию и попробуйте придумать где её можно применить с целью заработка. Догадки в комментарии 👇

SemolinaCode | Chat | YouTube

Please open Telegram to view this post

VIEW IN TELEGRAM

5🔥35❤9👌5

3.65K views13:11

About

Blog

Apps

Platform