Первой практической штукой, которую мы сделаем, будет RAG система
RAG (Retrieval-Augmented Generation) – это подход, при котором искусственный интеллект сначала находит нужную информацию в базе данных или документах (retrieval), а затем использует её для генерации ответа (generation).
Простыми словами, это способ “научить” модель отвечать с опорой на реальные данные, а не только на то, что она запомнила при обучении.
RAG-системы применяются в чат-ботах, справочных ассистентах и корпоративных поисках — чтобы AI давал точные, актуальные и обоснованные ответы, цитируя источник, а не "выдумывал" их.
Чтобы перейти к практике, нам в любом случае придётся разобраться с тем что такое: AI модель, в чем разница между AI моделью и нейросетью и понять понять какие вообще бывают модели. Всё это я расписал в конспекте, который прикрепляю снизу
Скорее всего, это будет самая простая часть конспектов. Но она нужна чтобы заложить начальный фундамент и хотя бы не путаться в понятиях
Читать: AI модели для чайников
SemolinaCode | Chat | YouTube | HowToCode | Prop
14❤43🔥26👍12🥰1👌1
Похоже придётся повайбкодить
В своём лайв канале Криппи выложил пост:
https://news.1rj.ru/str/sdgsdfhdfdfh/1901
В этом посте Криппи написал, что у нас тут будет вайбкоддинг, а он не планировался))
Планировались чуть более сложные вещи (вплоть до файн-тюнинга моделей)
Но не суть. Уважим пирожка и подготовим инфу про вайбкоддинг.
Я уже накопал кое-какие инструменты, для помощи кодерам и затестил некоторые профильные модели:
– https://cursor.com/
– https://tabnine.com/
– https://kilocode.ai/
– https://codeassist.google/
– https://factory.ai/
– https://builder.io/ (хуже всех отработал)
– https://grok.com/
– https://claude.com/ (лучше всех себя показал)
– ...
Если вы ещё что-то тестили на +- сложных проектах и это вам реально помогло, то закиньте пожалуйста в комменты или в лс @ahillary👇
В своём лайв канале Криппи выложил пост:
https://news.1rj.ru/str/sdgsdfhdfdfh/1901
В этом посте Криппи написал, что у нас тут будет вайбкоддинг, а он не планировался))
Планировались чуть более сложные вещи (вплоть до файн-тюнинга моделей)
Но не суть. Уважим пирожка и подготовим инфу про вайбкоддинг.
Я уже накопал кое-какие инструменты, для помощи кодерам и затестил некоторые профильные модели:
– https://cursor.com/
– https://tabnine.com/
– https://kilocode.ai/
– https://codeassist.google/
– https://factory.ai/
– https://builder.io/ (хуже всех отработал)
– https://grok.com/
– https://claude.com/ (лучше всех себя показал)
– ...
Если вы ещё что-то тестили на +- сложных проектах и это вам реально помогло, то закиньте пожалуйста в комменты или в лс @ahillary
Please open Telegram to view this post
VIEW IN TELEGRAM
❤34👏16👍14😁2🫡2
Запуск AI-моделей локально
Просто для понимания: ChatGPT 5, Gemini 3, Grok 3 и т. д. – это самые популярные AI-модели от крупных компаний
Но на самом деле этих моделей огромное количество. Только в открытом доступе на Hugging Face находится более 2.2 млн моделей под разные задачи (каждую из которых можно скачать и запустить у себя локально – если, конечно, хватит железа)
Один из самых простых способов запустить модель локально – использовать DMR (Docker Model Runner)
Если вы впервые слышите слово "Docker", ничего страшного. Чтобы скачать и запустить модель, вам не придётся писать код или вводить команды, так как у DMR есть понятный пользовательский интерфейс (см. скрин).
Без лишних слов – всё описал в конспекте:
Читать: DMR: запуск AI-моделей локально
P.S. А вообще, на канале есть урок про основы Docker и docker-compose для кодеров
SemolinaCode | Chat | YouTube | HowToCode | Prop
Просто для понимания: ChatGPT 5, Gemini 3, Grok 3 и т. д. – это самые популярные AI-модели от крупных компаний
Но на самом деле этих моделей огромное количество. Только в открытом доступе на Hugging Face находится более 2.2 млн моделей под разные задачи (каждую из которых можно скачать и запустить у себя локально – если, конечно, хватит железа)
Один из самых простых способов запустить модель локально – использовать DMR (Docker Model Runner)
Если вы впервые слышите слово "Docker", ничего страшного. Чтобы скачать и запустить модель, вам не придётся писать код или вводить команды, так как у DMR есть понятный пользовательский интерфейс (см. скрин).
Без лишних слов – всё описал в конспекте:
Читать: DMR: запуск AI-моделей локально
P.S. А вообще, на канале есть урок про основы Docker и docker-compose для кодеров
SemolinaCode | Chat | YouTube | HowToCode | Prop
2❤44👍20🔥10🥰3
Запуск AI-моделей локально (способ 2)
Запускать ai модели ещё можно через ollama
Функции почти те же, что и у Docker:
– есть GUI
– устанавливается одной командой
– есть hub моделей
– гибкие настройки
– поддержка openai api
– есть возможность запуска моделей с Hugging Face (в формате GGUF)
– большое комьюнити
Читать: Запуск моделей локально через Ollama
SemolinaCode | Chat | YouTube | HowToCode | Prop
Запускать ai модели ещё можно через ollama
Функции почти те же, что и у Docker:
– есть GUI
– устанавливается одной командой
– есть hub моделей
– гибкие настройки
– поддержка openai api
– есть возможность запуска моделей с Hugging Face (в формате GGUF)
– большое комьюнити
Читать: Запуск моделей локально через Ollama
SemolinaCode | Chat | YouTube | HowToCode | Prop
1👍26❤11🔥10😁1
Что за циферки?
Мы уже разобрались с тем как запускать модели локально (способ 1 и способ 2). Теперь надо понять как выбрать модель под свои нужды и как прочитать "паспорт модели", который выглядит примерно так:
Всё это очень подробно разобрал в конспекте:
Читать: Как выбрать AI модель
SemolinaCode | Chat | YouTube | HowToCode | Prop
Мы уже разобрались с тем как запускать модели локально (способ 1 и способ 2). Теперь надо понять как выбрать модель под свои нужды и как прочитать "паспорт модели", который выглядит примерно так:
Model
architecture gemma3
parameters 4.3B
context length 131072
embedding length 2560
quantization Q4_K_M
Capabilities
completion
vision
Parameters
temperature 1
top_k 64
top_p 0.95
stop "<end_of_turn>"
License
Gemma Terms of Use
Last modified: Feb 21, 2024
Всё это очень подробно разобрал в конспекте:
Читать: Как выбрать AI модель
SemolinaCode | Chat | YouTube | HowToCode | Prop
2🔥32❤10👍9
Всё, что вам нужно знать про HuggingFace
P.S. В этом посте я упомяну "huggingface" 10 раз. Заранее извиняюсь
Тут будет сразу серия статей!!
Обзор huggingface.co
Выбор модели под задачу на huggingface.co
Обзор карточки модели на huggingface.co
SemolinaCode | Chat | YouTube | HowToCode | Prop
Тут будет сразу серия статей!!
Обзор huggingface.co
– Что такое huggingface;
– Кто и как использует huggingface;
– Как пользоваться huggingface новичку.
Выбор модели под задачу на huggingface.co
– Какие есть фильтры на huggingface и как ими пользоваться;
– Разберём практические шаблоны для фильтрации.
Обзор карточки модели на huggingface.co
– Разберём все разделы карточки на huggingface;
– Протестируем модель прямо в браузере;
– Узнаем кто и как может подгрузить кастомный код на наше локальное устройство и как этого избежать.
SemolinaCode | Chat | YouTube | HowToCode | Prop
1👍32❤9🔥7👨💻1
Как удалить свой диалог с ChatGPT? Никак
Я тут обнаружил, что если попытаться удалить свой диалог с ChatGPT, то под капотом у вас ничего не выйдет. Диалог просто перестанет у вас отображаться, но на сервере openai скорее всего всё будет сохранено
Откуда такая догадка?
Да просто во время запрос на удаление диалога отправляется PATCH запрос с параметром "is_visible: false".
Да и в принципе PATCH запрос предназначен для обновления информации, а для удаляния есть DELETE
SemolinaCode | Chat | YouTube | HowToCode | Prop
Я тут обнаружил, что если попытаться удалить свой диалог с ChatGPT, то под капотом у вас ничего не выйдет. Диалог просто перестанет у вас отображаться, но на сервере openai скорее всего всё будет сохранено
Откуда такая догадка?
Да просто во время запрос на удаление диалога отправляется PATCH запрос с параметром "is_visible: false".
Да и в принципе PATCH запрос предназначен для обновления информации, а для удаляния есть DELETE
Запрос PATCH используется для частичного обновления ресурса в API, отправляя только те данные, которые нужно изменить, а не весь объект целиком
SemolinaCode | Chat | YouTube | HowToCode | Prop
1❤31😁23👍11🤡6🔥1
Пилотный тест
Супер простая статья про то как подготовить данные для тестирования модели
Читать: Как создать пилотный тест для модели
P.S. Данный урок потребуется для выполнения первого домашнего задания в обучении по RAG, которое начнется завтра в видеоформате на этом канале бесплатно (но со спонсором)
SemolinaCode | Chat | YouTube | HowToCode | Prop
Супер простая статья про то как подготовить данные для тестирования модели
Читать: Как создать пилотный тест для модели
P.S. Данный урок потребуется для выполнения первого домашнего задания в обучении по RAG, которое начнется завтра в видеоформате на этом канале бесплатно (но со спонсором)
SemolinaCode | Chat | YouTube | HowToCode | Prop
2❤32❤🔥4🔥4👍3
Курс: RAG для новичков
Урок 1. Как LLM работает с документами и приватными данными (теория)
В уроке я простым языком объясняю, как ИИ “думает” под капотом и как сделать так, чтобы он начал отвечать по твоей информации, а не абстрактно. Пока что без математики и без кода
В уроке разбираем базу😮 :
В курсе используем реальный продуктовый кейс – сервис Antarctic Wallet (оплата USDT по QR-коду в магазинах и сервисах), чтобы показать, как RAG применяется на практике (например, для автоматизации службы поддержки)
Домашнее задание:
– Составить пилотный тест для проверки качества RAG системы по данным со страницы F.A.Q.
🎞 Видео
📖 Методичка в Notion
❤️ Оплатить USDT по QR-коду
В следующем уроке — переходим к коду и собираем RAG-pipeline руками.
SemolinaCode | Chat | YouTube | HowToCode
Урок 1. Как LLM работает с документами и приватными данными (теория)
В уроке я простым языком объясняю, как ИИ “думает” под капотом и как сделать так, чтобы он начал отвечать по твоей информации, а не абстрактно. Пока что без математики и без кода
В уроке разбираем базу
– почему ChatGPT / Gemini / Claude не видят ваши документы и свежие данные;
– что такое RAG (Retrieval Augmented Generation) и какую проблему он решает;
– из каких этапов состоит RAG-pipeline: indexing → retrieval → generation;
– что такое embeddings, vector store и поиск по смыслу, а не по словам;
– почему RAG — это не дообучение модели, а работа с контекстом.
В курсе используем реальный продуктовый кейс – сервис Antarctic Wallet (оплата USDT по QR-коду в магазинах и сервисах), чтобы показать, как RAG применяется на практике (например, для автоматизации службы поддержки)
Домашнее задание:
– Составить пилотный тест для проверки качества RAG системы по данным со страницы F.A.Q.
В следующем уроке — переходим к коду и собираем RAG-pipeline руками.
SemolinaCode | Chat | YouTube | HowToCode
Please open Telegram to view this post
VIEW IN TELEGRAM
11❤38🔥11👍7⚡2❤🔥1👏1
Есть тут кто-то, кто:
- учился
- знает тех, кто учился
- просто слышал что-то про
Стартап Академию Сколково
Стоит ли сходить, поучиться?
Или есть какие-то альтернативы с хорошей экосистемой/комьюнити в направлении стартапинга/предпринимательства?
- учился
- знает тех, кто учился
- просто слышал что-то про
Стартап Академию Сколково
Стоит ли сходить, поучиться?
Или есть какие-то альтернативы с хорошей экосистемой/комьюнити в направлении стартапинга/предпринимательства?
❤12😁8🔥1
Курс: RAG для новичков
Урок 2. Первый рабочий RAG pipeline
Вот и пришло время написать код, а именно RAG pipeline. ИИ начнёт отвечать по твоей информации, а не абстрактно. До сих пор без математики, но уже с кодом!!
В уроке напишем полностью рабочий и применимый на практике код:
В курсе используем реальный продуктовый кейс – сервис Antarctic Wallet (оплата USDT по QR-коду в магазинах и сервисах), чтобы показать, как RAG применяется на практике (например, для автоматизации службы поддержки)
🎞 Видео
📖 Методичка в Notion
👩💻 Код с урока
❤️ Оплатить USDT по QR-коду
В следующем уроке – улучшим каждый узел пайплайна (retrieval, prompt, формат контекста и т.д.).
SemolinaCode | Chat | YouTube | HowToCode
Урок 2. Первый рабочий RAG pipeline
Вот и пришло время написать код, а именно RAG pipeline. ИИ начнёт отвечать по твоей информации, а не абстрактно. До сих пор без математики, но уже с кодом!!
В уроке напишем полностью рабочий и применимый на практике код:
– загрузка данных с сайта
– деление текста на чанки
– бесплатный embeddings (Ollama + HuggingFace)
– векторное хранилище (ChromaDB)
– поиск релевантных чанков (retriever c k ближайших соседей)
– prompt для LLM генерации
– сборка RAG цепочки через LangChain
– прогон по пилотному тесту: где всё хорошо, а где появляются галлюцинации (пример с KYC)
В курсе используем реальный продуктовый кейс – сервис Antarctic Wallet (оплата USDT по QR-коду в магазинах и сервисах), чтобы показать, как RAG применяется на практике (например, для автоматизации службы поддержки)
В следующем уроке – улучшим каждый узел пайплайна (retrieval, prompt, формат контекста и т.д.).
SemolinaCode | Chat | YouTube | HowToCode
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥20❤8❤🔥5👍2
Semolina Code (Python / TypeScript)
Курс: RAG для новичков Урок 2. Первый рабочий RAG pipeline Вот и пришло время написать код, а именно RAG pipeline. ИИ начнёт отвечать по твоей информации, а не абстрактно. До сих пор без математики, но уже с кодом!! В уроке напишем полностью рабочий и…
Случайно вставил ссылку на первый урок. Сейчас уже поправил, но вот на всякий случай:
https://youtu.be/FxCez4KeR0I
https://youtu.be/FxCez4KeR0I
👍20❤12
Курс: RAG для новичков
Урок 3. Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain)
Если в пошлом уроке мы просто написали простенький RAG pipeline, то в этом уроке мы попробуем довести его до "идеале", а именно этап индексации
Что конкретно сделаем:
Кейс тот же: Antarctic Wallet – оплата USDT по QR-коду в магазинах и сервисах.
Стараюсь сделать так, чтобы всё было максимально применимо к реальности – для базы знаний / саппорта / FAQ
🎞 Видео
📖 Методичка в Notion
👩💻 Код с урока
❤️ Оплатить USDT по QR-коду
В следующем уроке – улучшим этап поиска и генерации
SemolinaCode | Chat | YouTube | HowToCode
Урок 3. Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain)
Если в пошлом уроке мы просто написали простенький RAG pipeline, то в этом уроке мы попробуем довести его до "идеале", а именно этап индексации
Что конкретно сделаем:
– загрузим не одну страницу, а весь сайт через sitemap.xml
– попробуем второй способ: рекурсивный обход ссылок внутри домена
– научимся резать текст правильно: по структуре HTML или по токенам (а не “на глаз”)
– разберёмся с эмбеддингами: как выбрать модель под русский и зачем иногда нужны префиксы
– ускорим ChromaDB: чтобы индекс не пересобирался каждый запуск (запуск из минут → в миллисекунды)
Кейс тот же: Antarctic Wallet – оплата USDT по QR-коду в магазинах и сервисах.
Стараюсь сделать так, чтобы всё было максимально применимо к реальности – для базы знаний / саппорта / FAQ
В следующем уроке – улучшим этап поиска и генерации
SemolinaCode | Chat | YouTube | HowToCode
Please open Telegram to view this post
VIEW IN TELEGRAM
3❤19❤🔥6🔥4👍2
Курс: RAG для новичков
Урок 4. Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain)
Тут мы наконец-то закончим создание нашего "идеального" RAG пайплайна: retriever, format_docs, prompt и LLM параметры.
Что конкретно сделаем:
Кейс тот же: Antarctic Wallet – оплата USDT по QR-коду в магазинах и сервисах.
Стараюсь сделать так, чтобы всё было максимально применимо к реальности – для базы знаний / саппорта / FAQ
🎞 Видео
📖 Методичка в Notion
👩💻 Код с урока
❤️ Оплатить USDT по QR-коду
В следующем уроке – LangSmith (визуальный дебаг) + подготовка к AI агенту
Накиньте реакций, если тема интересна ♥️
SemolinaCode | Chat | YouTube | HowToCode
Урок 4. Как улучшить RAG pipeline: загрузка данных, разбиение, эмбеддинги и Chroma (LangChain)
Тут мы наконец-то закончим создание нашего "идеального" RAG пайплайна: retriever, format_docs, prompt и LLM параметры.
Что конкретно сделаем:
– Retriever:
similarity vs MMR, пороги релевантности, фильтры по метаданным
– Post-processing:
собираем контекст правильно, добавляем source/page, лимитируем длину
– Prompt для RAG:
только по контексту, без выдумок, честное “нет данных”
– LLM настройки:
temperature, max tokens, top-p — простым языком, без магии
– Финальная LangChain цепочка:
защита от пустого контекста + готовность к LangSmith
Кейс тот же: Antarctic Wallet – оплата USDT по QR-коду в магазинах и сервисах.
Стараюсь сделать так, чтобы всё было максимально применимо к реальности – для базы знаний / саппорта / FAQ
В следующем уроке – LangSmith (визуальный дебаг) + подготовка к AI агенту
Накиньте реакций, если тема интересна ♥️
SemolinaCode | Chat | YouTube | HowToCode
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤41🔥4👍3
Курс: RAG для новичков
Урок 5. LangSmith: трассировка, отладка и тестирование приложений на базе LLM
Время отдохнуть от кода и улучшить то, что у нас уже есть. Для этого используем инструмент визуальной отладки, который также покажет нам что происходило на каждом этапе нашего приложения – LangSmith
Что конкретно сделаем:
Кейс тот же: Antarctic Wallet – оплата USDT по QR-коду в магазинах и сервисах.
Стараюсь сделать так, чтобы всё было максимально применимо к реальности – для базы знаний / саппорта / FAQ
🎞 Видео
📖 Методичка в Notion
👩💻 Код с урока
❤️ Оплатить USDT по QR-коду
В следующем уроке – LangSmith (визуальный дебаг) + подготовка к AI агенту
SemolinaCode | Chat | YouTube | HowToCode
Урок 5. LangSmith: трассировка, отладка и тестирование приложений на базе LLM
Время отдохнуть от кода и улучшить то, что у нас уже есть. Для этого используем инструмент визуальной отладки, который также покажет нам что происходило на каждом этапе нашего приложения – LangSmith
Что конкретно сделаем:
– подключаем LangSmith к нашему RAG
– смотрим каждый этап цепочки: retriever → контекст → prompt → LLM → output
– видим tokens / latency / ошибки
– собираем online evaluator (LLM-as-a-judge): ChatGPT сам оценивает качество ответа
– делаем Playground и сравниваем 2 промпта (мини A/B)
Кейс тот же: Antarctic Wallet – оплата USDT по QR-коду в магазинах и сервисах.
Стараюсь сделать так, чтобы всё было максимально применимо к реальности – для базы знаний / саппорта / FAQ
В следующем уроке – LangSmith (визуальный дебаг) + подготовка к AI агенту
SemolinaCode | Chat | YouTube | HowToCode
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤19👍3🔥3