#полезное
😬 Каждый повторный вызов LLM — это просто сжигание денег
Обычный кэш тут не поможет, если только промпт не совпадает дословно.
Redis 8 меняет правила игры с семантическим кэшированием, которое понимает смысл, а не только ключ.
LangCache + Vector Sets + Redis Flex = быстрее, дешевле, умнее
Полный разбор:
https://newsletter.systemdesignclassroom.com/p/every-repeated-llm-call-is-money-on-fire
👉 Новости 👉 База вопросов
Обычный кэш тут не поможет, если только промпт не совпадает дословно.
Redis 8 меняет правила игры с семантическим кэшированием, которое понимает смысл, а не только ключ.
LangCache + Vector Sets + Redis Flex = быстрее, дешевле, умнее
Полный разбор:
https://newsletter.systemdesignclassroom.com/p/every-repeated-llm-call-is-money-on-fire
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😎 Фреймворк для создания мультиагентных AI-систем в Telegram, готовый к запуску с минимальными настройками
evi-run подходит для создания AI-ассистентов, виртуальных персонажей, автоматизированной службы поддержки, аналитиков данных, торговых агентов на DEX и других кастомных мультиагентных систем
Архитектура построена на Python, OpenAI Agents SDK, Telegram Bot API, PostgreSQL и Redis. Deploy через Docker за 5 минут
GitHub репозиторий → https://github.com/pipedude/evi-run
👉 Новости 👉 База вопросов
evi-run подходит для создания AI-ассистентов, виртуальных персонажей, автоматизированной службы поддержки, аналитиков данных, торговых агентов на DEX и других кастомных мультиагентных систем
Архитектура построена на Python, OpenAI Agents SDK, Telegram Bot API, PostgreSQL и Redis. Deploy через Docker за 5 минут
GitHub репозиторий → https://github.com/pipedude/evi-run
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤓 Google выложили в опенсорс Python-библиотеку LangExtract!
Она использует LLM для извлечения сущностей, атрибутов и связей, с точной привязкой к источнику, из неструктурированных документов.
Поддержка любых LLM (Gemini, OpenAI, Ollama).
https://github.com/google/langextract
👉 Новости 👉 База вопросов
Она использует LLM для извлечения сущностей, атрибутов и связей, с точной привязкой к источнику, из неструктурированных документов.
Поддержка любых LLM (Gemini, OpenAI, Ollama).
https://github.com/google/langextract
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 Как создать новую базу данных в PostgreSQL?
B PostgreSQL новую базу данных можно создать с помощью команды SQL
👉 Новости 👉 Платформа
B PostgreSQL новую базу данных можно создать с помощью команды SQL
CREATE DATABASE имя_базы; или используя утилиту командной строки createdb имя_базы Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🤣 В Claude Code добавили два новых режима работы
1⃣ Пояснительный, когда агент объясняет свои действия шаг за шагом. Поможет разобраться, что он делает и почему. Полезно, если не хотите, чтобы после вайб-кодинга ваш проект стал для вас темным лесом.
2⃣ Обучающий, когда модель пишет код с вами пошагово, а не генерирует готовый скрипт целиком сразу. Похоже на парное программирование с ментором.
Переключить режим можно в настройках или с помощью команды /output-style. Обучающий стиль также завезли в основной чат, там он доступен всем пользователям бесплатно.
Документация
👉 Новости 👉 База вопросов
Переключить режим можно в настройках или с помощью команды /output-style. Обучающий стиль также завезли в основной чат, там он доступен всем пользователям бесплатно.
Документация
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
📞 vLLM-CLI — удобный инструмент командной строки для управления vLLM-серверами
Инструмент объединяет удобный интерфейс, профили конфигурации и мониторинг, делая работу с LLM комфортной и быстрой.
Основные возможности:
🟠 Интерактивный режим — меню прямо в терминале, не нужно запоминать длинные аргументы.
🟠 Командный режим — можно автоматизировать запуск и мониторинг серверов.
🟠 Управление моделями:
• Автоматический поиск локальных моделей.
• Поддержка загрузки моделей из Hugging Face Hub.
🟠 Профили конфигурации: встроенные варианты (`standard`,
🟠 Мониторинг сервера: просмотр загрузки GPU, памяти и логов в реальном времени.
Гитхаб
👉 Новости 👉 База вопросов
Инструмент объединяет удобный интерфейс, профили конфигурации и мониторинг, делая работу с LLM комфортной и быстрой.
Основные возможности:
• Автоматический поиск локальных моделей.
• Поддержка загрузки моделей из Hugging Face Hub.
moe_optimized, `high_throughput`) для разных сценариев, включая работу с несколькими GPU. Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 Что такое PostgreSQL каковы его основные особенности?
PostgreSQL — это мощная обьектно-реляционная система управления базами данных с открытым исходным кодом. Она поддерживает расширяемость, соответствие стандарту SQL, работу с JSON, многоверсионное управление параллелизмом (MVCC) и транзакции с ACID-свойствами.
👉 Новости 👉 Платформа
PostgreSQL — это мощная обьектно-реляционная система управления базами данных с открытым исходным кодом. Она поддерживает расширяемость, соответствие стандарту SQL, работу с JSON, многоверсионное управление параллелизмом (MVCC) и транзакции с ACID-свойствами.
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👋 Создай свою собственную модель ИИ
Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch
Недавно там появился новый раздел: Gemma 3 с нуля
Является официальным репозиторием к книге Build a Large Language Model (From Scratch).
👉 Новости 👉 База вопросов
Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch
Недавно там появился новый раздел: Gemma 3 с нуля
Является официальным репозиторием к книге Build a Large Language Model (From Scratch).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤯 Рецептивное поле в CNN, или как нейросети «видят»
В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.
Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.
👉 Новости 👉 База вопросов
В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.
Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Все недооценивают эту новую OCR-модель
dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов
🔵 Поддержка 100+ языков
🔵 Работает как с изображениями, так и с PDF
🔵 Без проблем обрабатывает текст, таблицы и формулы
Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr
👉 Новости 👉 База вопросов
dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов
Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pandas
🤔 Как выполнить итерацию по DataFrame в Pandas?
💬 Кратко:
B Pandas можно перебирать строки с помощью iterrows (), itertuples() И apply() , а столбцы - с поМоЩЬЮ items () . Однако итерация по DataFrame неэффективна, и рекомендуется использовать встроенные векторизованные функции.
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
B Pandas можно перебирать строки с помощью iterrows (), itertuples() И apply() , а столбцы - с поМоЩЬЮ items () . Однако итерация по DataFrame неэффективна, и рекомендуется использовать встроенные векторизованные функции.
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🏕 Создавайте схемы архитектур нейросетей на основе параметров
Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.
Что он предлагает:
- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения
Поддерживаются три типа диаграмм:
🔵 Полносвязные сети (FCNN)
🔵 Сверточные сети (по примеру LeNet)
🔵 Глубокие нейросети (по примеру AlexNet)
Ссылка на репо: https://github.com/alexlenail/NN-SVG
👉 Новости 👉 База вопросов
Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.
Что он предлагает:
- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения
Поддерживаются три типа диаграмм:
Ссылка на репо: https://github.com/alexlenail/NN-SVG
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🛞 Команда из DeepMind подготовила отличный материал о том, что нужно знать о работе с GPU.
🟠 Разбор архитектуры NVIDIA GPU: SM, Tensor Cores, кеши, HBM.
🟠 Сравнение GPU и TPU: гибкость против специализированной мощности.
🟠 Как устроены GPU-кластеры и коллективные коммуникации.
🟠 Roofline-анализ масштабирования LLM: data, tensor, expert, pipeline parallelism.
https://jax-ml.github.io/scaling-book/gpus/
👉 Новости 👉 База вопросов
https://jax-ml.github.io/scaling-book/gpus/
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
#новости
🛞 Neo AI выпустили агента NEO – ещё одного ML-инженера из коробки
Они называют его первым полностью автономным агентом, готовым к реальным ML-воркфлоу. По сути это не один агент, а ансамбль из 11 штук, которые делят между собой роли: от EDA до обучения, тюнинга и деплоя.
На бенчмарках результат впечатляющий. На MLE Bench от OpenAI NEO вышел на первое место: медали на 34.2% Kaggle-соревнований, против 22.4% у Microsoft RD Agent.
Под капотом у них оркестратор, который гоняет агентов через multi-step reasoning, передаёт контекст через собственный протокол и сохраняет память шагов.
Агент уже умеет в Snowflake, Databricks, BigQuery и деплой в VPC. То есть сразу нацелен на прод.
Как заявляют в компании, NEO разработан для ускорения работы ML-инженера, так что пока (наверное) ML-щики – не ВСЁ.
Вейтлист: https://heyneo.so/waitlist
👉 Новости 👉 База вопросов
Они называют его первым полностью автономным агентом, готовым к реальным ML-воркфлоу. По сути это не один агент, а ансамбль из 11 штук, которые делят между собой роли: от EDA до обучения, тюнинга и деплоя.
На бенчмарках результат впечатляющий. На MLE Bench от OpenAI NEO вышел на первое место: медали на 34.2% Kaggle-соревнований, против 22.4% у Microsoft RD Agent.
Под капотом у них оркестратор, который гоняет агентов через multi-step reasoning, передаёт контекст через собственный протокол и сохраняет память шагов.
Агент уже умеет в Snowflake, Databricks, BigQuery и деплой в VPC. То есть сразу нацелен на прод.
Как заявляют в компании, NEO разработан для ускорения работы ML-инженера, так что пока (наверное) ML-щики – не ВСЁ.
Вейтлист: https://heyneo.so/waitlist
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
#Собес #pandas
🤔 Как найти корреляцию в Pandas?
💬 Кратко:
Метод
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
Метод
DataFrame.corr() вычисляет коэффициент корреляции между всеми числовыми столбцами DataFrame. Он автоматически игнорирует пропущенные ( NaN ) и нечисловые значения. Используется для анализа взаимосвязи данных, например, в статистике или машинном обучении.📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Суммы Римана и интегралы обе преследуют цель вычислить площадь под кривой, но отличаются точностью и методом.
Сумма Римана — это приближение, при котором площадь оценивается как сумма площадей прямоугольников, расположенных под кривой. Ширина каждого прямоугольника определяется разбиением интервала, а высота берётся из значения функции в выбранной точке внутри каждого подинтервала (например, в левой границе, правой границе или середине). При увеличении числа прямоугольников точность приближения возрастает.
Интеграл же представляет собой точное значение площади под кривой и определяется как предел суммы Римана при стремлении числа прямоугольников к бесконечности и их ширины — к нулю.
Иными словами, суммы Римана — это ступени, а определённый интеграл — это конечная цель.
👉 Новости 👉 База вопросов
Сумма Римана — это приближение, при котором площадь оценивается как сумма площадей прямоугольников, расположенных под кривой. Ширина каждого прямоугольника определяется разбиением интервала, а высота берётся из значения функции в выбранной точке внутри каждого подинтервала (например, в левой границе, правой границе или середине). При увеличении числа прямоугольников точность приближения возрастает.
Интеграл же представляет собой точное значение площади под кривой и определяется как предел суммы Римана при стремлении числа прямоугольников к бесконечности и их ширины — к нулю.
Иными словами, суммы Римана — это ступени, а определённый интеграл — это конечная цель.
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
❤️🔥 Какие признаки могут указывать на то, что модель застряла в saddle point
Плато в loss не всегда значит минимум; анализ кривизны и наблюдение за динамикой обучения помогают распознать saddle points.
🟠 Плато в loss: функция потерь почти не меняется на протяжении многих итераций.
🟠 Анализ кривизны: если посмотреть на Гессиан или приблизительные вторые производные, можно заметить направления с отрицательной кривизной, где градиент ещё не ноль.
🟠 Резкий спад при адаптивных методах: использование momentum или адаптивного learning rate может внезапно снизить loss после долгого плато — это значит, что модель была в saddle region, а не в настоящем минимуме.
👉 Новости 👉 База вопросов
Плато в loss не всегда значит минимум; анализ кривизны и наблюдение за динамикой обучения помогают распознать saddle points.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
YeaHub
Главные новости и обновления платформы
YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.
Платформа: https://yeahub.ru
Для связи: @ruslan_kuyanets
YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.
Платформа: https://yeahub.ru
Для связи: @ruslan_kuyanets
❤1
#полезное
👋 NVIDIA ускорила LLM в 53 раза
Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей.
🚩 Как это работает:
Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей.
Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект.
Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием.
Hybrid Power — оставляем несколько full-attention слоёв в критичных точках, чтобы не потерять способность к сложным рассуждениям.
Результат - Jet-Nemotron:
- 2 885 токенов/с
- 47× меньше KV-кеша (всего 154 MB)
- Топовая точность при космической скорости
Почему это важно:
Для бизнеса: 53× ускорение = 98% экономии на масштабном развёртывании. ROI проектов с ИИ меняется радикально.
Для инженеров: теперь SOTA-уровень доступен даже на устройствах с ограниченной памятью.
Для исследователей: вместо миллионов на пре-трейнинг — можно создавать новые эффективные модели через архитектурные модификации.
Github
Статья
👉 Новости 👉 База вопросов
Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей.
Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей.
Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект.
Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием.
Hybrid Power — оставляем несколько full-attention слоёв в критичных точках, чтобы не потерять способность к сложным рассуждениям.
Результат - Jet-Nemotron:
- 2 885 токенов/с
- 47× меньше KV-кеша (всего 154 MB)
- Топовая точность при космической скорости
Почему это важно:
Для бизнеса: 53× ускорение = 98% экономии на масштабном развёртывании. ROI проектов с ИИ меняется радикально.
Для инженеров: теперь SOTA-уровень доступен даже на устройствах с ограниченной памятью.
Для исследователей: вместо миллионов на пре-трейнинг — можно создавать новые эффективные модели через архитектурные модификации.
Github
Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1