#полезное
❤️🔥 Какие признаки могут указывать на то, что модель застряла в saddle point
Плато в loss не всегда значит минимум; анализ кривизны и наблюдение за динамикой обучения помогают распознать saddle points.
🟠 Плато в loss: функция потерь почти не меняется на протяжении многих итераций.
🟠 Анализ кривизны: если посмотреть на Гессиан или приблизительные вторые производные, можно заметить направления с отрицательной кривизной, где градиент ещё не ноль.
🟠 Резкий спад при адаптивных методах: использование momentum или адаптивного learning rate может внезапно снизить loss после долгого плато — это значит, что модель была в saddle region, а не в настоящем минимуме.
👉 Новости 👉 База вопросов
Плато в loss не всегда значит минимум; анализ кривизны и наблюдение за динамикой обучения помогают распознать saddle points.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
YeaHub
Главные новости и обновления платформы
YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.
Платформа: https://yeahub.ru
Для связи: @ruslan_kuyanets
YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.
Платформа: https://yeahub.ru
Для связи: @ruslan_kuyanets
❤1
#полезное
👋 NVIDIA ускорила LLM в 53 раза
Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей.
🚩 Как это работает:
Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей.
Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект.
Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием.
Hybrid Power — оставляем несколько full-attention слоёв в критичных точках, чтобы не потерять способность к сложным рассуждениям.
Результат - Jet-Nemotron:
- 2 885 токенов/с
- 47× меньше KV-кеша (всего 154 MB)
- Топовая точность при космической скорости
Почему это важно:
Для бизнеса: 53× ускорение = 98% экономии на масштабном развёртывании. ROI проектов с ИИ меняется радикально.
Для инженеров: теперь SOTA-уровень доступен даже на устройствах с ограниченной памятью.
Для исследователей: вместо миллионов на пре-трейнинг — можно создавать новые эффективные модели через архитектурные модификации.
Github
Статья
👉 Новости 👉 База вопросов
Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей.
Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей.
Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект.
Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием.
Hybrid Power — оставляем несколько full-attention слоёв в критичных точках, чтобы не потерять способность к сложным рассуждениям.
Результат - Jet-Nemotron:
- 2 885 токенов/с
- 47× меньше KV-кеша (всего 154 MB)
- Топовая точность при космической скорости
Почему это важно:
Для бизнеса: 53× ускорение = 98% экономии на масштабном развёртывании. ROI проектов с ИИ меняется радикально.
Для инженеров: теперь SOTA-уровень доступен даже на устройствах с ограниченной памятью.
Для исследователей: вместо миллионов на пре-трейнинг — можно создавать новые эффективные модели через архитектурные модификации.
Github
Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#Собес #pandas
🤔 Как установить индекс в Pandas DataFrame?
💬 Кратко:
Метод
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
Метод
set_index() позволяет сделать столбец, Series или список индексом DataFrame. Он также поддерживает множественные индексы.📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😎 Получайте RAG-ready данные из любого неструктурированного файла
Tensorlake преобразует неструктурированные документы в RAG-ready данные в несколько строк кода. Возвращает layout документа, структурированное извлечение, bounding boxes и т. д.
Работает с любым сложным layout, рукописными документами и многоязычными данными
Гитхаб
👉 Новости 👉 База вопросов
Tensorlake преобразует неструктурированные документы в RAG-ready данные в несколько строк кода. Возвращает layout документа, структурированное извлечение, bounding boxes и т. д.
Работает с любым сложным layout, рукописными документами и многоязычными данными
Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
#видео
🤓 Этот YouTube-канал - настоящая сокровищница для понимания концепций машинного обучения.
Ссылка
👉 Новости 👉 База вопросов
Ссылка
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#полезное
😐 Kubechecks позволяет пользователям GitHub и GitLab точно видеть, какие изменения повлияют на их текущие деплойменты в ArgoCD, и автоматически запускать различные наборы тестов на соответствие перед мёрджем.
Забираем на GitHub
👉 Новости 👉 База вопросов
Забираем на GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pandas
🤔 Как удалить индекс, строку или столбец из существующего DataFrame?
💬 Кратко:
🟠 Удаление индекса выполняется через
🟠 Удаление строки осуществляется с помощью
🟠 Удаление столбца выполняется через
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
reset_index() df.drop (index) df.drop(columns, axis=1) 📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🤯 Dolphin — превращает PDF в структурированные данные
Dolphin (Document Image Parsing via Heterogeneous Anchor Prompting) — 100% open source-модель для автоматического разбора PDF и сканов.
Зачем нужен:
— Конвертирует документы в готовые форматы: Markdown, HTML, LaTeX, JSON.
— Извлекает текст, таблицы, формулы и изображения.
— Полезен как для подготовки данных для LLM, так и для любых автоматизированных систем, архивов, поиска и аналитики.
Как работает:
1⃣ Анализ макета страницы — определяет все элементы в естественном порядке чтения.
2⃣ Параллельный парсинг — с «якорями» и промптами под каждый тип контента.
Лёгкая архитектура + параллельная обработка = высокая скорость без потери качества.
Репозиторий с кодом и моделями: https://clc.to/6gPIwA
👉 Новости 👉 База вопросов
Dolphin (Document Image Parsing via Heterogeneous Anchor Prompting) — 100% open source-модель для автоматического разбора PDF и сканов.
Зачем нужен:
— Конвертирует документы в готовые форматы: Markdown, HTML, LaTeX, JSON.
— Извлекает текст, таблицы, формулы и изображения.
— Полезен как для подготовки данных для LLM, так и для любых автоматизированных систем, архивов, поиска и аналитики.
Как работает:
Представьте, что у вас есть 500 отчётов в PDF с финансовыми таблицами и графиками. Dolphin превращает их в аккуратный CSV или JSON, готовый для анализа в Pandas или загрузки в базу данных — без ручного копипаста и правок.
Лёгкая архитектура + параллельная обработка = высокая скорость без потери качества.
Репозиторий с кодом и моделями: https://clc.to/6gPIwA
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😐 Деплойте AI-приложения, просто добавив Python-декоратор
Beam — опенсорс альтернатива Modal для деплоя серверлесс AI-нагрузок.
Просто выполните
https://github.com/beam-cloud/beta9
👉 Новости 👉 База вопросов
Beam — опенсорс альтернатива Modal для деплоя серверлесс AI-нагрузок.
Просто выполните
uv add beam-client, добавьте декоратор и превратите любой воркфлоу в серверлесс-эндпоинтhttps://github.com/beam-cloud/beta9
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😬 Понимание LLM с нуля
Статья с нуля и на арифметике уровня средней школы объясняет, как работают LLM: от ручной «генеративки на бумаге» до современной архитектуры Transformer
Читаем здесь
👉 Новости 👉 База вопросов
Статья с нуля и на арифметике уровня средней школы объясняет, как работают LLM: от ручной «генеративки на бумаге» до современной архитектуры Transformer
Читаем здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pandas
🤔 Как добавить индекс, строку или столбец в существующий DataFrame?
💬 Кратко:
🟠 Добавление индекса выполняется через
🟠 Добавление строк можно сделать с помощью
🟠 Добавление столбцов осуществляется через присвоение
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
set_index() , позволяя установить столбец, список или Series в качестве индекса.df.loc[], передав индекс и значения, или через pd.concat() , объединяя несколько DataFrame.df[ 'column_name'] = values , а также методами df.insert() и df.assign() 📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😬 Redis полезен не только для кэширования.
С его помощью можно реализовать базовый Pub/Sub механизм.
Если ты когда-нибудь писал распределенные системы или микросервисы в dotnet, наверняка сталкивался с проблемой синхронизации сервисов.
Нужно как-то уведомлять другие сервисы о событиях, сбрасывать кэш или слать обновления на дашборд в реальном времени, а значит без механизма обмена сообщениями не обойтись.
RabbitMQ и Kafka отлично подходят для сложных сценариев, но иногда достаточно чего-то простого, быстрого и уже встроенного в стек. Здесь пригодится Redis Pub/Sub.
Эта встроенная возможность Redis позволяет сервисам отправлять и получать сообщения через именованные каналы. Publisher пишет сообщение в канал, а Subscriber слушает его и сразу обрабатывает входящие данные.
Работает это быстро, не требует хранения сообщений и практически не нагружает систему. Хорошо подходит для задач в реальном времени, где потеря пары сообщений не критична.
Например, для обновления интерфейсов в реальном времени, для инвалидации кэша между сервисами или для передачи сигналов между приложениями.
Пример реализации: https://thecodeman.net/posts/messaging-in-dotnet-with-redis
👉 Новости 👉 База вопросов
С его помощью можно реализовать базовый Pub/Sub механизм.
Если ты когда-нибудь писал распределенные системы или микросервисы в dotnet, наверняка сталкивался с проблемой синхронизации сервисов.
Нужно как-то уведомлять другие сервисы о событиях, сбрасывать кэш или слать обновления на дашборд в реальном времени, а значит без механизма обмена сообщениями не обойтись.
RabbitMQ и Kafka отлично подходят для сложных сценариев, но иногда достаточно чего-то простого, быстрого и уже встроенного в стек. Здесь пригодится Redis Pub/Sub.
Эта встроенная возможность Redis позволяет сервисам отправлять и получать сообщения через именованные каналы. Publisher пишет сообщение в канал, а Subscriber слушает его и сразу обрабатывает входящие данные.
Работает это быстро, не требует хранения сообщений и практически не нагружает систему. Хорошо подходит для задач в реальном времени, где потеря пары сообщений не критична.
Например, для обновления интерфейсов в реальном времени, для инвалидации кэша между сервисами или для передачи сигналов между приложениями.
Пример реализации: https://thecodeman.net/posts/messaging-in-dotnet-with-redis
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👋 OpenAI покупает стартап Statsig за $1.1 млрд
Что делает Statsig:
Инструменты для A/B-тестов и аналитики → можно сравнивать версии продукта, смотреть поведение пользователей и быстро выкатывать/откатывать изменения.
Зачем OpenAI:
Теперь они смогут тестировать LLM-фичи (промпты, фильтры, задержки, цену) на реальных данных и управлять обновлениями автоматически.
Основатель Виджай Раджи станет CTO приложений в OpenAI.
Контекст:
🔵 Это одна из крупнейших покупок компании
🔵 В 2025 OpenAI уже привлекла $40 млрд и обсуждает новую сделку, которая может поднять оценку до $500 млрд
🔵 Ранее купили AI-стартап Джони Айва ($6.5 млрд), но сделка с Windsurf ($3 млрд) сорвалась
theverge.com/openai/769325/openai-statsig-acquisition-executive-moves
👉 Новости 👉 База вопросов
Что делает Statsig:
Инструменты для A/B-тестов и аналитики → можно сравнивать версии продукта, смотреть поведение пользователей и быстро выкатывать/откатывать изменения.
Зачем OpenAI:
Теперь они смогут тестировать LLM-фичи (промпты, фильтры, задержки, цену) на реальных данных и управлять обновлениями автоматически.
Основатель Виджай Раджи станет CTO приложений в OpenAI.
Контекст:
theverge.com/openai/769325/openai-statsig-acquisition-executive-moves
Please open Telegram to view this post
VIEW IN TELEGRAM