#полезное
👋 Создай свою собственную модель ИИ
Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch
Недавно там появился новый раздел: Gemma 3 с нуля
Является официальным репозиторием к книге Build a Large Language Model (From Scratch).
👉 Новости 👉 База вопросов
Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch
Недавно там появился новый раздел: Gemma 3 с нуля
Является официальным репозиторием к книге Build a Large Language Model (From Scratch).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤯 Рецептивное поле в CNN, или как нейросети «видят»
В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.
Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.
👉 Новости 👉 База вопросов
В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.
Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Все недооценивают эту новую OCR-модель
dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов
🔵 Поддержка 100+ языков
🔵 Работает как с изображениями, так и с PDF
🔵 Без проблем обрабатывает текст, таблицы и формулы
Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr
👉 Новости 👉 База вопросов
dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов
Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pandas
🤔 Как выполнить итерацию по DataFrame в Pandas?
💬 Кратко:
B Pandas можно перебирать строки с помощью iterrows (), itertuples() И apply() , а столбцы - с поМоЩЬЮ items () . Однако итерация по DataFrame неэффективна, и рекомендуется использовать встроенные векторизованные функции.
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
B Pandas можно перебирать строки с помощью iterrows (), itertuples() И apply() , а столбцы - с поМоЩЬЮ items () . Однако итерация по DataFrame неэффективна, и рекомендуется использовать встроенные векторизованные функции.
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🏕 Создавайте схемы архитектур нейросетей на основе параметров
Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.
Что он предлагает:
- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения
Поддерживаются три типа диаграмм:
🔵 Полносвязные сети (FCNN)
🔵 Сверточные сети (по примеру LeNet)
🔵 Глубокие нейросети (по примеру AlexNet)
Ссылка на репо: https://github.com/alexlenail/NN-SVG
👉 Новости 👉 База вопросов
Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.
Что он предлагает:
- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения
Поддерживаются три типа диаграмм:
Ссылка на репо: https://github.com/alexlenail/NN-SVG
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🛞 Команда из DeepMind подготовила отличный материал о том, что нужно знать о работе с GPU.
🟠 Разбор архитектуры NVIDIA GPU: SM, Tensor Cores, кеши, HBM.
🟠 Сравнение GPU и TPU: гибкость против специализированной мощности.
🟠 Как устроены GPU-кластеры и коллективные коммуникации.
🟠 Roofline-анализ масштабирования LLM: data, tensor, expert, pipeline parallelism.
https://jax-ml.github.io/scaling-book/gpus/
👉 Новости 👉 База вопросов
https://jax-ml.github.io/scaling-book/gpus/
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
#новости
🛞 Neo AI выпустили агента NEO – ещё одного ML-инженера из коробки
Они называют его первым полностью автономным агентом, готовым к реальным ML-воркфлоу. По сути это не один агент, а ансамбль из 11 штук, которые делят между собой роли: от EDA до обучения, тюнинга и деплоя.
На бенчмарках результат впечатляющий. На MLE Bench от OpenAI NEO вышел на первое место: медали на 34.2% Kaggle-соревнований, против 22.4% у Microsoft RD Agent.
Под капотом у них оркестратор, который гоняет агентов через multi-step reasoning, передаёт контекст через собственный протокол и сохраняет память шагов.
Агент уже умеет в Snowflake, Databricks, BigQuery и деплой в VPC. То есть сразу нацелен на прод.
Как заявляют в компании, NEO разработан для ускорения работы ML-инженера, так что пока (наверное) ML-щики – не ВСЁ.
Вейтлист: https://heyneo.so/waitlist
👉 Новости 👉 База вопросов
Они называют его первым полностью автономным агентом, готовым к реальным ML-воркфлоу. По сути это не один агент, а ансамбль из 11 штук, которые делят между собой роли: от EDA до обучения, тюнинга и деплоя.
На бенчмарках результат впечатляющий. На MLE Bench от OpenAI NEO вышел на первое место: медали на 34.2% Kaggle-соревнований, против 22.4% у Microsoft RD Agent.
Под капотом у них оркестратор, который гоняет агентов через multi-step reasoning, передаёт контекст через собственный протокол и сохраняет память шагов.
Агент уже умеет в Snowflake, Databricks, BigQuery и деплой в VPC. То есть сразу нацелен на прод.
Как заявляют в компании, NEO разработан для ускорения работы ML-инженера, так что пока (наверное) ML-щики – не ВСЁ.
Вейтлист: https://heyneo.so/waitlist
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
#Собес #pandas
🤔 Как найти корреляцию в Pandas?
💬 Кратко:
Метод
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
Метод
DataFrame.corr() вычисляет коэффициент корреляции между всеми числовыми столбцами DataFrame. Он автоматически игнорирует пропущенные ( NaN ) и нечисловые значения. Используется для анализа взаимосвязи данных, например, в статистике или машинном обучении.📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Суммы Римана и интегралы обе преследуют цель вычислить площадь под кривой, но отличаются точностью и методом.
Сумма Римана — это приближение, при котором площадь оценивается как сумма площадей прямоугольников, расположенных под кривой. Ширина каждого прямоугольника определяется разбиением интервала, а высота берётся из значения функции в выбранной точке внутри каждого подинтервала (например, в левой границе, правой границе или середине). При увеличении числа прямоугольников точность приближения возрастает.
Интеграл же представляет собой точное значение площади под кривой и определяется как предел суммы Римана при стремлении числа прямоугольников к бесконечности и их ширины — к нулю.
Иными словами, суммы Римана — это ступени, а определённый интеграл — это конечная цель.
👉 Новости 👉 База вопросов
Сумма Римана — это приближение, при котором площадь оценивается как сумма площадей прямоугольников, расположенных под кривой. Ширина каждого прямоугольника определяется разбиением интервала, а высота берётся из значения функции в выбранной точке внутри каждого подинтервала (например, в левой границе, правой границе или середине). При увеличении числа прямоугольников точность приближения возрастает.
Интеграл же представляет собой точное значение площади под кривой и определяется как предел суммы Римана при стремлении числа прямоугольников к бесконечности и их ширины — к нулю.
Иными словами, суммы Римана — это ступени, а определённый интеграл — это конечная цель.
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
❤️🔥 Какие признаки могут указывать на то, что модель застряла в saddle point
Плато в loss не всегда значит минимум; анализ кривизны и наблюдение за динамикой обучения помогают распознать saddle points.
🟠 Плато в loss: функция потерь почти не меняется на протяжении многих итераций.
🟠 Анализ кривизны: если посмотреть на Гессиан или приблизительные вторые производные, можно заметить направления с отрицательной кривизной, где градиент ещё не ноль.
🟠 Резкий спад при адаптивных методах: использование momentum или адаптивного learning rate может внезапно снизить loss после долгого плато — это значит, что модель была в saddle region, а не в настоящем минимуме.
👉 Новости 👉 База вопросов
Плато в loss не всегда значит минимум; анализ кривизны и наблюдение за динамикой обучения помогают распознать saddle points.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
YeaHub
Главные новости и обновления платформы
YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.
Платформа: https://yeahub.ru
Для связи: @ruslan_kuyanets
YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.
Платформа: https://yeahub.ru
Для связи: @ruslan_kuyanets
❤1
#полезное
👋 NVIDIA ускорила LLM в 53 раза
Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей.
🚩 Как это работает:
Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей.
Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект.
Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием.
Hybrid Power — оставляем несколько full-attention слоёв в критичных точках, чтобы не потерять способность к сложным рассуждениям.
Результат - Jet-Nemotron:
- 2 885 токенов/с
- 47× меньше KV-кеша (всего 154 MB)
- Топовая точность при космической скорости
Почему это важно:
Для бизнеса: 53× ускорение = 98% экономии на масштабном развёртывании. ROI проектов с ИИ меняется радикально.
Для инженеров: теперь SOTA-уровень доступен даже на устройствах с ограниченной памятью.
Для исследователей: вместо миллионов на пре-трейнинг — можно создавать новые эффективные модели через архитектурные модификации.
Github
Статья
👉 Новости 👉 База вопросов
Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей.
Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей.
Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект.
Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием.
Hybrid Power — оставляем несколько full-attention слоёв в критичных точках, чтобы не потерять способность к сложным рассуждениям.
Результат - Jet-Nemotron:
- 2 885 токенов/с
- 47× меньше KV-кеша (всего 154 MB)
- Топовая точность при космической скорости
Почему это важно:
Для бизнеса: 53× ускорение = 98% экономии на масштабном развёртывании. ROI проектов с ИИ меняется радикально.
Для инженеров: теперь SOTA-уровень доступен даже на устройствах с ограниченной памятью.
Для исследователей: вместо миллионов на пре-трейнинг — можно создавать новые эффективные модели через архитектурные модификации.
Github
Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#Собес #pandas
🤔 Как установить индекс в Pandas DataFrame?
💬 Кратко:
Метод
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
Метод
set_index() позволяет сделать столбец, Series или список индексом DataFrame. Он также поддерживает множественные индексы.📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😎 Получайте RAG-ready данные из любого неструктурированного файла
Tensorlake преобразует неструктурированные документы в RAG-ready данные в несколько строк кода. Возвращает layout документа, структурированное извлечение, bounding boxes и т. д.
Работает с любым сложным layout, рукописными документами и многоязычными данными
Гитхаб
👉 Новости 👉 База вопросов
Tensorlake преобразует неструктурированные документы в RAG-ready данные в несколько строк кода. Возвращает layout документа, структурированное извлечение, bounding boxes и т. д.
Работает с любым сложным layout, рукописными документами и многоязычными данными
Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
#видео
🤓 Этот YouTube-канал - настоящая сокровищница для понимания концепций машинного обучения.
Ссылка
👉 Новости 👉 База вопросов
Ссылка
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#полезное
😐 Kubechecks позволяет пользователям GitHub и GitLab точно видеть, какие изменения повлияют на их текущие деплойменты в ArgoCD, и автоматически запускать различные наборы тестов на соответствие перед мёрджем.
Забираем на GitHub
👉 Новости 👉 База вопросов
Забираем на GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pandas
🤔 Как удалить индекс, строку или столбец из существующего DataFrame?
💬 Кратко:
🟠 Удаление индекса выполняется через
🟠 Удаление строки осуществляется с помощью
🟠 Удаление столбца выполняется через
📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
💬 Кратко:
reset_index() df.drop (index) df.drop(columns, axis=1) 📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM