DS & ML | YeaHub – Telegram
DS & ML | YeaHub
467 subscribers
259 photos
67 videos
371 links
Теория, подготовка к интервью и курсы для Data Science специалистов

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets
Download Telegram
#полезное
😬 Каждый повторный вызов LLM — это просто сжигание денег

Обычный кэш тут не поможет, если только промпт не совпадает дословно.

Redis 8 меняет правила игры с семантическим кэшированием, которое понимает смысл, а не только ключ.

LangCache + Vector Sets + Redis Flex = быстрее, дешевле, умнее

Полный разбор:
https://newsletter.systemdesignclassroom.com/p/every-repeated-llm-call-is-money-on-fire

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😎 Фреймворк для создания мультиагентных AI-систем в Telegram, готовый к запуску с минимальными настройками

evi-run подходит для создания AI-ассистентов, виртуальных персонажей, автоматизированной службы поддержки, аналитиков данных, торговых агентов на DEX и других кастомных мультиагентных систем

Архитектура построена на Python, OpenAI Agents SDK, Telegram Bot API, PostgreSQL и Redis. Deploy через Docker за 5 минут

GitHub репозиторий → https://github.com/pipedude/evi-run

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤓 Google выложили в опенсорс Python-библиотеку LangExtract!

Она использует LLM для извлечения сущностей, атрибутов и связей, с точной привязкой к источнику, из неструктурированных документов.

Поддержка любых LLM (Gemini, OpenAI, Ollama).

https://github.com/google/langextract

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 Как создать новую базу данных в PostgreSQL?

B PostgreSQL новую базу данных можно создать с помощью команды SQL CREATE DATABASE имя_базы; или используя утилиту командной строки createdb имя_базы

👉Новости 👉Платформа
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🤣 В Claude Code добавили два новых режима работы

1⃣ Пояснительный, когда агент объясняет свои действия шаг за шагом. Поможет разобраться, что он делает и почему. Полезно, если не хотите, чтобы после вайб-кодинга ваш проект стал для вас темным лесом.

2⃣ Обучающий, когда модель пишет код с вами пошагово, а не генерирует готовый скрипт целиком сразу. Похоже на парное программирование с ментором.

Переключить режим можно в настройках или с помощью команды /output-style. Обучающий стиль также завезли в основной чат, там он доступен всем пользователям бесплатно.
Документация

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1
#полезное
📞 vLLM-CLI — удобный инструмент командной строки для управления vLLM-серверами

Инструмент объединяет удобный интерфейс, профили конфигурации и мониторинг, делая работу с LLM комфортной и быстрой.

Основные возможности:
🟠 Интерактивный режим — меню прямо в терминале, не нужно запоминать длинные аргументы.
🟠 Командный режим — можно автоматизировать запуск и мониторинг серверов.
🟠 Управление моделями:
• Автоматический поиск локальных моделей.
• Поддержка загрузки моделей из Hugging Face Hub.
🟠 Профили конфигурации: встроенные варианты (`standard`, moe_optimized, `high_throughput`) для разных сценариев, включая работу с несколькими GPU.
🟠 Мониторинг сервера: просмотр загрузки GPU, памяти и логов в реальном времени.
Гитхаб

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 Что такое PostgreSQL каковы его основные особенности?

PostgreSQL — это мощная обьектно-реляционная система управления базами данных с открытым исходным кодом. Она поддерживает расширяемость, соответствие стандарту SQL, работу с JSON, многоверсионное управление параллелизмом (MVCC) и транзакции с ACID-свойствами.

👉Новости 👉Платформа
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👋 Создай свою собственную модель ИИ

Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch

Недавно там появился новый раздел: Gemma 3 с нуля

Является официальным репозиторием к книге Build a Large Language Model (From Scratch).

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤯 Рецептивное поле в CNN, или как нейросети «видят»

В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.

Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Все недооценивают эту новую OCR-модель

dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов

🔵 Поддержка 100+ языков

🔵 Работает как с изображениями, так и с PDF

🔵 Без проблем обрабатывает текст, таблицы и формулы

Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pandas
🤔 Как выполнить итерацию по DataFrame в Pandas?

💬 Кратко:
B Pandas можно перебирать строки с помощью iterrows (), itertuples() И apply() , а столбцы - с поМоЩЬЮ items () . Однако итерация по DataFrame неэффективна, и рекомендуется использовать встроенные векторизованные функции.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🏕 Создавайте схемы архитектур нейросетей на основе параметров

Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.

Что он предлагает:

- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения

Поддерживаются три типа диаграмм:

🔵 Полносвязные сети (FCNN)
🔵 Сверточные сети (по примеру LeNet)
🔵 Глубокие нейросети (по примеру AlexNet)

Ссылка на репо: https://github.com/alexlenail/NN-SVG

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🛞 Команда из DeepMind подготовила отличный материал о том, что нужно знать о работе с GPU.

🟠 Разбор архитектуры NVIDIA GPU: SM, Tensor Cores, кеши, HBM.
🟠 Сравнение GPU и TPU: гибкость против специализированной мощности.
🟠 Как устроены GPU-кластеры и коллективные коммуникации.
🟠 Roofline-анализ масштабирования LLM: data, tensor, expert, pipeline parallelism.

https://jax-ml.github.io/scaling-book/gpus/

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
#новости
🛞 Neo AI выпустили агента NEO – ещё одного ML-инженера из коробки

Они называют его первым полностью автономным агентом, готовым к реальным ML-воркфлоу. По сути это не один агент, а ансамбль из 11 штук, которые делят между собой роли: от EDA до обучения, тюнинга и деплоя.

На бенчмарках результат впечатляющий. На MLE Bench от OpenAI NEO вышел на первое место: медали на 34.2% Kaggle-соревнований, против 22.4% у Microsoft RD Agent.

Под капотом у них оркестратор, который гоняет агентов через multi-step reasoning, передаёт контекст через собственный протокол и сохраняет память шагов.

Агент уже умеет в Snowflake, Databricks, BigQuery и деплой в VPC. То есть сразу нацелен на прод.

Как заявляют в компании, NEO разработан для ускорения работы ML-инженера, так что пока (наверное) ML-щики – не ВСЁ.

Вейтлист: https://heyneo.so/waitlist

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
#Собес #pandas
🤔 Как найти корреляцию в Pandas?

💬 Кратко:
Метод DataFrame.corr() вычисляет коэффициент корреляции между всеми числовыми столбцами DataFrame. Он автоматически игнорирует пропущенные ( NaN ) и нечисловые значения. Используется для анализа взаимосвязи данных, например, в статистике или машинном обучении.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
1
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Суммы Римана и интегралы обе преследуют цель вычислить площадь под кривой, но отличаются точностью и методом.
Сумма Римана — это приближение, при котором площадь оценивается как сумма площадей прямоугольников, расположенных под кривой. Ширина каждого прямоугольника определяется разбиением интервала, а высота берётся из значения функции в выбранной точке внутри каждого подинтервала (например, в левой границе, правой границе или середине). При увеличении числа прямоугольников точность приближения возрастает.

Интеграл же представляет собой точное значение площади под кривой и определяется как предел суммы Римана при стремлении числа прямоугольников к бесконечности и их ширины — к нулю.
Иными словами, суммы Римана — это ступени, а определённый интеграл — это конечная цель.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
❤️‍🔥 Какие признаки могут указывать на то, что модель застряла в saddle point

Плато в loss не всегда значит минимум; анализ кривизны и наблюдение за динамикой обучения помогают распознать saddle points.

🟠 Плато в loss: функция потерь почти не меняется на протяжении многих итераций.

🟠 Анализ кривизны: если посмотреть на Гессиан или приблизительные вторые производные, можно заметить направления с отрицательной кривизной, где градиент ещё не ноль.

🟠 Резкий спад при адаптивных методах: использование momentum или адаптивного learning rate может внезапно снизить loss после долгого плато — это значит, что модель была в saddle region, а не в настоящем минимуме.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
1
#полезное
👋 NVIDIA ускорила LLM в 53 раза

Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей.

🚩 Как это работает:
Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей.

Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект.

Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием.

Hybrid Power — оставляем несколько full-attention слоёв в критичных точках, чтобы не потерять способность к сложным рассуждениям.

Результат - Jet-Nemotron:

- 2 885 токенов/с

- 47× меньше KV-кеша (всего 154 MB)

- Топовая точность при космической скорости

Почему это важно:

Для бизнеса: 53× ускорение = 98% экономии на масштабном развёртывании. ROI проектов с ИИ меняется радикально.

Для инженеров: теперь SOTA-уровень доступен даже на устройствах с ограниченной памятью.

Для исследователей: вместо миллионов на пре-трейнинг — можно создавать новые эффективные модели через архитектурные модификации.

Github
Статья

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1