NEW BOT Телеграм, страница - 794172983

DS & ML | YeaHub

@yeahub_data_science

467 subscribers

259 photos

67 videos

371 links

Теория, подготовка к интервью и курсы для Data Science специалистов

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets

Download Telegram

About

Blog

Apps

Platform

DS & ML | YeaHub

467 subscribers

DS & ML | YeaHub

#полезное

😬

Каждый повторный вызов LLM — это просто сжигание денег

Обычный кэш тут не поможет, если только промпт не совпадает дословно.

Redis 8 меняет правила игры с семантическим кэшированием, которое понимает смысл, а не только ключ.

LangCache + Vector Sets + Redis Flex = быстрее, дешевле, умнее

Полный разбор:
https://newsletter.systemdesignclassroom.com/p/every-repeated-llm-call-is-money-on-fire

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

123 views15:03

DS & ML | YeaHub

#полезное

😎

Фреймворк для создания мультиагентных AI-систем в Telegram, готовый к запуску с минимальными настройками

evi-run подходит для создания AI-ассистентов, виртуальных персонажей, автоматизированной службы поддержки, аналитиков данных, торговых агентов на DEX и других кастомных мультиагентных систем

Архитектура построена на Python, OpenAI Agents SDK, Telegram Bot API, PostgreSQL и Redis. Deploy через Docker за 5 минут

GitHub репозиторий → https://github.com/pipedude/evi-run

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

126 views08:04

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

#полезное

🤓

Google выложили в опенсорс Python-библиотеку LangExtract!

Она использует LLM для извлечения сущностей, атрибутов и связей, с точной привязкой к источнику, из неструктурированных документов.

Поддержка любых LLM (Gemini, OpenAI, Ollama).

https://github.com/google/langextract

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

137 views15:01

DS & ML | YeaHub

#Собес #postgres

🤔

Как создать новую базу данных в PostgreSQL?

B PostgreSQL новую базу данных можно создать с помощью команды SQL CREATE DATABASE имя_базы; или используя утилиту командной строки createdb имя_базы

👉

👉

Платформа

Please open Telegram to view this post

VIEW IN TELEGRAM

110 views08:00

DS & ML | YeaHub

#полезное

🤣

В Claude Code добавили два новых режима работы

1⃣

Пояснительный, когда агент объясняет свои действия шаг за шагом. Поможет разобраться, что он делает и почему. Полезно, если не хотите, чтобы после вайб-кодинга ваш проект стал для вас темным лесом.

2⃣

Обучающий, когда модель пишет код с вами пошагово, а не генерирует готовый скрипт целиком сразу. Похоже на парное программирование с ментором.

Переключить режим можно в настройках или с помощью команды /output-style. Обучающий стиль также завезли в основной чат, там он доступен всем пользователям бесплатно.
Документация

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥1

113 views15:00

DS & ML | YeaHub

#полезное

👨‍💻

Поостроение веб-поисковика с нуля за два месяца с 3 миллиардами нейронных эмбеддингов

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

107 views08:02

DS & ML | YeaHub

#полезное

📞

vLLM-CLI — удобный инструмент командной строки для управления vLLM-серверами

Инструмент объединяет удобный интерфейс, профили конфигурации и мониторинг, делая работу с LLM комфортной и быстрой.

Основные возможности:
🟠 Интерактивный режим — меню прямо в терминале, не нужно запоминать длинные аргументы.
🟠 Командный режим — можно автоматизировать запуск и мониторинг серверов.
🟠 Управление моделями:
• Автоматический поиск локальных моделей.
• Поддержка загрузки моделей из Hugging Face Hub.
🟠 Профили конфигурации: встроенные варианты (`standard`, moe_optimized, `high_throughput`) для разных сценариев, включая работу с несколькими GPU.
🟠 Мониторинг сервера: просмотр загрузки GPU, памяти и логов в реальном времени.
Гитхаб

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

149 views15:01

DS & ML | YeaHub

#Собес #postgres

🤔

Что такое PostgreSQL каковы его основные особенности?

PostgreSQL — это мощная обьектно-реляционная система управления базами данных с открытым исходным кодом. Она поддерживает расширяемость, соответствие стандарту SQL, работу с JSON, многоверсионное управление параллелизмом (MVCC) и транзакции с ACID-свойствами.

👉

👉

Платформа

Please open Telegram to view this post

VIEW IN TELEGRAM

120 views08:05

DS & ML | YeaHub

#полезное

👋

Создай свою собственную модель ИИ

Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch

Недавно там появился новый раздел: Gemma 3 с нуля

Является официальным репозиторием к книге Build a Large Language Model (From Scratch).

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

129 views15:05

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

#полезное

🤯

Рецептивное поле в CNN, или как нейросети «видят»

В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.

Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

113 views08:02

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

#полезное

😱

Все недооценивают эту новую OCR-модель

dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов

🔵 Поддержка 100+ языков

🔵 Работает как с изображениями, так и с PDF

🔵 Без проблем обрабатывает текст, таблицы и формулы

Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

124 views15:04

DS & ML | YeaHub

#Собес #pandas

🤔

Как выполнить итерацию по DataFrame в Pandas?

💬 Кратко:
B Pandas можно перебирать строки с помощью iterrows (), itertuples() И apply() , а столбцы - с поМоЩЬЮ items () . Однако итерация по DataFrame неэффективна, и рекомендуется использовать встроенные векторизованные функции.

📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал

Please open Telegram to view this post

VIEW IN TELEGRAM

112 views07:52

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

#полезное

🏕

Создавайте схемы архитектур нейросетей на основе параметров

Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.

Что он предлагает:

- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения

Поддерживаются три типа диаграмм:

🔵 Полносвязные сети (FCNN)
🔵 Сверточные сети (по примеру LeNet)
🔵 Глубокие нейросети (по примеру AlexNet)

Ссылка на репо: https://github.com/alexlenail/NN-SVG

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

135 views15:03

DS & ML | YeaHub

#полезное

🛞

Команда из DeepMind подготовила отличный материал о том, что нужно знать о работе с GPU.

🟠 Разбор архитектуры NVIDIA GPU: SM, Tensor Cores, кеши, HBM.
🟠 Сравнение GPU и TPU: гибкость против специализированной мощности.
🟠 Как устроены GPU-кластеры и коллективные коммуникации.
🟠 Roofline-анализ масштабирования LLM: data, tensor, expert, pipeline parallelism.

https://jax-ml.github.io/scaling-book/gpus/

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

139 views08:00

DS & ML | YeaHub

Media is too big

VIEW IN TELEGRAM

#новости

🛞

Neo AI выпустили агента NEO – ещё одного ML-инженера из коробки

Они называют его первым полностью автономным агентом, готовым к реальным ML-воркфлоу. По сути это не один агент, а ансамбль из 11 штук, которые делят между собой роли: от EDA до обучения, тюнинга и деплоя.

На бенчмарках результат впечатляющий. На MLE Bench от OpenAI NEO вышел на первое место: медали на 34.2% Kaggle-соревнований, против 22.4% у Microsoft RD Agent.

Под капотом у них оркестратор, который гоняет агентов через multi-step reasoning, передаёт контекст через собственный протокол и сохраняет память шагов.

Агент уже умеет в Snowflake, Databricks, BigQuery и деплой в VPC. То есть сразу нацелен на прод.

Как заявляют в компании, NEO разработан для ускорения работы ML-инженера, так что пока (наверное) ML-щики – не ВСЁ.

Вейтлист: https://heyneo.so/waitlist

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

154 views15:00

DS & ML | YeaHub

#Собес #pandas

🤔

Как найти корреляцию в Pandas?

💬 Кратко:
Метод DataFrame.corr() вычисляет коэффициент корреляции между всеми числовыми столбцами DataFrame. Он автоматически игнорирует пропущенные ( NaN ) и нечисловые значения. Используется для анализа взаимосвязи данных, например, в статистике или машинном обучении.

📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

137 views07:52

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

#полезное

😱

Суммы Римана и интегралы обе преследуют цель вычислить площадь под кривой, но отличаются точностью и методом.
Сумма Римана — это приближение, при котором площадь оценивается как сумма площадей прямоугольников, расположенных под кривой. Ширина каждого прямоугольника определяется разбиением интервала, а высота берётся из значения функции в выбранной точке внутри каждого подинтервала (например, в левой границе, правой границе или середине). При увеличении числа прямоугольников точность приближения возрастает.

Интеграл же представляет собой точное значение площади под кривой и определяется как предел суммы Римана при стремлении числа прямоугольников к бесконечности и их ширины — к нулю.
Иными словами, суммы Римана — это ступени, а определённый интеграл — это конечная цель.

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

144 views15:04

DS & ML | YeaHub

#полезное

❤️‍🔥

Какие признаки могут указывать на то, что модель застряла в saddle point

Плато в loss не всегда значит минимум; анализ кривизны и наблюдение за динамикой обучения помогают распознать saddle points.

🟠 Плато в loss: функция потерь почти не меняется на протяжении многих итераций.

🟠 Анализ кривизны: если посмотреть на Гессиан или приблизительные вторые производные, можно заметить направления с отрицательной кривизной, где градиент ещё не ноль.

🟠 Резкий спад при адаптивных методах: использование momentum или адаптивного learning rate может внезапно снизить loss после долгого плато — это значит, что модель была в saddle region, а не в настоящем минимуме.

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

Главные новости и обновления платформы

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets

❤1

152 views08:02

DS & ML | YeaHub

#полезное

👋

NVIDIA ускорила LLM в 53 раза

Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей.

🚩

Как это работает:
Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей.

Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект.

Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием.

Hybrid Power — оставляем несколько full-attention слоёв в критичных точках, чтобы не потерять способность к сложным рассуждениям.

Результат - Jet-Nemotron:

- 2 885 токенов/с

- 47× меньше KV-кеша (всего 154 MB)

- Топовая точность при космической скорости

Почему это важно:

Для бизнеса: 53× ускорение = 98% экономии на масштабном развёртывании. ROI проектов с ИИ меняется радикально.

Для инженеров: теперь SOTA-уровень доступен даже на устройствах с ограниченной памятью.

Для исследователей: вместо миллионов на пре-трейнинг — можно создавать новые эффективные модели через архитектурные модификации.

Github
Статья

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

173 views15:01