DS & ML | YeaHub – Telegram
DS & ML | YeaHub
466 subscribers
259 photos
67 videos
371 links
Теория, подготовка к интервью и курсы для Data Science специалистов

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets
Download Telegram
#новости
📞 У офиса Anthropic проходит необычная акция протеста: ряд активистов объявили голодовку.

Протестующие утверждают, что гонка за всё более мощным искусственным интеллектом уже наносит вред обществу и может привести к катастрофическим последствиям.

По их словам, разработка AGI несёт угрозу не только благополучию людей, но и самому существованию человечества.

Активисты требуют от Anthropic и других компаний:
🟠 остановить «гонку вооружений» в области ИИ,
🟠 признать риски и рассказать обществу о них,
🟠 сосредоточиться на снижении уже нанесённого вреда.
Пост активиста

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣2
#Собес #pandas
🤔 Как выбрать один столбец из DataFrame?

💬 Кратко:
Выбрать один столбец можно с помощью df ["column_name"] или df.column_name . Первый способ предпочтителен, так как работает с любыми именами столбцов.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤓 Мощный трюк с GitHub, о котором стоит знать

Если заменить в URL любого репозитория github.com на gitmcp.io, вы попадёте на страницу с MCP-сервером для этого репозитория и получите готовый сниппет конфигурации. Скопируйте его и добавьте в свою IDE или ИИ-инструмент (например, Cursor, Windsurf или VS Code с поддержкой MCP)

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
🥄 Волна голодовок тем временем пошла дальше: теперь голодают и около офиса DeepMind

Требования у протестующих все те же: прекратить гонку ИИ.

Я призываю руководство, директоров и сотрудников DeepMind сделать все возможное, чтобы остановить гонку за все более мощным AGI, которая угрожает вымиранием человечества.

Более конкретно, я прошу Демиса Хассабиса публично заявить, что DeepMind прекратит разработку передовых моделей ИИ, если все остальные крупные компании в области ИИ согласятся сделать это.


👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡2🤣1💊1
#Собес #pandas
🤔 Как переименовать столбец в DataFrame?

💬 Кратко:
Для переименования столбцов используется метод rename() . Можно переименовать один или несколько столбцов, передав словарь {старое _имя: новое _имя} .

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😊 4 парадигмы обучения в машинном обучении наглядно:

- Трансферное обучение
- Дообучение
- Многозадачное обучение
- Федеративное обучение

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Бесплатный плейлист из 23 практических туториалов по проектам на Python и Pandas, включая анализ e-commerce, датасеты по фильмам, медицинские данные и создание веб-приложений на Streamlit.

Идеально для формирования сильного портфолио по анализу данных на реальных кейсах.
Плейлист на YouTube

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Ни одна презентация Apple не обходится без последующих мемов

В этот раз соцсети заполонили шутки про синхронный перевод в новых AirPods.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣2
#Собес #pandas
🤔 Как сбросить индекс DataFrame?

💬 Кратко:
Метод reset_index() сбрасывает индекс и делает его обычным столбцом или удаляет полностью, если передан drop=True .

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤯 Крутейший интерактивный учебник по теории вероятностей и статистике

Внутри наглядные визуализации, интерактивчики и минимум сухой теории. Можно покрутить распределения, посэмплить выборки, поиграться с доверительными интервалами и наглядно увидеть, как это всё работает

Забираем тут, советую открывать с десктопа

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😐 Самый быстрый движок для сервинга LLM уже тут — и он open-source

LMCache — новый движок, созданный для:
🟠 мгновенного time-to-first-token;
🟠 ыыше throughput даже при длинных контекстах;
🟠 7× быстрее доступа к KV-кешам и поддержка 100× большего объёма кеша по сравнению с vLLM;
🟠 и всё это — полностью open-source.

Если вы работаете с LLM в продакшне, LMCache может стать настоящим гейм-чейнджером для latency-чувствительных приложений.
Репозиторий

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#статьи
😬 AnomalyCLIP: новый шаг в видеоаналитике с помощью CLIP

Классические методы Video Anomaly Detection (VAD) умеют лишь находить что-то странное в кадре. Но в реальных системах этого мало.

Video Anomaly Recognition (VAR) идёт дальше — не просто сигнализирует о событии, а определяет какое именно произошло: кража, поджог, ДТП и т.д. Это превращает абстрактные алерты в осмысленные инсайты.

AnomalyCLIP использует возможности CLIP для распознавания аномалий:
🟠 без дорогой ручной разметки на уровне кадров,
🟠 с опорой на vision-language embeddings,
🟠 с инновациями вроде feature re-centering, semantic MIL и axial transformers.

Подробнее о том:
— почему старые подходы VAD больше не работают,
— как CLIP даёт семантическое понимание,
— чем AnomalyCLIP отличается от других решений,
Читайте в детальной статье.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pandas
🤔 Какие важные условия нужно учитывать перед итерацией по DataFrame?

💬 Кратко:
Итерация по DataFrame - это неэффективно, так как Pandas оптимизирован для работы с векторизированными операциями. Лучше использовать apply() , встроенные методы и vectorization, если это возможно.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
😘 Google создали систему, специально заточенную под создание научного ПО: ее решения обходят человеческие

Есть в науке такая проблема: рисерчеры не умеют писать код тратят просто уйму времени на написание кода. Хочется проверить больше гипотез и быстро прототипировать решения, но ПО здесь – узкое место. Многие перспективные идеи просто не проверяются, потому что слишком сложно, долго и дорого.

Google попробовали с этим поработать и предложили «аналог» AlphaZero для написания кода, но именно в сфере науки. Они берут только подкласс scorable task. Это задачи, у которых есть одна явная метрика качества. Например: точность прогноза, ошибка интегрирования, ну или MSE в конце концов.

То есть для широкого спектра индустриального кода такая система не подойдет. А для ученых – в самый раз. ПО для таких измеримых задач называется, кстати, Empirical software.

Как работает:

1⃣ На вход система получает задачу, метрику и какой-то контекст, если он есть (ну, например, базу знаний). Под капотом крутится LLM + Tree Search.

2⃣ LLM выступает в роли исполнителя и, собственно, пишет код. А Tree Search тут как своеобразный ПМ, отслеживает успех и решает что делать дальше. Каждое изменение кода – это ветвь дерева, а каждая вершина – конкретная версия программы.

3⃣ LLM генерирует несколько вариантов изменения текущего узла, код запускается в песочнице и оценивается по метрике, а затем добавляется в дерево. На следующем шаге алгоритм решает, в какую вершину дерева стоит идти дальше.

4⃣ При этом идем не просто в вершину с лучшей метрикой: чтобы никакие хорошие идеи не пропустить, должен соблюдаться баланс между exploration (исследовать новые идеи) и exploitation (углубляться в лучшие решения).

5⃣ При этом LLM перед написанием кода еще и изучает прикрепленный контекст и серфит Интернет в поисках полезных статей, подходов и практик. Так что изменения в коде не только осознанные, но и иногда подкрепляются источниками.

В целом, схема-то не новая, и тут даже не было никакого супер-RL’я. Но вот результаты таких сетапов всегда удивляют. Например:

🟠 На задаче анализа single-cell RNA-seq модель создала 40 новых алгоритмов, которые серьезно превзошли все существующие решения на основном бенчмарке (+14% к лидеру).

🟠 Придумала новый алгоритм для вычисления сложных интегралов. Им решились 17 из 19 тестовых задач с ошибкой <3%. Для сравнения, scipy.integrate.quad() решает 0 задач из 19.

🟠 Ее модель прогнозирования заболеваемости ковидом превзошла официальный американский CDC Ensemble.

На гитхабе лежит код некоторых решений. Сама система пока не в доступе, и вряд ли ее опубликуют. Но, может, каким-то лабам дадут попользоваться в частном порядке.
arxiv.org/abs/2509.06503

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM