NEW BOT Телеграм, страница - 737635703

DS & ML | YeaHub

@yeahub_data_science

466 subscribers

259 photos

67 videos

371 links

Теория, подготовка к интервью и курсы для Data Science специалистов

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets

Download Telegram

About

Blog

Apps

Platform

DS & ML | YeaHub

466 subscribers

DS & ML | YeaHub

#новости

📞

У офиса Anthropic проходит необычная акция протеста: ряд активистов объявили голодовку.

Протестующие утверждают, что гонка за всё более мощным искусственным интеллектом уже наносит вред обществу и может привести к катастрофическим последствиям.

По их словам, разработка AGI несёт угрозу не только благополучию людей, но и самому существованию человечества.

Активисты требуют от Anthropic и других компаний:
🟠 остановить «гонку вооружений» в области ИИ,
🟠 признать риски и рассказать обществу о них,
🟠 сосредоточиться на снижении уже нанесённого вреда.
Пост активиста

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣2

114 views15:00

DS & ML | YeaHub

#Собес #pandas

🤔

Как выбрать один столбец из DataFrame?

💬 Кратко:
Выбрать один столбец можно с помощью df ["column_name"] или df.column_name . Первый способ предпочтителен, так как работает с любыми именами столбцов.

📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал

Please open Telegram to view this post

VIEW IN TELEGRAM

101 views07:52

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

#полезное

🤓

Мощный трюк с GitHub, о котором стоит знать

Если заменить в URL любого репозитория github.com на gitmcp.io, вы попадёте на страницу с MCP-сервером для этого репозитория и получите готовый сниппет конфигурации. Скопируйте его и добавьте в свою IDE или ИИ-инструмент (например, Cursor, Windsurf или VS Code с поддержкой MCP)

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

106 views15:01

DS & ML | YeaHub

#новости

🥄

Волна голодовок тем временем пошла дальше: теперь голодают и около офиса DeepMind

Требования у протестующих все те же: прекратить гонку ИИ.

Я призываю руководство, директоров и сотрудников DeepMind сделать все возможное, чтобы остановить гонку за все более мощным AGI, которая угрожает вымиранием человечества.

Более конкретно, я прошу Демиса Хассабиса публично заявить, что DeepMind прекратит разработку передовых моделей ИИ, если все остальные крупные компании в области ИИ согласятся сделать это.

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

🤡2🤣1💊1

114 views08:02

DS & ML | YeaHub

#Собес #pandas

🤔

Как переименовать столбец в DataFrame?

💬 Кратко:
Для переименования столбцов используется метод rename() . Можно переименовать один или несколько столбцов, передав словарь {старое _имя: новое _имя} .

📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

113 views07:52

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

#полезное

😊

4 парадигмы обучения в машинном обучении наглядно:

- Трансферное обучение
- Дообучение
- Многозадачное обучение
- Федеративное обучение

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

108 views15:02

DS & ML | YeaHub

Бесплатный плейлист из 23 практических туториалов по проектам на Python и Pandas, включая анализ e-commerce, датасеты по фильмам, медицинские данные и создание веб-приложений на Streamlit.

Идеально для формирования сильного портфолио по анализу данных на реальных кейсах.
Плейлист на YouTube

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

145 views08:00

DS & ML | YeaHub

Ни одна презентация Apple не обходится без последующих мемов

В этот раз соцсети заполонили шутки про синхронный перевод в новых AirPods.

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣2

155 views15:04

DS & ML | YeaHub

#Собес #pandas

🤔

Как сбросить индекс DataFrame?

💬 Кратко:
Метод reset_index() сбрасывает индекс и делает его обычным столбцом или удаляет полностью, если передан drop=True .

📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал

Please open Telegram to view this post

VIEW IN TELEGRAM

117 views07:52

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

#полезное

🤯

Крутейший интерактивный учебник по теории вероятностей и статистике

Внутри наглядные визуализации, интерактивчики и минимум сухой теории. Можно покрутить распределения, посэмплить выборки, поиграться с доверительными интервалами и наглядно увидеть, как это всё работает

Забираем тут, советую открывать с десктопа

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

136 views15:04

DS & ML | YeaHub

#полезное

😐

Самый быстрый движок для сервинга LLM уже тут — и он open-source

LMCache — новый движок, созданный для:
🟠 мгновенного time-to-first-token;
🟠 ыыше throughput даже при длинных контекстах;
🟠 7× быстрее доступа к KV-кешам и поддержка 100× большего объёма кеша по сравнению с vLLM;
🟠 и всё это — полностью open-source.

Если вы работаете с LLM в продакшне, LMCache может стать настоящим гейм-чейнджером для latency-чувствительных приложений.
Репозиторий

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

126 views08:04

DS & ML | YeaHub

This media is not supported in your browser

VIEW IN TELEGRAM

😬

AnomalyCLIP: новый шаг в видеоаналитике с помощью CLIP

Классические методы Video Anomaly Detection (VAD) умеют лишь находить что-то странное в кадре. Но в реальных системах этого мало.

Video Anomaly Recognition (VAR) идёт дальше — не просто сигнализирует о событии, а определяет какое именно произошло: кража, поджог, ДТП и т.д. Это превращает абстрактные алерты в осмысленные инсайты.

AnomalyCLIP использует возможности CLIP для распознавания аномалий:
🟠 без дорогой ручной разметки на уровне кадров,
🟠 с опорой на vision-language embeddings,
🟠 с инновациями вроде feature re-centering, semantic MIL и axial transformers.

Подробнее о том:
— почему старые подходы VAD больше не работают,
— как CLIP даёт семантическое понимание,
— чем AnomalyCLIP отличается от других решений,
Читайте в детальной статье.

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

86 views15:04

DS & ML | YeaHub

#Собес #pandas

🤔

Какие важные условия нужно учитывать перед итерацией по DataFrame?

💬 Кратко:
Итерация по DataFrame - это неэффективно, так как Pandas оптимизирован для работы с векторизированными операциями. Лучше использовать apply() , встроенные методы и vectorization, если это возможно.

📌 Полный разбор + примеры использования — на платформе:
👉 Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал

Please open Telegram to view this post

VIEW IN TELEGRAM

91 views07:52

DS & ML | YeaHub

#новости

😘

Google создали систему, специально заточенную под создание научного ПО: ее решения обходят человеческие

Есть в науке такая проблема: рисерчеры ~~не умеют писать код~~ тратят просто уйму времени на написание кода. Хочется проверить больше гипотез и быстро прототипировать решения, но ПО здесь – узкое место. Многие перспективные идеи просто не проверяются, потому что слишком сложно, долго и дорого.

Google попробовали с этим поработать и предложили «аналог» AlphaZero для написания кода, но именно в сфере науки. Они берут только подкласс scorable task. Это задачи, у которых есть одна явная метрика качества. Например: точность прогноза, ошибка интегрирования, ну или MSE в конце концов.

То есть для широкого спектра индустриального кода такая система не подойдет. А для ученых – в самый раз. ПО для таких измеримых задач называется, кстати, Empirical software.

Как работает:

1⃣ На вход система получает задачу, метрику и какой-то контекст, если он есть (ну, например, базу знаний). Под капотом крутится LLM + Tree Search.

2⃣ LLM выступает в роли исполнителя и, собственно, пишет код. А Tree Search тут как своеобразный ПМ, отслеживает успех и решает что делать дальше. Каждое изменение кода – это ветвь дерева, а каждая вершина – конкретная версия программы.

3⃣ LLM генерирует несколько вариантов изменения текущего узла, код запускается в песочнице и оценивается по метрике, а затем добавляется в дерево. На следующем шаге алгоритм решает, в какую вершину дерева стоит идти дальше.

4⃣ При этом идем не просто в вершину с лучшей метрикой: чтобы никакие хорошие идеи не пропустить, должен соблюдаться баланс между exploration (исследовать новые идеи) и exploitation (углубляться в лучшие решения).

5⃣ При этом LLM перед написанием кода еще и изучает прикрепленный контекст и серфит Интернет в поисках полезных статей, подходов и практик. Так что изменения в коде не только осознанные, но и иногда подкрепляются источниками.

В целом, схема-то не новая, и тут даже не было никакого супер-RL’я. Но вот результаты таких сетапов всегда удивляют. Например:

🟠 На задаче анализа single-cell RNA-seq модель создала 40 новых алгоритмов, которые серьезно превзошли все существующие решения на основном бенчмарке (+14% к лидеру).

🟠 Придумала новый алгоритм для вычисления сложных интегралов. Им решились 17 из 19 тестовых задач с ошибкой <3%. Для сравнения, scipy.integrate.quad() решает 0 задач из 19.

🟠 Ее модель прогнозирования заболеваемости ковидом превзошла официальный американский CDC Ensemble.

На гитхабе лежит код некоторых решений. Сама система пока не в доступе, и вряд ли ее опубликуют. Но, может, каким-то лабам дадут попользоваться в частном порядке.
arxiv.org/abs/2509.06503

👉

Новости

👉

База вопросов

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

108 views15:02