Machine Learning | YeaHub – Telegram
Machine Learning | YeaHub
336 subscribers
244 photos
126 videos
361 links
Теория, подготовка к интервью и курсы для ML специалистов

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤯 Krea real-time video

Img2video? Video2video? Что это вообще?

Krea показали риалтайм-генератор, который можно конролировать, рисуя геометрические примитивы. В итоге получился real-time img2img, но с временной согласованностью и консистентностью. Выгляди так, что они учитывают предыдующие генерации для согласованности.

Эффект вышел уникальный, хоть по сути и не является video2video. Но главная фишка — это реалтайм (12 fps).

Не знаю, насколько это будет полезно на практике, но для концептуальных и/или музыкальных роликов точно подойдёт. Интересно будет поиграться.
Вейтлист

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
🫠 Tencent дропнули Hunyuan-MT — мощные open-source модели для перевода

Что внутри:
🔵 Доступны модели Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B
🔵 Поддержка 33 языков
🔵 Chimera-7B — это первая в индустрии откртытая ансамблевая модель

Результаты:
- 1-е место в 30 из 31 категорий на международном конкурсе WMT25 (Workshop on Machine Translation 2025, крупнейшая в мире конференция-соревнование по машинному переводу)
- Hunyuan-MT-7B лидирует среди моделей своего размера

Модели: https://huggingface.co/collections/tencent/hunyuan-mt-68b42f76d473f82798882597

Репозиторий: https://github.com/Tencent-Hunyuan/Hunyuan-MT
Demo: https://hunyuan.tencent.com/modelSquare/home/list

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 Как реализовать полнотекстовый поиск с использованием стемминга в PostgreSQL?

💬 Кратко:
Для реализации полнотекстового поиска с использованием стемминга в PostgreSQL необходимо использовать тип данных tsvector для хранения текста и функции для преобразования текста в индексированный формат. Для стемминга используется специальный словарь, который автоматически сокращает слова до их корней. Основные функции для этого: to_tsvector() И tsquery() . Также можно настроить использование словарей стемминга для различных языков.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
😬 Veo 3 Ultimate

Google под шумок релиза Nano Banana тихо выкатили важное обновление. Теперь по подписке Ultra можно генерировать неограниченное количество видео на Veo 3 Fast — облегчённой версии Veo 3 (читай дистиллированной).

Раньше одна генерация могла стоить до $3.2 (при цене $0.4 за секунду на fast-модели по API), что делало создание короткометражек или рекламы довольно дорогим по сравнению с другими моделями. Теперь это стоит всего $250 в месяц.

Вероятно, многие фрилансеры и студии теперь плотно пересядут на модель от Google. Из минусов — по-прежнему нет поддержки вертикального видео и разрешение ограничено 720p, в то время как Kling уже давно генерирует в 1080p.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👋 Китайцы из Zhipu запустили подписку для Claude Code

В основе — собственная модель Zhipu, GLM 4.5. Работает исключительно с Claude Code, подписчикам выдаётся API ключ для эндпоинта совместимого с API Anthropic, который можно засунуть в агента от Антропик. Основной селлинг поинт — повышенные лимиты по сравнению с подпиской от Anthropic и меньше цена ($3 в месяц за Lite подписку и $15 за Pro). Вообще интересно наблюдать как, не смотря на закрытость Claude Code, всё больше провайдеров прилагают кучу усилий чтобы поддерживать именно его, а не что-то более открытое.
z.ai/subscribe

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 Какова цель представления pg_stat_user_indexes в PostgreSQL?

💬 Кратко:
Представление pg_stat_user_indexes в PostgreSQL содержит статистическую информацию об индексах, созданных для пользовательских таблиц. Оно помогает анализировать эффективность индексов, включая их использование и количество операций. Это представление полезно для оптимизации запросов и индексации.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
😵‍💫 NVIDIA представила Universal Deep Research (UDR)

UDR — настраиваемый агент для глубокого ресёрча, который «оборачивается» вокруг любого LLM.

Почему это важно:
🔵**Гибкая настройка агента без кода** — UDR не ограничивает жёсткими сценариями, как большинство тулзов.
🔵Можно создавать, редактировать и комбинировать стратегии поиска и анализа.
🔵В репо есть примеры стратегий (minimal, expansive, intensive), но главная сила — в кастомизации под свои задачи.

По сути, это гибкий ресёрч-агент, который можно адаптировать под любой рабочий процесс.

Project: https://research.nvidia.com/labs/lpr/udr
Code: https://github.com/NVlabs/UniversalDeepResearch
Lab: https://nv-dler.github.io

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
📞 На Hugging Face вышла обзорная статья об открытых ML-датасетах

Автор новостного ресурса Daily Dose of Data Science собрал самые интересные релизы крупных датасетов и моделей. Среди них — Yambda-5B от команды Яндекса, крупнейший в мире открытый музыкальный рекомендательный датасет.

В Yambda-5B 4,79 млрд обезличенных взаимодействий: прослушивания, лайки и дизлайки треков. Датасет уже привлек внимание мировых исследователей и обещает стать важным инструментом для развития рекомендательных систем.
Подробнее

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👨‍💻 Decart представила Oasis 2.0 — AI-модель, которая позволяет менять игровые миры и стили в реальном времени: 1080p, 30fps.

Примеры выглядят кафово: Minecraft в швейцарских Альпах, на фестивале Burning Man или с альтернативными наборами персонажей.

Игровой мир можно менять «на лету», без подргузки.

Демку можно попробовать в вебе или использовать как мод для Minecraft.

🔴 Демо и мод: http://oasis2.decart.ai/demo

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 Как обрабатываются конкурирующие обновления в PostgreSQL?

💬 Кратко:
B PostgreSQL конкурирующие обновления обрабатываются с помощью механизма блокировок и изоляции транзакций. При попытке обновить одну и ту же строку несколькими транзакциями, одна из транзакций будет заблокирована до тех пор, пока другая не завершит свою работу. Для предотвращения конфликтов используется изоляция транзакций, которая определяется с помощью уровней изоляции: Read Committed, Repeatable Read, Serializable.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
🤓 Европа встает с колен – ASML инвестирует 1.5 миллиарда долларов в Mistral

В рамках нового раунда на 2 миллиарда долларов, компания станет крупнейшим акционером и, по слухам, получит место в совете директоров. Оценка Mistral после сделки составит ~14 миллиардов долларов, что делает Mistral самой дорогой AI-компанией Европы.

Нидерландская ASML — единственный производитель ключевого оборудования для EUV литографии, на которой строится практически всё производство современных чипов. Без неё не было бы никаких H100, GB200 и прочего современного железа, а без них — современный ИИ выглядел бы совершенно иначе.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🥄 Google DeepMind показала, как роботы учатся работать вместе с помощью обучения с подкреплением.

Учёные из UCL, Google DeepMind и Intrinsic представили новый AI-алгоритм RoboBallet — систему, которая позволяет нескольким роботизированным манипуляторам работать синхронно и без столкновений в сложной производственной среде,.

🔹 В эксперименте участвовали 8 роботов, каждый из которых мог выполнять 40 разных задач в одном общем пространстве.
🔹 Роботы могли брать любую задачу в любом порядке — система сама решала, кому что поручить и как построить безопасные траектории.
🔹 Алгоритм обучался в симуляции, а затем сразу работал в новых условиях без дообучения (*zero-shot*).

Пока решение работает только для задач перемещения (reaching), без учёта порядка выполнения или разных типов роботов.

Однако архитектура гибкая — в будущем возможно добавление сложных задач, зависимостей и разнообразных роботов.

Один алгоритм смог координировать целую команду, делая роботов гибкими и слаженными даже там, где они раньше не работали.

🟢 Подробнее: https://www.science.org/doi/10.1126/scirobotics.ads1204

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 Как подключиться к базе данных PostgreSQL с помощью psql?

💬 Кратко:

Для подключения к базе данных PostgreSQL с помощью psql нужно использовать команду psql -h < host› -U <user› -d ‹dbname›. Если сервер работает локально, можно опустить параметр -h . Например:
psql -U postgres -d mydatabase


📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😊 ИИ генерирует научный код лучше людей.

Сегодняшний дамп статей от Google Research — это не очередной инкрементальный апдейт, а знаковое событие.

Исследователи представили систему, которая автоматически создаёт экспертное ПО для научных задач, и она уже побеждает на профессиональных лидербордах.

Это не просто ещё один кодогенератор.

Система использует LLM (Gemini), управляемую древовидным поиском (Tree Search) — алгоритмом из мира AlphaGo. Её цель — не просто скомпилировать код, а итеративно улучшать его, максимизируя конкретную метрику качества (score) на реальных данных. Учёные называют такие задачи «scorable tasks».

Что система сделала на практике:

1. Биоинформатика (scRNA-seq): Открыла 40 новых методов для интеграции данных single-cell, которые побили лучшие человеческие методы на публичном лидерборде OpenProblems. ИИ не просто скопировал известный метод BBKNN, а улучшил его, скомбинировав с другим алгоритмом (ComBat), до чего люди не додумались.
2. **Эпидемиология (COVID-19):** ИИ сгенерировал 14 моделей, которые в течение всего сезона 2024/25 стабильно показывали результаты лучше, чем ансамбль CDC и любые отдельные модели при прогнозировании госпитализаций.
Работа с временными рядами обычно очень сложна, но здесь ИИ справился и превзошёл существующие подходы.

3. Другие области: Система также показала SOTA в:
· Сегментации спутниковых снимков (DLRSD benchmark, mIoU > 0.80)
· Прогнозировании нейронной активности целого мозга zebrafish (ZAPBench)
· Прогнозах временных рядов (GIFT-Eval benchmark)
· Численном решении сложных интегралов, где стандартная scipy.integrate.quad() падает.

🟠Как это работает?

Вместо того чтобы с нуля генерировать код, система начинает с существующего решения (например, вызова quad() или простой модели) и запускает древовидный поиск. На каждом шаге LLM предлагает «мутации» — варианты изменения кода. Дерево поиска решает, какую ветку развивать дальше, балансируя между эксплуатацией (улучшение текущего лучшего решения) и исследованием (попытка радикально новых идей).

Ключевая фишка — система умеет интегрировать научные идеи извне. Ей можно скормить PDF научной статьи, и она попытается реализовать описанный там метод. Более того, ИИ может комбинировать идеи из разных статей, создавая гибридные методы, которые и приводят к прорыву.

🟠Что это значит?

Это не замена учёным. Это мощнейший инструмент усиления. Система за часы прорабатывает и тестирует идеи, на которые у исследовательской группы ушли бы недели или месяцы. Она без устали перебирает «иголки в стоге сена» — те самые нетривиальные решения, которые ведут к скачку в качестве.

Пока что система требует чётко определённой метрики для максимизации. Но для огромного пласта эмпирической науки (от биологии и медицины до климатологии и астрофизики) это и есть основной способ оценки гипотез.

Вывод: Это один из самых убедительных на сегодня шагов к реальному ИИ-ассистенту для учёных. Он не просто отвечает на вопросы — он проводит вычислительные эксперименты и находит решения, превосходящие человеческие.

🟢Оригинал статьи: An AI system to help scientists write expert-level empirical software
🟢Код и примеры решений: github.com/google-research/score

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM