Machine Learning | YeaHub – Telegram
Machine Learning | YeaHub
336 subscribers
244 photos
126 videos
361 links
Теория, подготовка к интервью и курсы для ML специалистов

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😵‍💫 У Luma Labs вышла новая видео модель - Ray 3

Новая модель может генерит в 1080p 16-bit HDR, длительность 5 или 9 сек.

🟠 Черипики клаcсные - хоть и все-таки видно, что детализация не такая высокая, особенно на дальних планах. Лица у людей на заднем плане тоже плывут. Все-таки маркетинговый отдел любит продать то, чего на самом деле пока нет (на странице релиза написаны довольно смелые заявления о качестве, ризонинге и других возможностях модели).
🟠Есть Draft Mode, который генерит быстрее, но только 5 сек и в ужасном качестве (640 × 352). Бесплатно можно генерить только в нем.

Я попробовал погенерить с премиумной подпиской. И результат прямо очень далек от черипиков.

Так как через интерфейс мы не напрямую дергаем модель, то о её внутренних способностях можно судить только косвенно.
1) Сначала промпт переписывается через LLM, добавляя деталей
2) Забавно, что если выбираешь генерацию на 9 сек, то заметно как сначала генерится грубая версия на 5 сек, а затем запускается extend еще на 5-секундный отрезок с перехлестом в 1 секунду с предыдущим. То есть по сути сама модель может выдавать только отрезки по 5 сек.

Генерация 9 сек в 1080p у меня заняла 5-6 мин. На подписку в $10/мес можно сгенерить примерно 6 таких видосов, затем придется доплачивать.

Черипики можно посмотреть тут: https://lumalabs.ai/ray

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #postgres
🤔 В чем разница между UNION и UNION ALL в PostgreSQL?

💬 Кратко:
UNION объединяет результаты двух запросов и удаляет дубликаты, в то время как UNION ALL объединяет результаты, не удаляя дубликаты. UNION может быть медленнее, поскольку необходимо выполнять проверку на уникальность строк, тогда как UNION ALL быстрее, так как этого шага нет.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😊 DeepSeek V3.1 Terminus

Судя по названию, это — последний релиз из линейки V3, как V2.5-1210 была для линейки V2. Между релизом V2.5-1210 и V3 прошло две недели, так что думаю что V4 тоже можно ждать в течении пары недель. DeepSeek обычно релизят модели перед важными китайскими праздниками, а 1 октября — день образования КНР.

По сравнению с V3.1, Terminus выросла по агентским бенчам и HLE, на остальных бенчах изменения незначительные. Из приятного — модель теперь реже срывается на китайский и выдаёт случайные символы в своём выводе.
Веса

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Может быть ChatGPT на самом деле придумали для астрологов? Хотя и тут есть вопросы...

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👋 DeepFaceLab — главный open-source инструмент для создания deepfake-видео

Факты:
🔵 Более 95% всех deepfake сделаны через DeepFaceLab
🔵 Поддержка Windows, Linux и Google Colab
🔵 Основан на TensorFlow, с гибкой модульной архитектурой
🔵 Реалистичные результаты — уровень киноэффектов
🔵 Репозиторий получил 18.5k и 669 форков
🔵 С ноября 2024 проект в архиве, но доступен для изучения

Автор: iperov — один из первых разработчиков, сделавших face-swap доступным для всех.
Репозиторий

💡 Используй для обучения, экспериментов и ресерча — это основа всех современных deepfake-технологий.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pytorch
🤔 Как можно реализовать отсев в нейронной сети PyTorch?

💬 Кратко:
Dropout реализуется с помощью слоя пп. Dropout , который случайным образом "выключает" нейроны на каждом шаге тренировки. Это помогает уменьшить переобучение, заставляя модель учиться на более стабильных и обобщающих признаках.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
1
#полезное
🏕 Kling 2.5 Turbo бросает вызов Veo 3

Вышла новая версия китайской модельки под скромным номером 2.5, что как бы намекает — это ещё не революция, и нам стоит ждать большего.

На деле же мы получаем физику и prompt understanding на уровне, очень близком к SOTA от гугл. Черипики, как всегда, топовые, но это не показатель — с этим справилась даже Luma на своей сомнительной Ray 3. Дополнительных данных нет — ни бенчмарков, ни даже официального блогпоста.

Пока вышла только Turbo-версия. Pro или Standard скорее всего существуют в недрах компании, но не факт что их релизнут. А если они и появятся, выигрыш в качестве не гарантирован — так же, как с Veo и Veo Fast, которые хоть и отличаются в стоимости в 5 раз, но на деле дистиллированная версия выдаёт почти неотличимый от полноценной Veo 3 результат.

Потестить уже сейчас можно на самом klingai.com, а также у независимых провайдеров вроде Fal, Freepik и Higgsfield. Последние, кстати, прикрутили удобный промпт-энхансер, который переводит подсказку в JSON. Там же сейчас можно крутить модельку безлимитно по подписке Creator и выше.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
#полезное
🤯 ChatGPT Pulse

Теперь ChatGPT может проактивно ресёрчить топики которые считает важными и выдавать репорт каждое утро. Темы выбираются на основе недавних чатов, памяти, подключенных приложений и пожеланий пользователей. Уже доступно подписчикам Pro уровня в новой версии мобильного приложения.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Kimi представила новый агентный режим OK Computer

Что он может:
🟡 Генерирует сайты, дашборды приложения и презентации
🟡 Работает с файлами, браузером и терминалом
🟡 Большой встроенный набор инструментов

K2 получил полезный агентский функционал.

🟠Попробовать: https://kimi.com

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #pytorch
🤔 Как использовать TensorBoard с PyTorch для визуализации моделей, метрик и гистограмм?

💬 Кратко:
Чтобы использовать TensorBoard с PyTorch, необходимо установить tensorboard и tensorboardx . После этого импортируется Summarywriter, который позволяет записывать информацию для визуализации, например, графики моделей, метрики и гистограммы. Используйте writer.add_graph() для отображения модели, writer.add_scalar() ДЛЯ метрики writer.add_histogram() ДЛя веСа СЛОев. После этого можно запускать TensorBoard через команду tensorboard --logdir=runs.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👋 Новый датасет Т-ECD — крупнейший кросс-доменный набор для RecSys

Ключевые особенности:
🟠 синтезирован на основе поведения 44 млн пользователей
🟠 более 135 млрд взаимодействий
🟠 включает 30 млн товаров и 1,2 млн брендов
🟠 охватывает домены: Marketplace, Retail, Payments, Offers, Reviews, Reciepts
🟠 подходит для большинства рекомендательных задач
🟠 глубина данных 1– 3,5 года — можно изучать как краткосрочные, так и долгосрочные взаимодействия

T-ECD универсален и применяется от базовой коллаборативной фильтрации до сложных мультизадачных моделей последовательных и графовых рекомендаций. Можно использовать целиком и по отдельным доменам.

🔵HF: https://huggingface.co/datasets/t-tech/T-ECD

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😎 Wan 2.5 — китайский нейрокомбайн с генерацией видео по аудио

Вышла моделька Wan 2.5, продолжение всеми любимой в опенсорсе 2.2 версии.

Можно было бы написать просто про её релиз сразу, но после него выкатили ещё кучу фич. Оказалось, что платформа теперь моделька мультимодальная и чуть ли не единственная в своём роде.

Считайте сами, Wan 2.5 поддерживает вход и выход в следующих форматах: Text, Image, Video, Audio. Только запах осталось добавить. Причём видео и картинки можно редактировать промптом, и, судя по всему, всё это можно комбинировать. Например, только что появилась возможность генерации видео по аудиовходу.

Что это значит? Персонажи и окружение в видео теперь могут двигаться в такт музыке! Ну и нативный липсинк, конечно же.

Кроме того, обновили интерфейс и добавили удобный редактор. Полноценно монтировать там, конечно, не получится, но генерацию в целом это упрощает.

В опенсорс, как и ожидалось, пока не выложили.
Анонс

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1
#Собес #pytorch
🤔 Как реализовать аугментацию данных с помощью PyTorch и каковы её преимущества?

💬 Кратко:
Аугментация данных в PyTorch выполняется с помощью модуля torchvision. transforms . Этот модуль позволяет применять различные преобразования изображений, такие как повороты, обрезки и зеркалирование. Это увеличивает обьем данных и помогает модели лучше обобщать. Например, можно использовать RandomHorizontalFlip дЛя случайного зеркалирования изображений.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору

📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😇 Claude Sonnet 4.5

GPT-5 Codex уже побыла лучшей моделью для кодинга уже целых две недели, так что пришло время для нового лидера. Клода ещё больше прокачали в кодинге и агентных тасках, где видно достаточно сильный прирост по бенчам. Цену сохранили прежнюю, Anthropic всё ещё упорно отказывается сбрасывать цены, в отличие от всех конкурентов.

По заявлениям Anthropic, новый Sonnet может автономно работать над задачей до 30 часов, предыдущий рекорд — 7 часов. Я не уверен как именно это измеряют, поэтому конкретно к этой части отношусь скептично.

Вместе с моделью обновили Claude Code до версии 2.0. Теперь Claude Code делает чекпоинты кодбазы перед каждым изменением, так что их можно легко откатить. Кроме этого обновили интерфейс и сделали расширение для VS Code. И наконец-то добавили возможность видеть оставшиеся лимиты использования моделей.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #git
🤔 Что такое распределённая система контроля версий?

💬 Кратко:
Распределённая система контроля версий (например, Git) сохраняет полную копию репозитория у каждого участника проекта. Это делает работу более надёжной, позволяет работать оффлайн и обеспечивает лёгкое слияние изменений.

📌 Полный разбор + примеры использования — на платформе:
👉
Перейти к разбору
📣 Хочешь получать больше таких разборов?
Подпишись на наш главный канал
Please open Telegram to view this post
VIEW IN TELEGRAM