Machine Learning | YeaHub – Telegram
Machine Learning | YeaHub
335 subscribers
244 photos
126 videos
362 links
Теория, подготовка к интервью и курсы для ML специалистов

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets
Download Telegram
#Собес #git
🤔 Что такое git reflog?

git reflog показывает историю всех перемещений HEAD, включая коммиты, слияния и переключения веток. Эта команда полезна для восстановления потерянных коммитов или веток.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#новости
😘 Nvidia запускает своих роботов в больницах

Месяц назад Nvidia представила Nurabot — медицинского робота на колёсах, созданного совместно с Foxconn и другими компаниями.

Сейчас он уже работает в госпитале ветеранов в Тайчжуне, а до конца года в ряд больниц поступят десятки таких роботов.

Они будут служить связующим звеном между медсёстрами и пациентами, снижая нагрузку на персонал и позволяя медицинским работникам уделять больше внимания качественному уходу за пациентами.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #git
🤔 Перечислите команды для удаления ветки git

Для удаления локальной ветки:
git branch -d ‹ branch_name>

Если ветка содержит незавершённые изменения:
git branch -D ‹ branch_name>

Для удаления удалённой ветки:
git push origin --delete ‹branch_name>


👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🥺 HKU NLP выкатили POLARIS - рецепт для выжимания максимума из маленьких моделей через RL.

Их 4B модель показывает 81.2% на AIME24 и 79.4% на AIME25, что сопоставимо с моделями во много раз больше. Фокус в правильной калибровке сложности данных - нужно перевернутое J-образное распределение, где большинство задач сложные, но решаемые. Они динамически отфильтровывают слишком простые задачи во время тренировки, поддерживая оптимальный уровень сложности. Так модель вынуждена постоянно учиться и расти над собой, в то же время не надрываясь на слишком сложных задачах.

Важно поддерживать и разнообразие генераций — модели имеют три температурные зоны: стабильная генерация (низкое разнообразие), осторожное экспериментирование (оптимальный баланс) и полный коллапс. POLARIS тренируют так, чтобы модель всегда экспериментировала и не выдавала слишком похожих решений, а по мере роста уверенности модели в ходе тренировки постепенно повышают температуру - с 1.4 до 1.5 для Qwen3-4B. Это поддерживает разнообразие решений, необходимое для relative policy optimization.

Для решение проблемы разреженных наград используют Rollout Rescue: когда все 8 попыток решения проваливаются, система подставляет сохраненное успешное решение из предыдущих эпох. Для каждой задачи поддерживается буфер с последним правильным ответом, который обновляется при появлении новых успешных решений. Это гарантирует, что модель всегда имеет положительные примеры для обучения даже на самых сложных задачах.

Экстраполяция длины через Yarn позволяет моделям генерить 90K+ токенов качественных рассуждений, хотя тренировались они на меньших длинах. Без Yarn точность на длинных цепочках рассуждений падает с 50% до 26%.

Многоэтапная тренировка с постепенным увеличением контекста и удалением ограничений энтропии/KL loss для агрессивного исследования пространства решений завершают картину.

Результат – 4B модель, которую можно запустить на телефоне, которая решает олимпиадные задачи почти на уровне 235B Qwen 3. А вишенка на торте — опубликовали не только веса модели, но и датасет на котором тренировали POLARIS.

Веса 4B модели
Датасет
Блогпост о тренировке

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Hunyuan GameCraft — нейронный игровой движок от Tencent

Выглядит на голову выше Genie 2 и других конкурентов, при этом сильно более интерективная. В качестве основы используется Hunyuan Video, который натюнили на геймплее из более чем сотни ААА проектов — Assassin’s Creed, Red Dead Redemption и Cyberpunk 2077. Результат соответствующий — некоторые игры из датасета можно легко узнать по результатам генерации модели.

Основная проблема добавления интерактивности в видеомодель — это компромисс между стабильностью картинки и отзывчивостью на действия игрока. Если модель слишком сильно держится за прошлое, она становится инертной и плохо реагирует на резкие повороты. Если же она ориентируется только на последний кадр, то быстро забывает сцену, что приводит к куче артефактов. Если вы пробовали поиграть в нейронный майнкрафт, то вы понимаете о чём я говорю.

Авторы пейпера решают эту проблему с помощью гибридной стратегии обучения, где модель учится генерировать видео в трёх разных режимах: начиная с одного кадра (25%), продолжая короткий фрагмент (70%) или длинный (5%). Смешивая эти три режима во время обучения, модель становится универсальной. Она учится как начинать видео с нуля, так и продолжать его, балансируя между консистентностью и реакцией на новые команды.

Но интерактивность бесполезна если модель настолько медленная, что отклика нужно ждать несколько секунд или даже минуты. Поэтому авторы дистиллируют модель в PCM — Phased Consistency Model. Это позволяет добиться 6.6FPS на 1xH100, это всё ещё неприятно, но уже может считаться интерактивным. Правда это можно заметно ускорить — перевести инференс на Blackwell, квантизировать модельки, дистиллировать в модельку поменьше, ну и другие методы из моего поста про ускорение диффузии.

Сайт проекта

Пейпер

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😐 Gemini CLI — официальный агент для Gemini от Google

Использовать можно бесплатно просто залогинившись с аккаунтом Google — дают до 60 запросов в минуту к Gemini 2.5 Pro и до тысячи в день. Такой щедрости не проявляет ни Codex ни Claude Code. Есть поддержка MCP, которая позволяет подключать туда сторонние тулы. Гугл даже запилил MCP серверы для взаимодействия с Veo/Imagen/Lyria.

Доступен код по лицензии Apache 2.0, так что с ним можно делать всё что угодно. А вот в апстрим залить что-либо будет сильно сложнее — у гугла очень специфическая политика по поводу сторонних контрибьюторов.

npm install -g @google/gemini-cli


Блогпост
Исходники

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #git
🤔 Что делает команда git stash?

Команда git stash сохраняет текущие незавершённые изменения в специальное место (стек), чтобы вы могли переключиться на другую ветку или выполнить другие действия. Эти изменения можно позже восстановить с ПОМОЩЬЮ git stash apply или git stash pop .

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
❤️‍🔥 Теперь Claude Artifacts могут вызывать API Claude

Это
делает их заметно полезнее — теперь можно создавать полноценные интерактивные инструменты прямо в чате, а в дальнейшем сюда явно напрашивается интеграция MCP. Сделали и отдельную страницу со всем артефактами созданными юзером, плюс парой десятков примеров, которые можно ремиксить. Апдейт уже доступен всем не-энтерпрайз юзерам, даже бесплатным. Лимиты у использования Claude в чате и в артефактах одни и те же.
claude.ai/artifacts

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
1
#полезное
👨‍💻 Black Forest Labs выложили веса FLUX.1 Kontext [dev]

Она, конечно, заметно слабее чем pro и max, но всё ещё часто обходит нативную генерацию изображений в gpt-image на собственных бенчах BFL и с огромным отрывом лучшая модель с доступными весами. Для владельцев видях Blackwell выкатили ещё и официальные TensorRT версии — в fp8 и fp4. Они качеством, конечно, похуже, но вплоть до двух раз быстрее плюс требуют меньше видеопамяти.

Для некоммерческого использования модель бесплатная. За коммерческое использование придётся платить — $999 долларов в месяц за 100к сгенеренных изображений, всё что больше 100к генераций в месяц — 1 цент за генерацию.

Веса

Оптимизированные TensorRT версии
Техрепорт
Код

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
📞 Xiaomi представила умные очки с камерой и голосовым ассистентом.

Xiaomi анонсировала свои первые умные очки с ИИ, Xiaomi AI Glasses. Устройство получило 12-мегапиксельную камеру с электронной стабилизацией, четырехъядерный процессор Snapdragon AR1, микрофоны с костной передачей звука и фирменный голосовой ассистент Hyper Xiao Ai. В отличие от Ray-Ban, у Xiaomi нет дисплея, но есть уникальная функция: оплата через QR-коды Alipay голосом, которая появится в сентябре 2025 года по OTA-обновлению.

Аккумулятора хватает на 8,6 часов активного использования. Очки весят 40 грамм, поддерживают съемные линзы (включая электрохромные) и работают до 21 часа в режиме ожидания. Базовая версия стоит $280, а с затемненными линзами - примерно $420. Устройство, правда, оптимизировано под азиатские формы лица, это может ограничить глобальный запуск. На китайской площадке JD.com за первые часы предзаказ собрал 25 тысяч заявок.
roadtovr.com

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
#Собес #git
🤔 Что такое HEAD с точки зрения Git?

HEAD в Git - это указатель на текущую ветку или коммит. Он показывает, над чем вы сейчас работаете, и меняется при переключении веток или выполнении коммитов.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🤓 Cloud.​ru анонсировал AI-помощника для автоматизации работы с облаком

На конференции GigaConf провайдер облачных и AI-технологий Cloud.​ru сделал два анонса: запуск AI-помощника Клаудии и открытие общего доступа к платформе Cloud.​ru Evolution AI Factory. Инструменты упрощают работу с облачными технологиями и AI для пользователей со всеми уровнями технического бэкграунда.

AI-помощник в режиме Public Preview консультирует пользователей и выполняет конкретные действия по управлению ресурсами. Он самостоятельно разворачивает виртуальные машины, подбирает оптимальную конфигурацию сервисов, настраивает мониторинг и алертинг, а также работает с консолью в режиме co-pilot. Зная архитектуру платформы, помощник дает персональные рекомендации и автоматизирует рутинные DevOps-задачи. Эти инструменты помогут разработчикам стартапов и pet-проектов без особого опыта в облачных технологиях быстрее запускать проекты, а опытным DevOps и SRE-инженерам — сосредоточиться на стратегических задачах.

Также провайдер открыл доступ к Cloud.​ru Evolution AI Factory — облачной среде с готовыми инструментами для работы с LLM и создания мультиагентных систем. В нее входят шесть сервисов: Foundation Models для работы с моделями через API, ML Inference для развертывания моделей, Managed RAG для технологии дополненной генерации, ML Finetuning для адаптации LLM-моделей, Notebooks для работы с Jupyter Notebooks и AI Agents — визуальный редактор агентов на базе LLM. Инструменты подходят для разных задач: от автоматизации поддержки клиентов до оптимизации документооборота и управления поставками.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Играемся с CV

Зацените, что нашёл на выходные:

Вот вам пара небольших, несложных и практически бесполезных штуковин, в которые просто интересно поиграться.

Концепт интересный и, думаю, многим приходил в голову. Здесь у нас реалитайм-трекинг рук, который привязан к паре заранее записанных дорожек их параметрам. Всё работает на three.js, MediaPipe, HTML/CSS/JS. Подобных проектов там ещё 7. Кроме этого мне больше всех зашёл генератор шейдеров.

Для новичков вообще топ, гайды по сборке своей похожей CV-игрушки доступны за 10 баксов. Но, кажется, здесь и Gemini сравится, хотя от этого играть не менее интересно)
линк

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Даже Хемингуэй плакал от этой истории.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #ScikitLearn
🤔 Как работать с многовыходными задачами в Scikit-Learn?

Scikit-Learn предоставляет инструменты для работы с многовыходными задачами через MultiOutputRegressor и MultiOutputClassifier. Эти мета-оцениватели позволяют применить один классификатор или регрессор для каждого выходного параметра.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
1
#полезное
👨‍💻 GitHub Copilot Chat для VS Code выкатили в опенсорс — Microsoft открыла весь исходный код самого популярного чат-бота для программистов под лицензией MIT.

Теперь можно изучить всю кодовую базу ИИ-агента, пощупать, как он работает, потестить фичи, внимательнее рассмотреть контекст и даже внедрить свои наработки. Исправление багов так же приветствуется.

Играемся — здесь.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
1
#Собес #ScikitLearn
🤔 Как работать с текстовыми данными в Scikit-Learn? Приведи пример предобработки текста с использованием Scikit-Learn.

B Scikit-Learn для обработки текстовых данных используются векторизаторы, такие как CountVectorizer и TfidfVectorizer. CountVectorizer преобразует текст в числовые векторы, используя частоту слов, а TfidfVectorizer учитывает не только частоту, но и уникальность слов.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👍 Higgsfield Soul - новая text2image модель?

Ребята явно решили замахнуться на кусок пирога Midjourney. В твиттере сейчас только о них и говорят, называя их новый генератор картинок Soul самым реалистичным и эстетичным. Но так ли это?

Higgsfield — это изначально апка с видеогенераторами. Я про нее никогда не писал, потому что в целом это аггретатор моделей, а не какая-то новая модель. Просто на сайте есть куча пресетов и нейроэффектов (по сути, LoRA для видео). Иногда это даёт прикольный результат, и для определённых задач выходит лучше и быстрее, чем пытаться добиться того же через промпт в другом генераторе. Для художников удобно, но с технической точки зрения ничего любопытного.

А теперь про их новую t2i-модель — Soul. Судя по черри-пикам в твиттере, это и правда очень красивая и реалистичная модель. Что мы видим на самом сайте? Куча готовых пресетов и стилей. Я взял рандомный промпт из галереи (отмечу, что все они там очень длинные) и провёл тесты:

1⃣ Оригинальный промпт + оригинальный пресет «office beach».
2⃣ Оригинальный промпт + пресет «general» (то есть базовая, не затюненная версия модели).
3⃣ Другой промпт из галереи + оригинальный пресет «office beach».
4⃣ Другой промпт + его родной пресет «movie».
5⃣ Другой промпт + пресет «general».

Для сравнения я прогнал те же промпты через Runway (6,7) и Flux dev (8,9).

Итог предсказуем: магии не случилось. Удивлен, что generation diversity ≈ 0, что видно из последней пикчи (10), они больше похожи на вариации одной общей картинки, а не на новые изображения. Есть подозрение, что они просто берут случайную фотку из трейна (ближайшуюу по клип скору) по заданному стилю и в этом же стиле перерисовывают, помешивая промпт и добавляя LoRA. По сути, это тот же Flux либо HiDream, но с пачкой действительно качественных LoRA-пресетов. Какие-то вещи повторить быстро и легко можно, но вряд ли выйдет создать что-то принципиально новое.

И что самое ироничное, со всеми этими «четырёхэтажными» промптами, которые даже не влезли в лимит Runway в 1000 знаков, последний, по-моему, справился даже лучше! Может, чуть меньше реализма, но с точки зрения стиля, атмосферы и эстетики... Просто посмотрите на ковбоя от Runway.

P.S. Все генерации сделаны с первого раза.

higgsfield.ai

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM