Machine Learning | YeaHub – Telegram
Machine Learning | YeaHub
335 subscribers
244 photos
126 videos
362 links
Теория, подготовка к интервью и курсы для ML специалистов

YeaHub — это платформа для IT-специалистов, объединяющая обучение, карьерный рост, развитие и сообщество единомышленников.

Платформа: https://yeahub.ru

Для связи: @ruslan_kuyanets
Download Telegram
#полезное
👨‍💻 Black Forest Labs выложили веса FLUX.1 Kontext [dev]

Она, конечно, заметно слабее чем pro и max, но всё ещё часто обходит нативную генерацию изображений в gpt-image на собственных бенчах BFL и с огромным отрывом лучшая модель с доступными весами. Для владельцев видях Blackwell выкатили ещё и официальные TensorRT версии — в fp8 и fp4. Они качеством, конечно, похуже, но вплоть до двух раз быстрее плюс требуют меньше видеопамяти.

Для некоммерческого использования модель бесплатная. За коммерческое использование придётся платить — $999 долларов в месяц за 100к сгенеренных изображений, всё что больше 100к генераций в месяц — 1 цент за генерацию.

Веса

Оптимизированные TensorRT версии
Техрепорт
Код

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
📞 Xiaomi представила умные очки с камерой и голосовым ассистентом.

Xiaomi анонсировала свои первые умные очки с ИИ, Xiaomi AI Glasses. Устройство получило 12-мегапиксельную камеру с электронной стабилизацией, четырехъядерный процессор Snapdragon AR1, микрофоны с костной передачей звука и фирменный голосовой ассистент Hyper Xiao Ai. В отличие от Ray-Ban, у Xiaomi нет дисплея, но есть уникальная функция: оплата через QR-коды Alipay голосом, которая появится в сентябре 2025 года по OTA-обновлению.

Аккумулятора хватает на 8,6 часов активного использования. Очки весят 40 грамм, поддерживают съемные линзы (включая электрохромные) и работают до 21 часа в режиме ожидания. Базовая версия стоит $280, а с затемненными линзами - примерно $420. Устройство, правда, оптимизировано под азиатские формы лица, это может ограничить глобальный запуск. На китайской площадке JD.com за первые часы предзаказ собрал 25 тысяч заявок.
roadtovr.com

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
#Собес #git
🤔 Что такое HEAD с точки зрения Git?

HEAD в Git - это указатель на текущую ветку или коммит. Он показывает, над чем вы сейчас работаете, и меняется при переключении веток или выполнении коммитов.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
🤓 Cloud.​ru анонсировал AI-помощника для автоматизации работы с облаком

На конференции GigaConf провайдер облачных и AI-технологий Cloud.​ru сделал два анонса: запуск AI-помощника Клаудии и открытие общего доступа к платформе Cloud.​ru Evolution AI Factory. Инструменты упрощают работу с облачными технологиями и AI для пользователей со всеми уровнями технического бэкграунда.

AI-помощник в режиме Public Preview консультирует пользователей и выполняет конкретные действия по управлению ресурсами. Он самостоятельно разворачивает виртуальные машины, подбирает оптимальную конфигурацию сервисов, настраивает мониторинг и алертинг, а также работает с консолью в режиме co-pilot. Зная архитектуру платформы, помощник дает персональные рекомендации и автоматизирует рутинные DevOps-задачи. Эти инструменты помогут разработчикам стартапов и pet-проектов без особого опыта в облачных технологиях быстрее запускать проекты, а опытным DevOps и SRE-инженерам — сосредоточиться на стратегических задачах.

Также провайдер открыл доступ к Cloud.​ru Evolution AI Factory — облачной среде с готовыми инструментами для работы с LLM и создания мультиагентных систем. В нее входят шесть сервисов: Foundation Models для работы с моделями через API, ML Inference для развертывания моделей, Managed RAG для технологии дополненной генерации, ML Finetuning для адаптации LLM-моделей, Notebooks для работы с Jupyter Notebooks и AI Agents — визуальный редактор агентов на базе LLM. Инструменты подходят для разных задач: от автоматизации поддержки клиентов до оптимизации документооборота и управления поставками.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
😱 Играемся с CV

Зацените, что нашёл на выходные:

Вот вам пара небольших, несложных и практически бесполезных штуковин, в которые просто интересно поиграться.

Концепт интересный и, думаю, многим приходил в голову. Здесь у нас реалитайм-трекинг рук, который привязан к паре заранее записанных дорожек их параметрам. Всё работает на three.js, MediaPipe, HTML/CSS/JS. Подобных проектов там ещё 7. Кроме этого мне больше всех зашёл генератор шейдеров.

Для новичков вообще топ, гайды по сборке своей похожей CV-игрушки доступны за 10 баксов. Но, кажется, здесь и Gemini сравится, хотя от этого играть не менее интересно)
линк

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Даже Хемингуэй плакал от этой истории.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес #ScikitLearn
🤔 Как работать с многовыходными задачами в Scikit-Learn?

Scikit-Learn предоставляет инструменты для работы с многовыходными задачами через MultiOutputRegressor и MultiOutputClassifier. Эти мета-оцениватели позволяют применить один классификатор или регрессор для каждого выходного параметра.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
1
#полезное
👨‍💻 GitHub Copilot Chat для VS Code выкатили в опенсорс — Microsoft открыла весь исходный код самого популярного чат-бота для программистов под лицензией MIT.

Теперь можно изучить всю кодовую базу ИИ-агента, пощупать, как он работает, потестить фичи, внимательнее рассмотреть контекст и даже внедрить свои наработки. Исправление багов так же приветствуется.

Играемся — здесь.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
1
#Собес #ScikitLearn
🤔 Как работать с текстовыми данными в Scikit-Learn? Приведи пример предобработки текста с использованием Scikit-Learn.

B Scikit-Learn для обработки текстовых данных используются векторизаторы, такие как CountVectorizer и TfidfVectorizer. CountVectorizer преобразует текст в числовые векторы, используя частоту слов, а TfidfVectorizer учитывает не только частоту, но и уникальность слов.

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
👍 Higgsfield Soul - новая text2image модель?

Ребята явно решили замахнуться на кусок пирога Midjourney. В твиттере сейчас только о них и говорят, называя их новый генератор картинок Soul самым реалистичным и эстетичным. Но так ли это?

Higgsfield — это изначально апка с видеогенераторами. Я про нее никогда не писал, потому что в целом это аггретатор моделей, а не какая-то новая модель. Просто на сайте есть куча пресетов и нейроэффектов (по сути, LoRA для видео). Иногда это даёт прикольный результат, и для определённых задач выходит лучше и быстрее, чем пытаться добиться того же через промпт в другом генераторе. Для художников удобно, но с технической точки зрения ничего любопытного.

А теперь про их новую t2i-модель — Soul. Судя по черри-пикам в твиттере, это и правда очень красивая и реалистичная модель. Что мы видим на самом сайте? Куча готовых пресетов и стилей. Я взял рандомный промпт из галереи (отмечу, что все они там очень длинные) и провёл тесты:

1⃣ Оригинальный промпт + оригинальный пресет «office beach».
2⃣ Оригинальный промпт + пресет «general» (то есть базовая, не затюненная версия модели).
3⃣ Другой промпт из галереи + оригинальный пресет «office beach».
4⃣ Другой промпт + его родной пресет «movie».
5⃣ Другой промпт + пресет «general».

Для сравнения я прогнал те же промпты через Runway (6,7) и Flux dev (8,9).

Итог предсказуем: магии не случилось. Удивлен, что generation diversity ≈ 0, что видно из последней пикчи (10), они больше похожи на вариации одной общей картинки, а не на новые изображения. Есть подозрение, что они просто берут случайную фотку из трейна (ближайшуюу по клип скору) по заданному стилю и в этом же стиле перерисовывают, помешивая промпт и добавляя LoRA. По сути, это тот же Flux либо HiDream, но с пачкой действительно качественных LoRA-пресетов. Какие-то вещи повторить быстро и легко можно, но вряд ли выйдет создать что-то принципиально новое.

И что самое ироничное, со всеми этими «четырёхэтажными» промптами, которые даже не влезли в лимит Runway в 1000 знаков, последний, по-моему, справился даже лучше! Может, чуть меньше реализма, но с точки зрения стиля, атмосферы и эстетики... Просто посмотрите на ковбоя от Runway.

P.S. Все генерации сделаны с первого раза.

higgsfield.ai

👉Новости 👉База вопросов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM