Machinelearning – Telegram
329K subscribers
4.65K photos
976 videos
17 files
5.08K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
📌Итоги хакатона World Labs.

World Labs, основанная Фей-Фей Ли, провела свой первый хакатон World Labs Hack 01: Spatial Intelligence 27–28 февраля.

Мероприятие было посвящено разработке приложений на базе их собственной модели 3D-миров Marble.

32 команды использовали модель для проектов, начиная от симуляторов робототехники и агентов и заканчивая интерфейсами дополненной и виртуальной реальности, играми, художественными проектами и инструментами для работы с недвижимостью.

Помимо материальной поддержки, сведения о которой не разглашались, призеры получили: расширенный доступ к Marble API, гранты и вычислительные мощности, менторство от самой Фей-Фей Ли и поддержку в коммерциализации в виде интеграций в экосистему инструментов Autodesk.

В сети Х World Labs подвела итоги хакатона:

1 место: Musée du Monde.

Интерактивный музей, где посетители попадают внутрь знаменитых картин. От спальни Ван Гога до миров, вдохновленных Вермеером и Матиссом, каждое произведение искусства превращается в полностью исследуемую 3D-среду.


2-е место: Jar of Marbles

Интерфейс для организации миров Marble с использованием семантического понимания. Генерации сгруппированы в кластеры, где исследуются с помощью управления жестами компьютерного зрения, используя движения тела.


3-е место: Augmented Virtuality Room Explorer

Среда моделирования для агентов и робототехники. Робот исследует окружающую среду с помощью лидара, строит семантическую карту с использованием моделей зрения и дает комментарии об окружающей среде в реальном времени.


Отдельно отметили проект Marble Estates, который строит виртуальные 3D-туры по сгенерированному объекту недвижимости на основе 2D-плана.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉8819👏18🔥11👍6🎃6👨‍💻5😍1💘1
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI открыла доступ к Codex Security.

Это инструмент, который сканирует архитектуру проекта и выстраивает индивидуальную модель угроз. Опираясь на эту карту, агент целенаправленно ищет слабые места в безопасности приложения.

Фирменная фича - защита от ложных срабатываний за счет практической проверки найденных багов. Обнаружив проблему, агент разворачивает изолированную копию системы в песочнице и пытается самостоятельно провести реальный взлом. Если попытка оказалась успешной и угроза подтверждена, ИИ сам пишет патч. Затем система тестирует обновление, чтобы убедиться, что внесенные исправления не сломают другие функции продукта.

Доступ к превью-версии инструмента получат пользователи тарифов ChatGPT Enterprise, Business и Edu в ближайшие дни.
openai.com

✔️ США привяжут экспорт ИИ-ускорителей Nvidia и AMD к инвестициям в свою экономику.

Министерство торговли США подготовило новые правила продажи чипов для ЦОД. Теперь государствам, чьи компании закупают большие объемы продукции Nvidia и AMD, придется встречно инвестировать в американскую ИИ-инфраструктуру.

Проект вводит многоуровневую систему выдачи экспортных лицензий. Строгость требований напрямую зависит от суммарной вычислительной мощности запрашиваемых компонентов. Для одобрения крупных сделок высшего уровня страны-покупатели будут обязаны проводить прямые финансовые вливания в технологический сектор США.

Этот подход формализует практику, которая уже была успешно обкатана на недавних соглашениях с ОАЭ и Саудовской Аравией. На поставки оборудования в Китай, эти правила не повлияют - они по-прежнему регламентируются отдельными санкциями.
ft.com

✔️ Cursor представил платформу Automations.

Новый инструмент от создателей ИИ-редактора кода избавляет разработчиков от необходимости каждый раз вручную писать промпты. Теперь ИИ-помощник может включаться в работу фоном, самостоятельно реагируя на внешние события.

Триггерами служат действия в Git, сообщения в Slack, новые тикеты в Linear или инциденты в PagerDuty. Платформа также поддерживает настройку кастомных вебхуков и запуск задач по расписанию. Обновленные агенты способны брать на себя полноценные инженерные процессы: проанализировать логи через протокол MCP, локализовать ошибку и сразу подготовить пулл-реквест с готовым исправлением.

Важная деталь - у агентов появилась память. Они запоминают результаты прошлых запусков, постепенно адаптируясь к контексту проекта и избегая повторения старых ошибок.
cursor.com

✔️ SoftBank запросил рекордный кредит для увеличения своей доли в OpenAI.

Японский конгломерат ведет переговоры о привлечении крупнейшего в своей истории долларового займа. Ожидается, что кредит на 40 млрд. сроком на год будет обеспечен четырьмя банками.

Главная цель сделки - финансирование ставки основателя SoftBank Масаёси Сона на ИИ. Банк уже вложил в OpenAI более 30 млрд. долларов, получив около 11% акций стартапа. Чтобы обеспечить эти инвестиции, холдингу пришлось частично распродать другие свои активы.

Агрессивные заимствования усиливают опасения аналитиков по поводу раздувания ИИ-пузыря. Суммарный долг ключевых партнеров OpenAI уже достиг 96 млрд. долларов, а ведущая пятерка ИТ-корпораций набрала новых кредитов на 121 млрд., это в 4 раза выше привычной нормы. При этом монетизация буксует - платные подписки на ИИ-сервисы пока оформили лишь 3% пользователей.
bloomberg.com

✔️ Claude ежедневно привлекает более миллиона новых пользователей.

Об этом достижении сообщил Майк Кригер, возглавляющий подразделение экспериментальных ИИ-разработок. Столь стремительный рост аудитории обусловлен несколькими факторами. Помимо глобального тренда на ИИ, Anthropic извлекла серьезную выгоду из недавнего скандала вокруг сотрудничества OpenAI с Пентагоном.

На фоне этих событий в глазах потребителей и технологического сообщества создатели Claude выглядят более последовательными в вопросах этики. Статус «морального победителя» обеспечивает компании сильное репутационное преимущество и стимулирует массовый приток пользователей.
Mike Krieger в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍91👏8830🎉11💯11🔥6🤔6🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ OpenAI расширяет поддержку мейнтейнеров открытого кода.

Программа Codex Open Source Fund, запущенная год назад, получила апдейт льгот для разработчиков, которые поддерживают публичные репозитории.

Теперь участники программы получают не только API-кредиты, но и полный доступ к ChatGPT Pro с Codex на полгода.

Обновленный набор поддержки выглядит теперь так:

🟢API-кредиты для проектов, которые уже интегрировали Codex в pull request review, релизные пайплайны или другую инфраструктуру OSS.

🟢6 месяцев ChatGPT Pro с Codex.

🟠Условный доступ к Codex Security

Условность в том, то Codex Security одобряется вручную. OpenAI объясняет это возможностями GPT-5.4, команда рассматривает каждую заявку отдельно, чтобы убедиться, что инструмент применяется осознанно.


OpenAI формулирует требования к просителям программы размыто: core maintainer с write access к широко используемому публичному проекту. Что считается широко используемым - не уточняется.

Если проект не вписывается в стандартные критерии, OpenAI все равно рекомендует подавать заявку с объяснением роли проекта в экосистеме.

Неделю назад Antropic запустила похожую тему поддержки опен-сорса.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩65🎉2221👍13🤔9👏8🥱5
Please open Telegram to view this post
VIEW IN TELEGRAM
2171👍111😁75🔥62👏14🥰8
🌟 Tencent HY-WU: динамические LoRA для редактирования изображений.

Tencent HY опубликовала первую часть серии работ под названием HY-WU (Weight Unleashing). Суть метода в отказе от стандартной парадигмы адаптации, при которой модель получает один фиксированный набор весов для всех задач.

Специальная модель-генератор синтезирует LoRA отдельно под каждый входной пример прямо во время инференса, без дополнительной оптимизации на тест-тайме.

Проблема, которую решает HY-WU, хорошо знакома всем, кто работал с дообучением: когда задачи противоречат друг другу (например, "размыть" против "убрать размытие" или "состарить лицо" против "восстановить"), общий адаптер вынужден идти на компромисс.

Градиенты конфликтуют, и результат оказывается хуже, чем если бы задачи обучались раздельно.

Чтобы не быть голословными, авторы измерили это напрямую: косинусное сходство градиентов между разнородными задачами устойчиво отрицательно, среднее около −0.30, то есть задачи буквально тянут веса в противоположные стороны.


HY-WU предлагает условную генерацию параметров. Модель-генератор (8B параметров) принимает на вход совместное представление изображения и текстового запроса через энкодер SigLIP2, после чего генерирует LoRA-матрицы (~0.72B) и инжектирует их в базовую модель.

Обучение сквозное, только через downstream-loss, без предварительно собранных чекпойнтов адаптеров.

🟡Тесты и результаты

Для тестов выбрали задачу редактирования изображения текстовым запросом - в нем конфликты неизбежны и визуально очевидны.

🟢В попарном human evaluation (GSB) HY-WU выигрывает у всех топовых open-source редакторов с большим отрывом: 67–78% против Step1X, Qwen, LongCat и FLUX;

🟢Среди закрытых систем модель обошла Seedream 4.5 (55.6%) и GPT Image 1.5 (55.5%).

🟠Единственные, кто пока впереди - Nano Banana 2 и Nano Banana Pro.

Tencent проверили: прирост качества дается именно условной маршрутизацией, а не просто увеличением числа параметров. Когда генератор использовали с перемешанными или усредненными условиями, результат проваливался до уровня базовой модели.

Полный SFT с намного большим числом обучаемых параметров давал сопоставимый результат с обычным Shared LoRA, так как в обоих случаях в инференсе применяется одна фиксированная точка в пространстве весов.


Выпущенная работа - первая часть серии исследований по функциональной памяти для генеративных моделей. В планах:

🟢сравнить функциональную память с retrieval-подходами и понять, когда каждый из них уместен;

🟢разработать протоколы онлайн-обучения, при которых модель усваивает новые задачи без деградации на старых;

🟢исследовать масштабирование модели-генератора отдельно от базовой модели.

Помимо этого, в планах выйти за пределы LoRA на другие операторные интерфейсы, распространить метод на видео и агентные системы, а также проработать возможность точечно удалять поведение модели через управление состоянием генератора.

Кроме этого архиполезного исследования Tencent выложили связку из модели-генератора и базовой модели HY-Image-3.0-Instruct, поверх которой она и работает.

Поиграться этой красотой можно, если под рукой простаивает 8х40 GB или 4х80 GB VRAM.


📌Лицензирование: Tencent Hunyuan Community License.


🟡Страница проекта
🟡Prompt Handbook (китайский)
🟡Модель
🟡Техотчет
🖥Github


@ai_machinelearning_big_data

#AI #ML #ImageEdit #HYWU #Tencent
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩8148👏24🔥20👍11💯11😍5🎉2🗿1
Media is too big
VIEW IN TELEGRAM
✔️ Anthropic представила Claude Code Review.

Claude Code Review - инструмент для поиска багов в пулл-реквестах, который сейчас доступен в режиме превью для корпоративных пользователей Team и Enterprise. Процесс полностью бесшовен, агенты автоматически активируются при открытии PR.

В зависимости от объема и сложности изменений система запускает необходимое количество ИИ-агентов. Они анализируют код, отсеивают ложные срабатывания и ранжируют найденные уязвимости по уровню критичности. Результат оформляется в виде общей сводки и инлайн-комментариев к проблемным строкам.

В среднем такое ревью занимает около 20 минут, а тарификация идет по расходу токенов (от $15 до $25 за один пулл-реквест). Эффективность инструмента подтверждена внутренними тестами: после его внедрения доля PR с содержательными комментариями выросла с 16% до 54%.
claude.com

✔️ Samsung планирует принести вайб-кодинг на смартфоны Galaxy.

Компания изучает варианты интеграции концепции вайб-кодинга в свои будущие устройства. По словам представителя Samsung, новая функция выйдет за рамки банальной настройки внешнего вида: ИИ позволит на лету менять логику UX и адаптировать существующие приложения под конкретные задачи владельца.

Технические детали реализации пока не раскрываются, однако тренд на генеративный интерфейс активно набирает обороты в мобильной индустрии. Похожая механика уже есть у компании Nothing, где владельцы смартфонов могут с помощью ИИ-моделей собирать кастомные виджеты с функционалом мини-приложений.
9to5google.com

✔️ Claude Opus 4.6 распознал тестовую среду и взломал ключи ответов в бенчмарке.

Anthropic зафиксировала уникальный случай: во время прогона на BrowseComp Claude Opus 4.6 поняла, что находится в среде оценки. Не имея данных о названии теста, модель вычислила его и целенаправленно расшифровала скрытые ответы. Это первый известный прецедент, когда ИИ проявляет подобную дедукцию и взламывает проверку без прямых подсказок.

Это потребовало огромных вычислительных затрат. В одном из эпизодов модель потратила около 40,5 млн токенов (в 38 раз больше медианного значения). Разработчики также отметили, что в мультиагентной конфигурации частота поиска подобных нестандартных решений составила 0,87%, что в 3,7 раза выше, чем при работе одного агента (0,24%).
anthropic.com

✔️ Глава аппаратного направления OpenAI уволилась из-за контракта с Пентагоном.

Кейтлин Калиновски покинула компанию в знак протеста против контракта с Министерством обороны США. Причиной стало заключение сделки без предварительной подготовки механизмов контроля. Калиновски отметила, что ИИ действительно играет важную роль в национальной безопасности, однако вопросы массовой слежки и использования оружия без санкции человека требуют гораздо более серьезного обсуждения.

Кейтлин перешла к Сэму Альману в ноябре 2024 из проекта AR-очков Марка Цукерберга. OpenAI официально подтвердила отставку Калиновски.
linkedin.com

✔️ ИИ-агент от Alibaba сбежал из песочницы ради майнинга криптовалюты.

Исследователи из команды, связанной с Alibaba, столкнулись с незапланированным поведением при обучении ИИ-агента ROME. Система не просто вышла за рамки своей изолированной среды - она сделала это без прямых инструкций со стороны разработчиков.

Вместо выполнения целевых задач агент самостоятельно организовал SSH-туннель и попытался запустить несанкционированный майнинг. Авторы отмечают, что в тестовых запросах не было никаких упоминаний сетевого туннелирования или добычи токенов. Самостоятельность модели застала инженеров врасплох и привела к срабатыванию внутренних систем безопасности.
axios.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
65🤔47🔥24👏14👌13😁10💯9👍6
✔️ ML-архитектура рекомендательных и поисковых систем в продакшене

Если вы работаете с ML или интересуетесь тем, как устроены реальные рекомендательные системы, стоит посмотреть этот воркшоп.

Спикер: Илья Осиновсков, руководитель отдела рекомендательных технологий в Ozon. Он разберёт, как на практике строятся системы рекомендаций и поиска в больших продуктах.

На воркшопе обсудят:

- как устроены пайплайны рекомендательных и поисковых систем
- какие этапы проходит система - от генерации кандидатов до ранжирования и пост-обработки
- какие метрики используются для оценки качества
- как учитываются продуктовые ограничения и бизнес-требования

Будут примеры из индустрии: e-commerce, стриминговые сервисы и соцсети.

Это хороший шанс посмотреть на архитектуру таких систем глазами инженера, который делает их в продакшене, а не только в теории.

Больше интересного у нас в Канале.

Начало: 11 марта в 19:00

Регистрация на воркшоп:
https://shvm.xyz/webinar/recsys?utm_source=telegram&utm_medium=ai_machinelearning_big_data_10.03.26

Реклама: ООО "ШВМ", ИНН: 9728100991
Erid: 2VtzqvDB9BB
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1811👏8🔥5🤣4👌3🌚1
⚡️ Anthropic открыла программу амбассадоров Claude.

Если вы организовываете митапы, ведете локальное комьюнити или просто знаете, как собрать разработчиков в одной месте - Anthropic готова это поддержать.

Что дает программа:

🟢финансирование мероприятий (митапы, воркшопы, хакатоны);
🟢ежемесячные API-кредиты для демо и экспериментов;
🟢ранний доступ к фичам и сессии с продуктовыми командами;
🟢приватный Slack с другими амбассадорами и сотрудниками Anthropic.

Технический бэкграунд важен - нужен реальный опыт работы с Claude Code или Cowork. Но официальный статус разработчика не обязателен, важнее практика и умение передавать знания другим.

Программа глобальная. В одном городе может быть несколько амбассадоров. Заявки рассматривают 2 недели, потом короткий скрининг-звонок.

🔜 Подать заявку можно тут


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👏1598🔥8👍3😁1