Machinelearning – Telegram
382K subscribers
4.43K photos
851 videos
17 files
4.87K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Media is too big
VIEW IN TELEGRAM
✔️ ИИ-система Locus превзошла экспертов в научных исследованиях.

Лаборатория Intology представила новую итерацию своего ИИ-ученого — систему Locus. Главным достижением стал результат на бенчмарке RE-Bench, где Locus обошел команду людей-экспертов, набрав 1.30 балла против человеческих 1.27.

В отличие от агентов, которые упираются в потолок производительности уже через пару часов работы, Locus способен поддерживать прогресс на протяжении нескольких дней. Система использует параллелизацию для одновременного запуска тысяч экспериментов, что позволяет ей решать задачи, требующие глубокого погружения и долгосрочного планирования.

Помимо исследований, Locus показала высокие результаты в оптимизации. В тесте KernelBench она добилась ускорения операций LayerNorm до 100 раз, применив сложные техники асинхронного копирования вместо простого перебора.
intology.ai

✔️ OpenAI открыла доступ к групповым чатам с ChatGPT для всех.

Компания развернула функцию коллективных обсуждений на всех тарифных планах, от Free до Pro. В новой функции пользователи могут создавать треды вместимостью до 20 человек, где нейросеть выступает полноценным участником разговора. Доступ открывается через инвайт-ссылки.

ChatGPT анализирует ход разговора и вступает в диалог либо при прямом упоминании, либо когда алгоритм сочтет вмешательство уместным. Тарификация за генерацию ответов ложится на того пользователя, чей запрос или действие активировали модель в данный момент.

Групповые чаты, по словам OpenAI, полностью изолированы. Бот не сохраняет данные в свою память и игнорирует персональные настройки участников, чтобы избежать утечки личного контекста в общий чат.
openai.com

✔️ Salesforce анонсировала инструменты для контроля за ИИ-агентами.

Компания расширила функциональность платформы Agentforce 360, добавив средства мониторинга и отладки для ИИ-систем. Техническая база обновления включает продвинутую модель трейсинга сессий. Система теперь логирует полный контекст работы агента: пользовательские вводы, внутренние цепочки рассуждений, вызовы LLM и проверки безопасности.

Дополнительный слой управления обеспечивает MuleSoft Agent Fabric — хаб для оркестрации и аудита всех активных агентов в инфраструктуре. Это позволяет разработчикам получать метрики в реальном времени, анализировать паттерны и устранять ошибки до того, как они повлияют на продакшен.
salesforce.com

✔️ Hugging Face AnyLanguageModel: универсальная библиотека для экосистемы Apple.

Инструмент, представленный ИИ-хабом, позиционируется как замена стандартного фреймворка Apple Foundation Models. Пакет унифицирует взаимодействие с нейросетями, позволяя разработчикам использовать единый API для работы с разными бэкендами. Библиотека поддерживает как нативный запуск локальных моделей (через Core ML, MLX, llama.cpp и Ollama), так и подключение к облачным провайдерам.

AnyLanguageModel решает проблему конфликта зависимостей за счет использования traits из Swift 6.1. Это дает строгую модульность: если проекту нужен только MLX-движок, библиотека не будет тянуть в сборку лишний код для других форматов. Сейчас решение находится в ранней стадии, но в планах заявлена поддержка вызова инструментов и протокола MCP.
huggingface.co

✔️ Stability AI и Warner Music Group займутся разработкой моделей для музыкальной индустрии.

Stability AI и мейджор-лейбл объявили о партнерстве, цель которого — создание профессиональных инструментов для генерации аудио, безопасных с юридической точки зрения.

В отличие от существующих решений, новые модели будут обучаться исключительно на лицензионном контенте, что позволит артистам и продюсерам использовать результаты генерации в коммерческих треках без риска нарушения авторских прав.

Компании планируют привлекать к разработке самих музыкантов, чтобы софт решал реальные задачи, а не просто создавал случайные мелодии.
stability.ai

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5429🔥6🦄3🥰2🙈2
🖥 NVIDIA опубликовали гайд: как масштабировать биологические модели.

Всё сводится к трём ключевым идеям:

1) Использовать Transformer Engine подменяет стандартные блоки на оптимизированные версии: меньше памяти, быстрее матричные операции, поддержка FP8/FP4. Это сразу увеличивает скорость обучения и инференса.

2) Масштабировать обучение до миллиардов параметров
Через FSDP и гибридные режимы параллелизма можно разнести модель по нескольким GPU или узлам. И главное, конфигурация уже готова, не нужно собирать всё вручную.

3) Экономить память за счёт sequence packing
Обычно биологические последовательности сильно различаются в длине, и половина батча забита паддингами. Packing позволяет «сжимать» батч, убирая пустые токены, итог: выше скорость, меньше VRAM.

Писать CUDA-ядра вручную никто не хочет. BioNeMo Recipes позволяют использовать привычный стек PyTorch + HuggingFace, но при этом получать производительность уровня «больших» фреймворков.

https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/

@ai_machinelearning_big_data

#NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👌3620👍15🔥4🦄3❤‍🔥1👏1
⚡️ Nano Banana Pro в LMArena.

Еще одно место, где можно бесплатно попробовать топовую модель.

LMArena добавила в список моделей Nano Banana Pro, у них она называется gemini-3-pro-image-review(nano-banana-pro) .

Выбор модели доступен в режимах Direct Chat (генерация на одной выбранной модели) и Side-by-Side (генерация на 2-х выбранных моделях для сравнения результата).

Поддерживается как text-to-image, так и загрузка рефересных картинок.

Единственный минус - нет выбора разрешения (1К, 2K или 4K) и соотношения сторон.

Про лимиты на количество запусков информации нет, запускайте, пока запускается.

🔜 Пробуем лучшую модель тут

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5022🥰7🦄6
🌟 RL-фреймворк для обучения MoE-моделей от создателей Chatbot Arena.

Miles - фреймворк для RL-обучения от команды LMSYS ORG, ориентированный на энтерпрайз-уровень.

Если вы следите за опенсорс разработками, вы наверняка слышали о предшественнике этой системы, проекте slime. Это легкий инструмент, который используют во многих современных пайплайнов пост-трейна. На нем, кстати, запускали GLM-4.6.

Slime доказал, что легковесный дизайн работает, и Miles делает следующий шаг - масштабное обучение архитектур MoE и поддержка тяжелых промышленных нагрузок.

🟡Технические детали.

Miles предлагает то, что называют "True On-Policy". Раньше между тренировкой и инференсом часто возникало расхождение. Теперь же, благодаря инфраструктурному подходу, LMSYS добилась нулевой дивергенции. Это стало возможным благодаря использованию Flash Attention 3, библиотеки DeepGEMM и ядер от Thinking Machines Lab, работающих в связке с torch.compile.

Вторая особенность - в использовании спекулятивного декодирования. Обычно в RL черновая модель замораживается, что мешает ей следовать политике целевой модели. LMSYS добавили онлайн-обучение черновой модели.

Результаты на тестах положительные: ускорение генерации более чем на 25%, особенно на поздних стадиях обучения.

🟡Стабильность.

Для энтерпрайза память - это деньги. В Miles включили механизмы, предотвращающие падение системы при некритичных ошибках OOM и исправили чрезмерное потребление памяти в FSDP.

В дорожной карте проекта обещают поддержку мультимодального обучения, совместимость со SGLang v2 и расширенное спекулятивное декодирование.


🟡Статья
🖥Github


@ai_machinelearning_big_data

#AI #ML #RL #Miles #LMSYS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍94❤‍🔥1211🔥9🦄4💋1💘1
🌟 LLM Council: на ваши запросы отвечает совет из языковых моделей.

Андрей Карпаты опять выходит на связь опубликовал очередной vibecode проект.

Его идея в том, что вместо того, чтобы задавать вопрос одной LLM, вы можете объединить их в «Совет моделей».

LLM Council - это простое локальное веб-приложение, с интерфейсом как у ChatGPT, но с той разницей, что запрос отправляется через Openrouter нескольким LLM. Полученные ответы перекрестно оцениваются и ранжируются, и, наконец, «модель-председатель совета» формирует окончательный ответ.

Более подробно процесс выглядит так:

🟢Этап 1: Сбор мнений. 
Запрос отправляется всем моделям по отдельности, и их ответы собираются. Ответы каждой модели отображаются в отдельной вкладке, чтобы можно было их посмотреть вручную.

🟢Этап 2: Рецензирование. 
Каждая модель получает ответы других моделей. При этом идентификаторы анонимизированы, чтобы исключить «игру в любимчиков» при оценке чужих результатов. На этом этапе ответы ранжируются их по точности и глубине анализа.

🟢Этап 3: Итоговый ответ. 
Модель-председатель принимает все ответы моделей и компилирует их в единый окончательный ответ.


⚠️ Для использования нужен API-ключ OpenRouter. На платформе есть бесплатные модели


🖥Github


@ai_machinelearning_big_data

#AI #ML #LLMCouncil #Github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
70🔥34👍27🤣18🦄6🤨1
🚀 Яков и Партнёры вместе с Yandex B2B Tech выпустили отчёт о применении облачных технологий в бизнесе.

▶️ Облако реально увеличивает прибыль: почти половина компаний отмечает эффект свыше 3% EBITDA, а в цифровых отраслях — более 5%.

▶️ Расходы на облако растут: у половины организаций они уже превышают 5% ИТ-бюджета, а более 30% планируют их увеличить.

▶️ Российский рынок облаков пока умерен по инвестициям в сравнении с мировыми игроками, поэтому потенциал роста огромен.

▶️ Главный критерий выбора провайдера — качество технологий и сервисов, а не цена. Это признак зрелого рынка.

▶️ Гибридная модель становится стандартом: свыше 70% компаний используют одновременно public cloud и on-premises, PaaS и SaaS проникли к 65–66%.

▶️PaaS — главный драйвер внедрения ИИ. Компании с развитым облаком быстрее запускают AI-проекты благодаря масштабируемым ресурсам.

Облако — критическая база для цифровой трансформации и ИИ. Бизнес всё осознаннее выбирает провайдера, рассматривая облако как фундамент стратегических технологий.
Please open Telegram to view this post
VIEW IN TELEGRAM
23🤣10👍9🔥5🤬42
✔️ OpenAI входит в сложный период, а Google стремительно усиливается

The Information опубликовала внутреннее письмо Сэма Альтмана, и его тон сильно отличается от привычного оптимизма OpenAI.

CEO прямо предупреждает команду: впереди могут быть серьёзные вызовы.

1. Google сделал резкий рывок
Альтман признаёт, что Google заметно ускорился в области ИИ.
Теперь OpenAI - не компания с комфортным отрывом от конкурентов, а участник гонки, которому снова нужно догонять.

2. Рост OpenAI может существенно замедлиться
По данным источников, к 2026 году рост выручки может уменьшится в разы.

Для компании, которая только что росла взрывными темпами, это серьёзный сигнал.

3. Внутри OPENAI ощущается напряжение
Атмосферу описывают как *«rough vibes»*: меньше уверенности в своих силах, больше осторожности.

Команда впервые за долгое время чувствует давление и неопределённость.

Фаза бурного роста заканчивается, начинается период конкуренции и стратегической выносливости.
OpenAI остаётся сильнейшим игроком, но теперь марафон важнее спринта.

https://www.theinformation.com/articles/openai-ceo-braces-possible-economic-headwinds-catching-resurgent-google

@ai_machinelearning_big_data

#AI #OpenAI #Google #TechNews
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7124🤣17🔥7🗿6😁2🦄2😢1
👑 Gemini 3 Pro теперь лидирует в IQ-тестах, набрав внушительные 130 баллов, опережая все прочие LLM!

По шкале IQ такой результат помещает её в число примерно 2% людей с наивысшим интеллектом среди всех, кто когда-либо проходил подобные тесты.

А в тесте норвежского отделения Mensa модель показала эквивалент 142 баллов IQ, что соответствует уровню лишь 0,3% самых интеллектуальных людей на планете.

@ai_machinelearning_big_data

#Gemini #google
76🔥37👍19😁10🗿7🦄4
⚡️ МТС провела шоу-финал всероссийского ИТ-чемпионата в гибридной реальности.

Более 14 тысяч участников – школьники, студенты и опытные айтишники - боролись за звание лучших в алгоритмическом и робототехническом программировании True Tech Champ, но в финал в Москве выбились только 350 из них.

Заключительный этап прошел в формате шоу-битвы роботов в гибридной реальности:
🟡сложные лабиринты с необычными поверхностями;
🟡парящие платформы;
🟡4 тысячи зрителей в зале;
🟡почти миллион онлайн-наблюдателей.

Первое место и 1 млн рублей в первом треке забрал Максим Гороховский из Москвы. Во втором треке победу одержала команда «Зато по ГОСТу» - 4 млн рублей разделили Андрей и Михаил Семенищевы. Общий призовой фонд составил 10 млн рублей.


📎 Интересный факт: по мировой статистике, 80% победителей подобных олимпиад сегодня работают в крупнейших технологических компаниях или создали собственные бизнесы стоимостью более 100 млн долларов.

«Турниры развивают умение работать под давлением, дисциплину и креативность, а также становятся площадкой для ИТ-комьюнити, где единомышленники общаются и обмениваются опытом. Такой нетворкинг может стать основой для создания перспективных технологических проектов», - прокомментировал генеральный директор МТС Web Services Павел Воронин.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
36😁19👍10🔥6👌5🦄3🤓1
This media is not supported in your browser
VIEW IN TELEGRAM
📡 Amazon Leo: новый конкурент Starlink

Amazon представил первый рабочий образец своей новой спутниковой антенны - Amazon Leo Ultra - и открыл *ограниченный доступ* для корпоративных клиентов.

— до 1 Гбит/с на скачивание
— до 400 Мбит/с на загрузку
— работает на собственном чипе Leo Silicon

Проект Kuiper теперь называется Amazon Leo. Компания строит сеть из 3000+ спутников на низкой орбите для быстрого широкополосного интернета.

Антенна использует **фазированную решётку** - она электронно направляет луч и отслеживает спутники без моторов, сохраняя связь даже при вибрациях и дожде.

Но Amazon сильно отстаёт от Starlink:
— Starlink уже имеет 9000+ спутников,
— у Amazon — менее 200, хотя запуски продолжаются.

Важно: высокая скорость на бумаге работает только при плотной сети, хорошем спектре и мощной наземной инфраструктуре.

Amazon делает серьёзный шаг, но догнать Starlink будет очень сложно.

https://www.aboutamazon.com/news/amazon-leo/amazon-leo-satellite-internet-ultra-pro

@ai_machinelearning_big_data


#AmazonLeo #ProjectKuiper #SatelliteInternet #LEO #Amazon
👍7016🔥11😨6🤬2🤓1
⚡️ Claude Opus 4.5.

Anthropic выпустила Claude Opus 4.5, которую назвала «лучшей в мире».

Модель по тестам выбивает топовые результаты в программировании и работе с агентами. Говорят, что она даже превзошла всех кандидатов-людей на внутреннем тесте.

Модель подешевела. Цена за 1 млн. токенов теперь составляет $5 на вход и $25 на выход.

Для разработчиков добавили новый параметр (low, high и medium), позволяющий балансировать между скоростью ответа и качеством генерации.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
59🔥32👍21🥰7🤣6🤔3🤬3👏1