Machinelearning – Telegram
382K subscribers
4.43K photos
851 videos
17 files
4.87K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
📢 Google уверенно выводит свои TPU на новый уровень — и делает это сразу по трём направлениям.

Компания развивает три семейства собственных ускорителей: Ironwood, Sunfish и Zebrafish.
Так Google закрывает потребности в высокопроизводительном инференсе, обучении моделей и создании огромных суперподов на 2026–2027 годов.

TPU уже используют Safe Superintelligence, Salesforce и Midjourney - то есть экосистема растёт.

**🚀 Ironwood (TPUv7):*

Это самое впечатляющее поколение TPU на сегодня:
• примерно 10× быстрее TPU v5
• примерно 4× производительнее TPU v6
• до 4,600 FP8 TFLOPS на чип
• 192 GB HBM3e
• масштабирование до 9,216 чипов в одном поде
• около 1.77 PB общей памяти

Такой уровень идеально подходит для LLM, где важны скорость и масштаб.

🔥 Sunfish (предположительно TPUv8)

Следующее поколение создаётся совместно с Broadcom.

Запуск ожидается ближе к концу 2020-х, и Sunfish должен стать главным ускорителем Google Cloud.

💡 Zebrafish: гибкая и массовая линейка

MediaTek выступает ключевым партнером по ASIC.
Zebrafish будет:
• более доступным по цене
• с гибкими характеристиками
• подходящим для локальных и более компактных кластеров

То есть не только для гигантских суперкомпьютеров, но и для широкого использования.

🌐 Зачем Google три разных TPU?

Это даёт компании возможность:
• разделять нагрузки между поколениями
• удерживать клиентов уровня Anthropic
• обеспечивать более 1 ГВт выделенной мощности
• конкурировать с Nvidia на уровне не только чипов, но целых систем

Google строит собственную вертикаль ИИ-инфраструктуры - масштабную, гибкую и рассчитанную на годы вперёд. Все это нужно, чтобы доминировать на рынке ИИ.

@ai_machinelearning_big_data

  #google #tpu
60👍53🔥15❤‍🔥2
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI выпустила GPT-5.1-Codex-Max.

GPT-5.1-Codex-Max - агентная модель для «тяжелой» разработки. Основной упор сделан на длительные процессы: теперь модель эффективнее справляется с многочасовым рефакторингом и сложными агентными циклами внутри IDE. Фишка релиза в технологии «уплотнения», благодаря которой модель удерживает контекст на миллионах токенов без потери связности.

По тестам, проведенным OpenAI в SWE-Bench Verified точность выросла до 77,9%, а в SWE-Lancer - почти 80%. Новинка уже стала дефолтной моделью в среде Codex для подписчиков Plus и Pro, а доступ через API разработчики получат в ближайшее время.
openai.com

✔️ Stack Overflow планирует стать провайдером данных для корпоративного ИИ.

На конференции Microsoft Ignite платформа объявила о смене стратегии: теперь это не просто база знаний, а инфраструктурный элемент для корпоративных нейросетей. Обновленный продукт Stack Internal конвертирует внутреннюю экспертизу компаний в формат, доступный ИИ-агентам через MCP.

Технически будет добавлен слой метаданных, формирующий рейтинг надежности. Система анализирует автора, актуальность и связность ответа, чтобы агент мог взвесить достоверность информации перед использованием. CEO компании признался, что этот шаг вдохновлен успешными сделками по продаже данных для обучения моделей (по аналогии с Reddit).
stackoverflow.blog

✔️ Microsoft запустила платформу Agent 365 для управления ИИ-агентами.

Agent 365 — инструмент, который позволяет организациям администрировать парк ИИ-агентов как обычных сотрудников. Платформа использует Microsoft Entra для создания единого реестра всех корпоративных ботов, присваивая каждому уникальный ID для строгого разграничения прав доступа и интеграции с корпоративными данными.

Помимо безопасности (за которую отвечают Defender и Purview), система предлагает специальные дашборды, которые показывают эффективность работы каждого агента в реальном времени. Agent 365 не замыкается на нативном Copilot Studio, он поддерживает open-source фреймворки и сторонние решения от партнеров MS. Инструмент уже появился в админ-панели Microsoft 365 в рамках программы тестирования.
microsoft.com

✔️ Manus тестирует расширение для популярных браузеров.

Manus запустила бета-тестирование Browser Operator — инструмента, который выводит ИИ-агентов из облачных песочниц в рабочую среду пользователя. Расширение, доступное для Chrome и Edge, позволяет автоматизировать действия в сервисах, требующих сложной авторизации (CRM, закрытые аналитические платформы), используя уже активные локальные сессии.

Через коннектор «My Browser» агент получает доступ к нужным вкладкам, а пользователь может в реальном времени наблюдать за его действиями, сохраняя контроль над безопасностью. На данный момент доступ открыт для подписчиков тарифов Pro, Plus и Team.
manus.im

✔️ xAI построит в Саудовской Аравии дата-центр на 500 МВт.

Компания Илона Маска объединилась с саудовской Humain и Nvidia для создания масштабного вычислительного хаба. Проект мощностью 500 мегаватт позволит разместить десятки тысяч GPU для тренировки и инференса следующих поколений моделей Grok.

Для xAI это стратегический шаг: собственный хаб за пределами США позволяет снизить зависимость от аренды облачных мощностей у прямых конкурентов. Структура сделки такая: Nvidia поставляет GPU, за саудитами - земля и финансирование, а xAI получает присутствие на Ближнем Востоке.
bloomberg.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5938🔥6🥰6💋1
This media is not supported in your browser
VIEW IN TELEGRAM
На AI Journey робот вызвал Путина на танцевальный баттл

Сбер показал антропоморфного робота Грина со встроенным ИИ. Разработке доверили самое ценное — танец перед президентом, и он не подвел.

ai_machinelearning_big_data
😁170🔥38🙈32🤣20🥰1810🤬10🤔8👍4🌚4🕊3
⚡️ Команда Google Research представила технологию живого перевода речи в речь, которая позволяет говорить на одном языке и почти мгновенно слышать перевод на другом.

Раньше процесс проходил через три этапа: распознавание речи, перевод текста и синтез новой речи, из-за чего задержка могла достигать десятков секунд.

Исследователи оптимизировали весь конвейер, сделали обработку более устойчивой и сократили время реакции. Перевод звучит естественнее, меньше «подправляется» в реальном времени, а паузы стали значительно короче.

Технология приближает момент, когда люди смогут свободно общаться, даже если не знают языка собеседника.

https://research.google/blog/real-time-speech-to-speech-translation

@ai_machinelearning_big_data

#Google #AI #Translation #SpeechToSpeech #GoogleResearch
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
120👍46🔥41😁4🥰3👻3
💡 DeepSeek выложили новый open-source проект — LPLB.

Это экспериментальный балансировщик нагрузки для моделей Mixture-of-Experts (MoE).

В репозитории описано, как система:
• динамически перераспределяет экспертов, опираясь на статистику нагрузки;
• создаёт реплики с учётом топологии кластера;
• решает оптимальное распределение токенов по экспертам через LP-решатель, работающий прямо на GPU (cuSolverDx + cuBLASDx);
• использует метрики загрузки, полученные вручную, через torch.distributed или через буферы Deep-EP.

Гайд показывает, как может выглядеть умный и точный балансировщик для больших MoE-архитектур.

GitHub: https://github.com/deepseek-ai/LPLB

ai_machinelearning_big_data

#DeepSeek #LPLB #MoE #AIInfrastructure #OpenSource
46🔥25👍19😁2🙉2🥰1
Please open Telegram to view this post
VIEW IN TELEGRAM
46🔥18👍13😨3🤬1
ML-модели не работают без правильно подготовленных данных.

Качество данных определяет качество моделей. Но что делать, когда пайплайны ломаются, а данные из разных источников приходят с расхождениями? Пока одна часть команды занимается ETL, другая — ищет причины артефактов в обучении моделей.

✔️ В таких ситуациях может пригодиться бот-генератор оправданий.
Он предлагает нестандартные объяснения, почему данные не готовы для обучения — от шуток про "несходящиеся градиенты" до "конфликта фичей".

Когда в следующий раз ваш feature store будет выглядеть как поле боя — загляните к боту. Его объяснения могут оказаться правдоподобнее ваших. Сгенерируйте несколько вариантов и поделитесь с командой — это поможет найти нестандартный подход к решению проблемы.
Please open Telegram to view this post
VIEW IN TELEGRAM
🗿3315🔥9😁8👍7😭3
⚡️ Ai2 представила Olmo 3 - новую линейку полностью открытых моделей (7B и 32B), которые по качеству догоняют лидеров рынка.

Главное:
• 32B base - сильная base-модель, которая работает на уровне Qwen 2.5 и опережает на ряде бенчмарков Google Gemma 3.
• 7B instruct и 7B reasoning - лучшие среди западных моделей
• 32B Think - полностью открытая 32B-модель для сложных рассуждений (почти на уровне Qwen 3 8B/32B)

Все данные, код, чекпоинты в открытом доступе.

Olmo 3 32B - закрыла важный пробел, так как у Qwen нет открытой 32B base-версии.

32B спокойно запускаестя на одной 80GB-GPU или даже на мощном ноутбуке.

🟠Paper: https://allenai.org/papers/olmo3
🟠Artifacts: https://huggingface.co/collections/allenai/olmo-3
🟠Demo: https://playground.allenai.org
🟠Blog: https://allenai.org/blog/olmo3

@ai_machinelearning_big_data

#Olmo #llm
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
40🔥20👍15🥰9🦄2😁1🐳1
Media is too big
VIEW IN TELEGRAM
✔️ Релиз семейств моделей SAM 3 и SAM 3D.

Создатели Segment Anything обновили свой стек компьютерного зрения, выпустив третье поколение инструментов SAM. Модель SAM 3 делает ставку на высокую точность: она умеет не только определять и отслеживать объекты в видеопотоке, но и понимает сложные текстовые описания.

Второй релиз, SAM 3D, решает задачу объемной реконструкции. Инструмент преобразует обычные 2D-изображения в 3D-ассеты. Технология разделена на два направления: SAM 3D Objects для воссоздания сцен и предметов, и SAM 3D Body для точной оценки человеческой анатомии и переноса её в виртуальную среду. Код и веса SAM 3 уже опубликованы в открытом доступе, а для 3D-версии разработчики выложили чекпоинты и инструменты инференса.
github.com

✔️ Научная ML-библиотека PINA теперь часть экосистемы PyTorch.

PINA - опенсорсная библитека от SISSA Mathlab для задач Scientific Machine Learning (SciML), нативно построеная на PyTorch и PyTorch Lightning и полностью совместима с PyTorch Geometric. Она предлагает единый подход к решению сложных научных проблем: от аппроксимации дифференциальных уравнений в частных производных до моделирования силовых полей и деформаций объектов.

PINA построена на модульной архитектуре, которая минимизирует шаблонный код и четко разделяет определение задачи, модель, солвер и процесс обучения. Внутри уже предусмотрены необходимые для физического моделирования инструменты: дифференциальные операторы, soft constraints и специфические функции потерь.
pytorch.org

✔️ Nabla Bio анонсировал модель для генерации антител промышленного качества.

Биотех-стартап Nabla Bio объявил о запуске JAM-2, первого алгоритма для создания de novo антител, готовых к применению в фармацевтике. Разработчики позиционируют инструмент как способ перевести создание лекарств из формата случайного перебора в дисциплину точного инженерного дизайна.

Модель показала высокую эффективность даже при работе со сложными мишенями, такими как клеточные рецепторы GPCR. В ходе тестов JAM-2 генерировала антитела с пикомолярной аффинностью, при этом более 50% вариантов сразу соответствовали индустриальным критериям пригодности без дополнительной оптимизации.

Команда из 4 инженеров смогла параллельно обработать 16 разных мишеней менее чем за месяц.
Nabla Bio в сети X

✔️ Стартовал новый сезон турнира Alpha Arena.

Лаборатория Nof1 запустила новый этап соревнования торговых ботов, в котором ИИ-модели управляют акциями на фондовом рынке США. В списке участников — Qwen3, DeepSeek, Claude Sonnet, Gemini, Grok, GPT-5, Kimi 2 и неназванная секретная модель. Каждому алгоритму выделили стартовый депозит в $10 000 и предоставили полную автономию в принятии решений.

Организаторы существенно усложнили турнир новыми сценариями. В режиме «New Baseline» модели используют память и механизм рефлексии для самообучения, а трек «Situational Awareness» позволяет ботам отслеживать рейтинг конкурентов в реальном времени. Наиболее агрессивный режим «Max Leverage» обязывает использовать высокое кредитное плечо.

Прошлый сезон закончился для ИИ-трейдеров неудачно: 4 из 6 моделей ушли в минус.
nof1.ai

✔️ OpenAI запустила специальную версию ChatGPT для учителей.

Компания представила инициативу «ChatGPT for Teachers», открывающую бесплатный доступ к чат-боту для преподавателей американских школ. В этой версии используется защищенное рабочее пространство, которое не передает данные для дообучения нейросетей, соответствуя стандартам конфиденциальности FERPA.

Учителя получат доступ к модели GPT-5.1 Auto, а также нативные интеграции с Canva и Google Drive. Администраторам учебных заведений доступны инструменты для централизованного распределения лицензий. Программа рассчитана до июня 2027 года и позиционируется как автоматизация планирования уроков и сокращения времени на административную рутину.
openai.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4026❤‍🔥7🥰3💘1🦄1
Не кодь — вайбкодь. Бесплатно 🚀

Сбер представил бесплатный агентный режим GigaCode — нового цифровой разработчика, который берет на себя рутину, чтобы вы могли сосредоточиться на крутых задачах!

Что умеет GigaCode в агентном режиме?

Сам находит и открывает нужные файлы

Вносит изменения в код, запускает тесты, собирает проекты и оформляет коммиты в Git

Работает в вашей любимой среде: JetBrains IDE, GigaIDE Desktop, а скоро еще и в VS Code

Плюс, в GigaCode появилась новая модель автодополнения кода — GigaCode Inline 4.0. Она мгновенно предлагает нужные фрагменты кода для Python, Java, JavaScript и других языков. Подсказки стали еще точнее, а работа с контекстом — еще лучше.

🖱 Хотите ускорить разработку? Обновленный GigaCode уже доступен на GitVerse.

Начать вайбкодить — по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
🥱77🤣38👍21🤨1613🤬8🥰3😁3🕊1💔1🗿1
📌Figure рассказала, как поработали их роботы Figure 02 на заводе BMW.

Забегая вперед, это были не лабораторные тесты, а полноценное боевое крещение, которое длилось 11 месяцев. Всего через полгода после запуска, роботы Figure 02 уже были на заводе, а к десятому месяцу они вышли на полную рабочую загрузку.

Роботы трудились 10-часовыми сменами с понедельника по пятницу. За более чем 1250 рабочих часов они загрузили свыше 90 тысяч деталей, внеся свой вклад в производство более 30 тысяч автомобилей серии X3. По оценкам инженеров, за этот период роботы сделали более 1.2 млн. шагов, пройдя расстояние чуть больше 320 км.

Основным кейсом использования стала операция загрузки листового металла — классическая задача по перекладыванию деталей. Процесс требовал от робота взять металлические листы и поместить их в сварочный агрегат с допуском всего в 5 миллиметров.

Чтобы оценить эффективность, инженеры установили жесткие KPI.

🟢Во-первых, на полный цикл отводилось 84 секунды.

🟢Во-вторых, показатель успешной загрузки деталей должен был превышать 99%.

🟢И, наконец, количество вмешательств человека - ноль раз за смену.

Такие условия потребовали от Figure разработки продвинутых алгоритмов координации "рука-глаз" и адаптивной локомоции.

Но любой экспериментальный проект — это прежде всего про поиск слабых мест.

С выходом новой модели Figure 03, второе поколение роботов официально отправляется на пенсию. Опыт, полученный на заводе BMW, напрямую повлиял на архитектуру третьего поколения.

Главным "узким местом" Figure 02 оказалось предплечье. Из-за плотной компоновки и требований к ловкости, эта часть часто перегревалась и была сложна в обслуживании.

В Figure 03 полностью изменили архитектуру электроники запястья. Они убрали распределительную панель и избавились от динамической кабельной разводки. Теперь контроллеры моторов общаются с главным компьютером напрямую.

Это тот самый случай, когда тысячи часов реальной работы на заводе превращаются в конкретные инженерные улучшения.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
69👍41🔥7🥰7🦄5❤‍🔥2🤣2
This media is not supported in your browser
VIEW IN TELEGRAM
Nano Banana очень хороша для генерации схем и слайдов, а как насчёт сделать из них видео. 🎬

Google Vids вместе с Gemini позволяет автоматически превратить презентацию Google Slides в полноценный видеоролик: со сценарием, озвучкой и музыкой.

Вы просто загружаете презентацию, выбираете стиль - и система сама собирает видео из ваших слайдов.

https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections

@ai_machinelearning_big_data

#Gemini #google #llm
👍6720🔥7🦄2💯1
В МТС Live Холл вот-вот стартует финальный этап всероссийского чемпионата по программированию True Tech Champ. А пока участники готовятся программировать роботов и решать алгоритмические задачи, гости и зрители онлайн-трансляции слушают лекцию Тони Янга, директора по североамериканскому бизнесу Unitree Robotics.

Он выступает с докладом «Будущее человекоподобных роботов» и обсудит с участниками, как человекоподобные роботы помогут решить проблему нехватки рабочей силы.

Ссылка на трансляцию : https://truetechchamp.ru/guests
🤣2419👍8🔥4🥱3👀2🍾1
This media is not supported in your browser
VIEW IN TELEGRAM
💡Внедрение ИИ полностью меняет разработку кода — Т-Технологии представили свою экосистему AI for SDLC

Главное:

• уже 30% всего кода в компании генерирует ИИ. Это не пилот и не эксперимент — это рабочий масштаб
• команда запустила новый сценарий агентского режима — end-to-end генерацию кода. Агент сам понимает задачу, проходит весь цикл, работает со структурой репозитория, создает файлы, запускает утилиты и снимает рутину с инженера
• прогнозируется сокращение time-to-market на 20–40%, а новые модели будут специально обучены под агентские сценарии
• на AIJ объявили, что открывается ранний доступ к агентскому режиму разработчиков

Внутри экосистемы:

•единая AI-архитектура, которая покрывает все этапы SDLC — от анализа и разработки до тестирования, внедрения и SR
•набор специализированных ИИ-решений: от AI Search и генерации SQL до анализа изменений MR, генерации тестов и мониторинга аномалий
•полноценная интеграция в VS Code

Благодаря такому внедрению ИИ в процессы, разработчик теперь фокусируется на важных этапах, а рутинную работу выполняют агенты.

@ai_machinelearning_big_data

#news #ai #ml
1🤣37🔥1915👏9👍4👌4🥰3🗿3🙈2
🖥 OpenAI показала первые настоящие признаки научного прорыва с GPT-5

Главное, что действительно интересно:

GPT-5 больше не просто пересказывает исследования
Модель выводит новые математические формулы, находит новые сложные теоремы и улучшает их.

GPT-5 работает с физиками над симметриями чёрных дыр - и делает это правильно
Структуры SL(2,R) в искривлённом пространстве-времени - это не автокомплит. Это настоящая работа с абстракциями.

GPT-5 находит редкие научные источники, которые человек бы не увидел
Старые доказательства, спрятанные в малоизвестных журналах, модель откапывает буквально за минуты.

GPT-5 предлагает новые биологические механизмы на основе “сырых” данных
И самое удивительное - эти механизмы совпадают с результатами экспериментов, которые ещё не были опубликованы.

GPT-5 формирует предложения экспериментов, которые тянут на уровень соавтора
Это уже не просто инструмент учёного. Это новая часть научного процесса.

Что всё это означает:

• Стоимость научного открытия стремительно падает
• Узкие экспертные bottleneck’и распадаются
• Команды “человек + ИИ” скоро смогут работать быстрее целых научных направлений
• Мы переходим от “ИИ помогает” → к “ИИ реально ускоряет науку”

Впервые ИИ способен сжимать весь научный цикл - от идеи до результата - и делать это внятно, проверяемо и воспроизводимо.

Если вы спрашиваете, как выглядит начало технологической Сингулярности -
скорее всего, это очень похоже именно на то, что показано в этой работе.

Подробности: https://openai.com/index/accelerating-science-gpt-5/

@ai_machinelearning_big_data

#openai #chatgpt
Please open Telegram to view this post
VIEW IN TELEGRAM
👍80😁4323🔥10❤‍🔥3🦄3🥰2👏1🤨1🤓1