NEW BOT Телеграм, страница - 411071721

Машинное обучение digest

@machinelearnindigest

40 subscribers

1.3K photos

181 videos

652 links

Download Telegram

About

Blog

Apps

Platform

Машинное обучение digest

Машинное обучение digest

⚡️ Anthropic представила Claude 4 Opus и Sonnet 4

На мероприятии Code /w Claude CEO Anthropic презентовал Claude 4 Opus и Claude Sonnet 4.

✔️ Opus 4 Anthropic называет лучшей моделью для кодинга, она справляется с многошаговыми задачами, работая часами без потери эффективности — например, сохраняет контекст игры в Pokémon, записывая ключевые данные в локальные файлы.

✔️Sonnet 4, доступная даже бесплатным пользователям, стал серьезным апгрейдом предыдущей версии: точнее выполняет инструкции и сократил ошибки в навигации по коду с 20% до нуля.

Обе модели поддерживают расширенное мышление: чередуют анализ и использование инструментов веб-поиска, а также выполняют задачи параллельно.

Для разработчиков появилась интеграция с VS Code, JetBrains и GitHub Actions — правки от Claude теперь отображаются прямо в редакторе. В бета-режиме можно подключать SDK для создания собственных агентов.

По словам партнеров: GitHub и Replit, Opus 4 понимает сложные кодбазы, а Sonnet 4 идеален для повседневных задач. Например, в GitHub Copilot его уже тестируют как основу для нового агента.

В тарифные планы Pro, Max, Team и Enterprise Claude включены обе модели и расширенное мышление, а Sonnet 4 также доступен для бесплатных пользователей.

Обе модели доступны в Anthropic API, Amazon Bedrock и Google Cloud's Vertex AI. Ценообразование остается неизменным по сравнению с предыдущими моделями Opus и Sonnet: Opus 4 - $15/$75 за миллион токенов (ввод/вывод), Sonnet 4 - $3/$15.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

5 views16:55

Машинное обучение digest

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

✔️

Google представила Gemma 3n — лёгкую и быструю AI-модель для работы на девайсах

Google выпустила Gemma 3n — это новая версия модели, которая запускается локально на мобильных устройствах.

Gemma 3n может работа локально на устройстве с 2 ГБ оперативной памяти!

➡️

Особенности:

• Работает в 1.5 раза быстрее, чем предыдущая Gemma 3 4B
• Поддерживает работу без интернета — всё локально и безопасно
• Умеет понимать текст, речь и изображения
• Можно использовать даже на устройствах с 2–3 ГБ RAM
• Поддерживает мгожетсво языков,

💡 Gemma 3n использует гибкую архитектуру (MatFormer), которая может "переключаться" между лёгким и полным режимом (2B и 4B параметров) — модель подстраивается под задачу, не перегружая устройство.

🔧 Как начать пользоваться:

• Через Google AI Studio — работает прямо в браузере
• Или через SDK Google AI Edge — интеграция на Android, Chromebook и другие устройства

📊 Где это применимо:

• Голосовые ассистенты
• Приложения с ИИ, которые работают без интернета
• Переводчики, чат-боты, анализ изображений на телефоне

➡️

Релиз: https://developers.googleblog.com/en/introducing-gemma-3n/

➡️

Документация: https://ai.google.dev/gemma/docs/gemma-3n#parameters

#Gemma #Google #mobile #МультимодальныйИИ #МобильныйИИ #edgedevices

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

5 views16:21

Машинное обучение digest

Media is too big

VIEW IN TELEGRAM

✔️

PyRoki (Python Robot Kinematics Toolkit) от Berkeley

PyRoki — это open-source библиотека на Python для задач управления движением роботов. Она решает одну из главных задач в робототехнике — инверсную кинематику (IK), то есть определяет, как двигаться суставам робота, чтобы достичь нужной точки.

▶️

Что умеет PyRoki:
▪️ Инверсная кинематика
▪️ Оптимизация траектории
▪️ Перенос движений между разными роботами (motion retargeting)

🚀 Установка


git clone https://github.com/chungmin99/pyroki.git
cd pyroki
pip install -e .

Чем хороша:
✅ Быстрее на 1.7× по сравнению с cuRobo
✅ Работает на CPU, GPU и даже TPU
✅ Написана полностью на Python — легко внедряется, не требует C++
✅ Подходит для промышленных роботов, симуляторов, гуманоидов

Подходит для:
— инженеров робототехники
— разработчиков симуляций
— ML-исследователей в motion planning

▪️ Репозиторий: https://github.com/chungmin99/pyroki
▪️ Сайт: http://pyroki-toolkit.github.io
▪️ Статья: https://arxiv.org/abs/2505.03728

@ai_machinelearning_big_data

#ai #ml #robots

Please open Telegram to view this post

VIEW IN TELEGRAM

4 views14:50

Машинное обучение digest

🖥

OpenAI и ОАЭ предоставляют бесплатный доступ к ChatGPT Plus для всех жителей страны

Стоит поучиться у ОАЭ — они уже сделали популяризацию ИИ реальностью.

27 мая 2025 года было объявлено, что Объединённые Арабские Эмираты (ОАЭ) станут первой страной в мире, предоставившей всем своим жителям бесплатный доступ к ChatGPT Plus — расширенной версии популярного ИИ-инструмента от OpenAI. Этот шаг стал результатом стратегического партнёрства между OpenAI и правительством ОАЭ, направленного на продвижение искусственного интеллекта среди широких масс населения.

🔧 Проект "Stargate UAE"
Ключевым элементом сотрудничества является строительство крупного центра обработки данных под названием "Stargate UAE" в Абу-Даби. Планируется создание вычислительного кластера мощностью 1 гигаватт, первая фаза которого (около 200 мегаватт) должна быть введена в эксплуатацию в следующем году. Этот проект является частью глобальной стратегии OpenAI "OpenAI for Nations", целью которой является помощь странам в создании автономных ИИ-систем и инструментов.

🌍 Глобальное значение
В рамках соглашения ОАЭ обязались сопоставить свои внутренние расходы на ИИ с инвестициями в американские ИИ-проекты, что может привести к общим инвестициям в размере до 20 миллиардов долларов, совместно с США. Этот шаг подчеркивает стремление обеих сторон к долгосрочному сотрудничеству в области искусственного интеллекта.

OpenAI также планирует расширить свою инициативу "OpenAI for Nations" на другие страны, начиная с региона Азиатско-Тихоокеанского региона, с целью помочь большему количеству стран в создании собственных автономных ИИ-систем.

Please open Telegram to view this post

VIEW IN TELEGRAM

5 views06:03

Машинное обучение digest

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

HunyuanPortrait: код и веса.

Спустя чуть больше двух месяцев, Tencent опубликовала веса и код инференса проекта HunyuanPortrait - системы на основе диффузионных моделей для создания реалистичных анимированных портретов.

На вход подается видео, с которого движения переносятся на целевое изображение для "оживления". Режима "тext-to-motion", судя по всему - нет.

Под капотом - набор моделей на основе SVD, DiNOv2, Arc2Face и YoloFace.

Разработчики уверяют, что инференс заводится на 24 Гб VRAM и их метод лучше контролирует анимацию и делает более плавные переходы между кадрами, чем существующие аналоги.

⚠️ WebUI нет, адаптации под ComfyUI - пока тоже нет.

▶️Локальный инференс:

# Clone repo
git clone https://github.com/Tencent-Hunyuan/HunyuanPortrait

# Install requirements
pip3 install torch torchvision torchaudio
pip3 install -r requirements.txt

# Run
video_path="your_video.mp4"
image_path="your_image.png"

python inference.py \
    --config config/hunyuan-portrait.yaml \
    --video_path $video_path \
    --image_path $image_path

🟡

Страница проекта

🟡

Набор моделей

🟡

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #HunyuanPortrait

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

44 views13:55

Машинное обучение digest

This media is not supported in your browser

VIEW IN TELEGRAM

🔬 fubea dot cloud —самый мощный агент для глубоких исследований.

💥 Бесплатно. Без ограничений. Анонимно. С открытым исходным кодом.

✨ А ещё умеет:
- программировать
- делать презентации
- запускать веб-приложения
- и многое другое.

👉 Попробовать: https://fubea.cloud

9 views07:01

Машинное обучение digest

🌟

V-Triune от MiniMax: RL для VLM.

V-Triune - фреймворк с новым методом обучения VL-моделей, через единый алгоритм подкрепления.

В отличие от традиционных методов трейна VLM, сосредоточенных на отдельных задачах вроде решения математических задач или обнаружения объектов, V-Triune обучает модели одновременно работать с рассуждениями и восприятием. RL в V-Triune действует как механизм «настройки» уже заложенных в модель возможностей, а не добавляет новые навыки.

Это достигается за счет 3 ключевых компонентов: форматирования данных на уровне выборок, вычисления наград через специализированные верификаторы и мониторинга метрик по источникам данных.

Например, динамическая награда IoU адаптирует пороги точности для обнаружения объектов — сначала стимулируя базовое понимание, а затем требуя высокой точности.

Тестирование проводилось на бенчмарке MEGA-Bench из440 задач — от анализа графиков до OCR. Экспериментальные модели Orsta (7B и 32B параметров), обученные с V-Triune, показали прирост производительности до +14,1% по сравнению с базовыми версиями.

На задачах восприятия (обнаружение объектов в COCO), улучшения достигли +12,17% для mAP@50. Для математических задач (MathVista) результаты выросли на 5%, а в OCR — на 1-2%. При этом система стабильно работала даже при обучении на смешанных данных, что косвенно подтвердило ее универсальность.

Minimax открыли (но пока не загрузили его в репозиторий) код V-Triune и модели Orsta:

🟢

Orsta-32B-0326 - стабильная версия на более поздней QwenVL-2.5-32B;

🟠

Orsta-32B-0321 - версия с замороженным ViT на базе QwenVL-2.5-32B-0321;

🟢

Orsta-7B - на базе Qwen2.5-VL-7B-Instruct.

⚠️ В версии 0321 попытки совместного обновления визуального и языкового модулей приводили к взрыву градиентов, поэтому ViT пришлось заморозить. В 0326, благодаря исправлениям в архитектуре, RL-тренинг стал стабильнее. 0326 рекомендуется для задач, где критична точность и надежность форматов ответов.

📌Лицензирование: MIT License.

🟡

Набор моделей

🟡

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #VLM #RL #Framework #MiniMax

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

3 views09:13

Машинное обучение digest

💧 Знаешь ли ты, что каждый сеанс с ChatGPT "сжигает" пол-литра воды?

Каждое сообщение, которое ты отправляешь в ChatGPT, несёт скрытую цену — ресурсы, о которых никто не думает.

📨 Например, генерация одного e-mail из 100 слов тратит:
🔸 ~519 мл воды — больше, чем бутылка, вылитая на землю
🔸 0.3 ватт-часа электричества — в 10 раз больше, чем обычный Google-запрос
🔸 Энергии, эквивалентной 20 минутам работы LED-лампы

И это только одно сообщение...

🌍 Масштаб:

Если 10% трудоспособных американцев отправляют один e-mail через ChatGPT в неделю —
📊 это 435 млн литров воды в год.
🛑 Как вся вода, потребляемая Род-Айлендом за 1.5 дня.

Сегодня ChatGPT обрабатывает ~200 млн запросов в день.
Это ≈ 621 мегаватт-часов электроэнергии ежедневно.

Что можно сделать?

1. ✏️ Пиши чёткие и конкретные запросы
2. 🔄 Объединяй похожие вопросы в один
3. ⚙️ Используй упрощённые модели, если не нужен глубокий reasoning
4. 🧘 Не пиши LLM «спасибо» — он не обидится 😉

📉 Проблема не в тебе. Проблема — в масштабе.
🛠 Настоящее решение требует системных изменений:
технологические компании должны уделять устойчивости столько же внимания, сколько и возможностям.

ИИ меняет мир. Но климат меняется быстрее.

#AI #Sustainability #ClimateCrisis #ChatGPT #TechEthics

3 views13:58

Машинное обучение digest

This media is not supported in your browser

VIEW IN TELEGRAM

🌀 Opera Neon — браузер-агент нового поколения

Opera представила Neon — браузер со встроенным ИИ-агентом, который продолжает выполнять задачи даже тогда, когда пользователь спит.

🌐 Что умеет Opera Neon?

🔹 Понимает намерения пользователя
🔹 Помогает с задачами — от поиска до бронирования
🔹 Самостоятельно действует: анализирует, предлагает и выполняет
🔹 Работает как агент, а не просто интерфейс

Это инфраструктура для агентного интернета, где ИИ помогает тебе в реальном времени.

🚀 Доступ только по инвайтам. Сейчас Opera открывает доступ первым участникам сообщества, чтобы сформировать будущее вместе.

Подать заявку: https://www.operaneon.com/

@ai_machinelearning_big_data

#OperaNeon #AgenticWeb #AI #БраузерБудущего

4 views18:24

Машинное обучение digest

⚙️ Полный гид по GPU-экосистеме — без воды и маркетинга

Если ты путаешься в CUDA, OpenCL, SYCL и HIP — этот гайд от ENCCS расставит всё по полочкам. Это не просто обзор, а чёткое объяснение, **как устроен мир GPU-программирования сегодня**.

🧠 Что ты узнаешь:

🔹 Как и почему GPU радикально отличается от CPU
🔹 Из чего состоит стек GPU-технологий:
— CUDA и его аналоги (HIP, SYCL, OpenCL)
— Директивы: OpenMP, OpenACC
🔹 Какие языки и стандарты поддерживают какую архитектуру
🔹 NVIDIA, AMD, Intel — кто что умеет и чем отличается
🔹 Модели памяти, исполнения, и что влияет на производительность

📌 Гайд подходит для:
• Разработчиков HPC и научных расчётов
• Инженеров ML/AI, желающих копнуть глубже
• Всех, кто хочет разобраться в низкоуровневом GPU-стеке без маркетингового тумана

📖 Читать:
[🔗 enccs.github.io/gpu-programming/2-gpu-ecosystem/](https://enccs.github.io/gpu-programming/2-gpu-ecosystem/)

🔥 Один из самых понятных и системных разборов GPU-мира на сегодня.

#GPU #CUDA #OpenCL #HIP #SYCL #HPC #AI #HighPerformanceComputing

@javatg

4 views09:21

Машинное обучение digest

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 Odyssey показали нечто, что выглядит как сон, записанный на VHS и оживлённый в реальном времени.

Это интерактивное AI-видео генерируется с задержкой всего 40 мс и позволяет «переключать каналы» между альтернативными мирами и пространствами.

🧠По сути это интрактивная модель мира, способная генерировать визуально согласованные сцены длительностью более 5 минут.

🎮 Управление:
— Перемещение с помощью клавиш WASD
— Навигация по латентному пространству мышью через "компас"
— Поддерживаются геймпады, смартфоны, а в будущем — и голосовое управление

И если приглядеться — становится ясно: голографическая реальность ближе, чем мы думали.

🚀 Хочешь погонять H100 на полную мощность и стримить видео до 30 fps?
Они уже открыли демо — заходи и смотри, взаимодействуй.

⚠️ Да, пока нестабильно — модель глючит, местами ломает сцены.
Но: 5+ минут связного видеопотока, в реальном времени, без движка и с нуля — это не просто впечатляет, это один из возможных путей к симуляторам реальности.

🧠 Мы смотрим не на эффектный трик, а на раннюю версию технологии, которая однажды станет основой «живых миров».

Попробовать: https://experience.odyssey.world

#AI #VHSdream #WorldSimulator #FutureOfVideo #Odyssey

12 views09:29

Машинное обучение digest

Прокачай навыки общения с ИИ с мощной базой знаний от экспертов Anthropic — всё, что нужно для уверенного промпт-инжиниринга и уменьшения ошибок при работе с нейросетями.

🔍 Что внутри:
• Подробный разбор структуры промптов: от скелета до ключевых формулировок
• Частые ошибки при взаимодействии с ИИ — и как их избежать
• Реальные кейсы на основе Claude
• Примеры качественных запросов + десятки готовых промптов
• Всё это — абсолютно БЕСПЛАТНО

⚡ Начни понимать ИИ не просто лучше — мастерски:

Github

@ai_machinelearning_big_data

3 views11:39

Машинное обучение digest

💵 Годовой доход Anthropic увеличился с 1 млрд долларов до 3 млрд долларов (Annual Recurring Revenue) всего за пять месяцев.

Это обусловлено высоким спросом со стороны бизнеса на ИИ, в сфере генерации кода.

🆚 OpenAI, главный конкурент Anthropic, по данным источников, ожидает $12+ млрд выручки к концу 2025 года, по сравнению с $3,7 млрд в прошлом году. Однако эта сумма включает весь доход, а не только годовую прогнозируемую выручку (ARR), как у Anthropic. Reuters не удалось определить ARR OpenAI.

Anthropic продолжают развивать линейку Claude и усиливает позицию как B2B-ориентированный аналог OpenAI.

▶️

Подробнее

#Anthropic #ai #news

Please open Telegram to view this post

VIEW IN TELEGRAM

3 views12:09