🦾 Argo Workflows и MLOps: автоматизируйте всё, что можно
Если вы хотите, чтобы обучение и деплой моделей стали управляемыми и предсказуемыми — пора переходить к автоматизации. На открытом уроке разберём, как оркестрация ML-процессов в Kubernetes превращает хаос в стройную систему. Мы покажем, как описывать пайплайны в YAML, передавать данные между шагами и управлять всем через UI и CLI. Разберём архитектуру Argo Workflows и создадим типовой ML-процесс: от обучения до деплоя модели.
Вы научитесь использовать Argo Workflows для автоматизации задач, которые раньше занимали дни. Вы увидите, как CI/CD становится естественной частью ML-инфраструктуры. Поймёте, как Data Scientists и DevOps могут говорить на одном языке.
➡️ Регистрируйтесь на открытый урок в преддверии старта курса “MLOps”. Создавайте надёжные и масштабируемые ML-пайплайны: https://otus.pw/EMs7/?erid=2W5zFGbsdH2
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Если вы хотите, чтобы обучение и деплой моделей стали управляемыми и предсказуемыми — пора переходить к автоматизации. На открытом уроке разберём, как оркестрация ML-процессов в Kubernetes превращает хаос в стройную систему. Мы покажем, как описывать пайплайны в YAML, передавать данные между шагами и управлять всем через UI и CLI. Разберём архитектуру Argo Workflows и создадим типовой ML-процесс: от обучения до деплоя модели.
Вы научитесь использовать Argo Workflows для автоматизации задач, которые раньше занимали дни. Вы увидите, как CI/CD становится естественной частью ML-инфраструктуры. Поймёте, как Data Scientists и DevOps могут говорить на одном языке.
➡️ Регистрируйтесь на открытый урок в преддверии старта курса “MLOps”. Создавайте надёжные и масштабируемые ML-пайплайны: https://otus.pw/EMs7/?erid=2W5zFGbsdH2
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
🛠️ Улучшаем коммиты с AI
Git Rewrite Commits — это инструмент для автоматического улучшения сообщений коммитов с помощью AI. Он помогает привести в порядок историю коммитов, создавая более осмысленные и структурированные сообщения, что особенно полезно перед публикацией проектов или для повышения удобства работы с репозиториями.
🚀Основные моменты:
- AI-генерация сообщений для коммитов
- Поддержка локальных моделей и оффлайн-работы
- Установка git hooks одним командой
- Оценка качества коммитов и автоматическое исправление
- Возможность настройки формата и языка сообщений
📌 GitHub: https://github.com/f/git-rewrite-commits
#javanoscript
Git Rewrite Commits — это инструмент для автоматического улучшения сообщений коммитов с помощью AI. Он помогает привести в порядок историю коммитов, создавая более осмысленные и структурированные сообщения, что особенно полезно перед публикацией проектов или для повышения удобства работы с репозиториями.
🚀Основные моменты:
- AI-генерация сообщений для коммитов
- Поддержка локальных моделей и оффлайн-работы
- Установка git hooks одним командой
- Оценка качества коммитов и автоматическое исправление
- Возможность настройки формата и языка сообщений
📌 GitHub: https://github.com/f/git-rewrite-commits
#javanoscript
👍3🔥1
Помните, как это было? Кофе, зачетка и возможность просто учиться без спринтов и задач
29 ноября в 16:00 будет Back to Uni — встреча-ностальгия в кампусе Центрального университета для ИТ-сообщества.
Что вас ждет:
— Пары от преподавателей ЦУ — применять знания не обязательно, будет просто интересно.
— Возможность узнать, как и зачем ИТ-специалисту преподавать в вузе, даже если нет опыта или страшно начать.
— Студенческие клубы, разговоры по душам в коридорах и та самая атмосфера, где можно просто вдохновляться.
Пары будут вести руководитель отдела прикладного ML в AI-центре Т-Банка Андрей Мельников, руководитель аналитики международного Яндекс Поиска Роман Васильев, к.м.н., руководитель направления исследований «Мышление и AI» в лаборатории нейронаук и поведения человека Сбера Яна Венерина и другие эксперты.
Это бесплатно. Приходите с однокурсниками — ностальгировать вместе.
Регистрируйтесь по ссылке тут!
29 ноября в 16:00 будет Back to Uni — встреча-ностальгия в кампусе Центрального университета для ИТ-сообщества.
Что вас ждет:
— Пары от преподавателей ЦУ — применять знания не обязательно, будет просто интересно.
— Возможность узнать, как и зачем ИТ-специалисту преподавать в вузе, даже если нет опыта или страшно начать.
— Студенческие клубы, разговоры по душам в коридорах и та самая атмосфера, где можно просто вдохновляться.
Пары будут вести руководитель отдела прикладного ML в AI-центре Т-Банка Андрей Мельников, руководитель аналитики международного Яндекс Поиска Роман Васильев, к.м.н., руководитель направления исследований «Мышление и AI» в лаборатории нейронаук и поведения человека Сбера Яна Венерина и другие эксперты.
Это бесплатно. Приходите с однокурсниками — ностальгировать вместе.
Регистрируйтесь по ссылке тут!
🤬3
⚡️ Google подписал крупный контракт с НАТО на суверенный облачный ИИ
Акции GOOGL растут после того как НАТО заключило многомиллионное соглашение на использование Google Distributed Cloud в полностью изолированном air-gapped режиме.
Решение будет работать на кастомных TPU Google и предназначено для JATEC, центра анализа и обучения.
Что это даёт НАТО
✔ Полностью суверенное облако
Вся вычислительная инфраструктура и хранилище остаются внутри территории НАТО. Это закрывает вопросы юрисдикций, резидентства данных и аудита.
✔ Полная изоляция от интернета
Air-gapped означает что системы физически не подключены к сети.
Обновления, модели и данные проходят только через контролируемые каналы.
Это снижает поверхность атаки и исключает утечки.
✔ Современный ИИ в закрытой среде
Можно запускать аналитику, ИИ-модели и обработку секретных данных не выходя в публичное облако.
✔ Kubernetes, хранилища и ускорители прямо на объектах НАТО
Команды смогут разворачивать контейнерные ИИ-сервисы, симуляции и анализ телеметрии в реальном времени непосредственно в защищённых дата-центрах.
Почему это важно для JATEC
Становится возможным проводить обучение, моделирование и разбор операций на более высоких уровнях секретности, с быстрой корреляцией логов, изображений и данных наблюдения.
NCIA получает единые политики, централизованные патчи и аппаратный root-of-trust чтобы поддерживать одинаковый уровень безопасности на всех площадках.
googlecloudpresscorner.com/2025-11-24-NATO-and-Google-Cloud-Sign-Multi-Million-Dollar-Deal-for-AI-Enabled-Sovereign-Cloud
Акции GOOGL растут после того как НАТО заключило многомиллионное соглашение на использование Google Distributed Cloud в полностью изолированном air-gapped режиме.
Решение будет работать на кастомных TPU Google и предназначено для JATEC, центра анализа и обучения.
Что это даёт НАТО
✔ Полностью суверенное облако
Вся вычислительная инфраструктура и хранилище остаются внутри территории НАТО. Это закрывает вопросы юрисдикций, резидентства данных и аудита.
✔ Полная изоляция от интернета
Air-gapped означает что системы физически не подключены к сети.
Обновления, модели и данные проходят только через контролируемые каналы.
Это снижает поверхность атаки и исключает утечки.
✔ Современный ИИ в закрытой среде
Можно запускать аналитику, ИИ-модели и обработку секретных данных не выходя в публичное облако.
✔ Kubernetes, хранилища и ускорители прямо на объектах НАТО
Команды смогут разворачивать контейнерные ИИ-сервисы, симуляции и анализ телеметрии в реальном времени непосредственно в защищённых дата-центрах.
Почему это важно для JATEC
Становится возможным проводить обучение, моделирование и разбор операций на более высоких уровнях секретности, с быстрой корреляцией логов, изображений и данных наблюдения.
NCIA получает единые политики, централизованные патчи и аппаратный root-of-trust чтобы поддерживать одинаковый уровень безопасности на всех площадках.
googlecloudpresscorner.com/2025-11-24-NATO-and-Google-Cloud-Sign-Multi-Million-Dollar-Deal-for-AI-Enabled-Sovereign-Cloud
👎6❤4🔥2👍1
🤖 Яндекс открыл Alice AI для бизнеса
Что важно знать:
• Alice AI — новое поколение моделей от Яндекса, LLM-модель уже доступна на платформе Yandex AI Studio. Скоро добавится и Alice AI ART;
• В 60% задач показывает результаты лучше, чем DeepSeek V3.1 и Qwen3-235b;
• По сравнению с ними модель лучше в RAG-сценариях, она лучше пишет и редактирует тексты и отвечает на общие вопросы;
• Среди апдейтов – более “человечные” и развернутые ответы: модель может простым языком объяснить сложные вещи, например – рассказать сэйлзам специфику сложного продукта;
• Компании Just AI и presentsimple.ai уже тестируют модель в своих продуктах
• Благодаря оптимизации токенайзера под русский язык при идентичной тарификации использование модели выходит в 1,5-2 раза дешевле опенсорса.
Из интересного: пишут, что Alice AI LLM прошла все этапы обучения модели на данных Яндекса – от претрейна до SFT. До всех этих этапов модель прошла инициализацию опенсорсными весами – они использовались в качестве изначальных параметров модели. Но после обучения все параметры были изменены.
Подробнее тут.
Что важно знать:
• Alice AI — новое поколение моделей от Яндекса, LLM-модель уже доступна на платформе Yandex AI Studio. Скоро добавится и Alice AI ART;
• В 60% задач показывает результаты лучше, чем DeepSeek V3.1 и Qwen3-235b;
• По сравнению с ними модель лучше в RAG-сценариях, она лучше пишет и редактирует тексты и отвечает на общие вопросы;
• Среди апдейтов – более “человечные” и развернутые ответы: модель может простым языком объяснить сложные вещи, например – рассказать сэйлзам специфику сложного продукта;
• Компании Just AI и presentsimple.ai уже тестируют модель в своих продуктах
• Благодаря оптимизации токенайзера под русский язык при идентичной тарификации использование модели выходит в 1,5-2 раза дешевле опенсорса.
Из интересного: пишут, что Alice AI LLM прошла все этапы обучения модели на данных Яндекса – от претрейна до SFT. До всех этих этапов модель прошла инициализацию опенсорсными весами – они использовались в качестве изначальных параметров модели. Но после обучения все параметры были изменены.
Подробнее тут.
❤4👍4🤔3👎1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Используется модель LFM2-Audio-1.5B от LiquidAI, а все данные остаются приватными.
Полностью локальный пайплайн, который можно адаптировать под свои задачи и интегрировать где угодно.
Готовый разбор и код - по ссылке:
https://github.com/Liquid4All/cookbook/tree/main/examples/audio-trannoscription-cli
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤1🤔1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Президент США подписал указ о создании единой государственной ИИ-платформы. Проект, реализация которого поручена Министерству энергетики, должен радикально ускорить научные исследования и сократить циклы открытий в биотехнологиях и энергетике с нескольких лет до дней.
Инициатива мобилизует инфраструктуру 17 федеральных исследовательских центров. Их суперкомпьютеры и накопленные за десятилетия массивы научных данных будут использованы для обучения специализированных моделей. Новая платформа позволит ИИ-агентам автономно планировать эксперименты, проверять гипотезы и генерировать прогнозы в области химии, биологии и инженерии.
whitehouse.gov
ChatGPT получил обновление, которое устраняет барьер между способами ввода: голосовой чат теперь интегрирован непосредственно в основное окно переписки. Это позволяет пользователям бесшовно переключаться между речью и набором текста, не переходя в отдельный режим.
Теперь во время голосовой сессии можно свободно просматривать историю сообщений, сгенерированные изображения или карты, а ответы ассистента автоматически дублируются в текстовом виде.
Функция уже доступна в мобильных приложениях и веб-версии. Для тех, кто хочет пользоваться голосовым интерфейсом отдельно, OpenAI оставила возможность вернуть его через настройки в разделе Voice Mode.
OpenAi в сети Х
Fara-7B — компактная агентная модель от Microsoft Research на базе Qwen2.5-VL для автономной работы с интерфейсами. Модель умеет анализировать скриншоты, генерировать команды для мыши и клавиатуры, предсказывая точные пиксельные координаты.
В бенчмарках Fara-7B обошла существующие решения и выполняет задачи в разы дешевле крупных моделей - средняя стоимость сессии составляет меньше 3-х центов. Веса модели опубликованы на Hugging Face под лицензией MIT.
microsoft.com
Гарвардская медшкола представила popEVE - нейросеть, способную с высокой точностью выявлять патогенные мутации в геноме для решения проблем диагностики редких наследственных болезней, причины которых врачи зачастую не могут найти годами.
PopEVE объединяет генеративный ИИ с языковой моделью для белков и статистикой человеческих популяций. Система умеет корректно сравнивать опасность мутаций, расположенных в абсолютно разных генах, и выдавать унифицированный клинический рейтинг риска. Предыдущие модели не справлялись с такой кросс-генной калибровкой.
Эффективность системы подтвердили на выборке из 30 000 пациентов. Модель успешно определила причину болезни в трети случаев и попутно обнаружила 123 гена, ранее не связывавшихся с развитием патологий.
harvard.edu
Илон Маск анонсировал амбициозный эксперимент: в 2026 году следующая версия модели xAI бросит вызов сильнейшим киберспортивным командам мира. Матч планируется не просто как шоу, а как критический тест на пути к AGI.
Для чистоты эксперимента инженеры введут жесткие технические ограничения, уравнивающие шансы. Модель не будет подключаться к API игры — она должна «смотреть» на монитор через камеру с имитацией обычного человеческого зрения. Скорость реакции и частоту кликов также лимитируют до физических возможностей человека. Предполагается, что Grok 5 освоит сложные механики MOBA-стратегии с нуля, опираясь только на чтение документации и самостоятельные эксперименты в ходе игры.
Elon Musk в сети Х
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🔥3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🏆 FuzzForge
AI-платформа для автоматизации рабочих процессов и управления агентами в AppSec, фаззинге и offensive security.
🔍 Ключевые возможности
• 🤖 AI-агенты — для анализа кода, реверс-инжиниринга и фаззинга.
•🛠 Workflows as Code — описывайте и запускайте AppSec-процессы декларативно.
• 📈 Масштабируемое исследование уязвимостей - находите как 1-day, так и 0-day.
• 🔗 Интеграции с фаззерами — Atheris (Python), cargo-fuzz (Rust), OSS-Fuzz (в разработке).
• 🏢 Enterprise-ready — облачные тарифы для команд и корпоративного использования.
•
https://github.com/FuzzingLabs/fuzzforge_ai
AI-платформа для автоматизации рабочих процессов и управления агентами в AppSec, фаззинге и offensive security.
🔍 Ключевые возможности
• 🤖 AI-агенты — для анализа кода, реверс-инжиниринга и фаззинга.
•🛠 Workflows as Code — описывайте и запускайте AppSec-процессы декларативно.
• 📈 Масштабируемое исследование уязвимостей - находите как 1-day, так и 0-day.
• 🔗 Интеграции с фаззерами — Atheris (Python), cargo-fuzz (Rust), OSS-Fuzz (в разработке).
• 🏢 Enterprise-ready — облачные тарифы для команд и корпоративного использования.
•
https://github.com/FuzzingLabs/fuzzforge_ai
❤3🔥1
📢 Сбер открывает доступ к флагманским моделям ИИ
Флагман линейки — GigaChat Ultra-Preview — крупная модель собственной разработки Сбера. Она уверенно превосходит DeepSeek по ключевым показателям, обучена на русском и поддерживает длинный контекст до 128 тысяч токенов. Ultra-Preview справляется с задачами аналитики, генерации текста и дообучения на собственных данных, обеспечивая точность и стабильность на высоком уровне.
💡Больше о моделях:
- 🚀GigaChat Ultra-Preview — 702B-MoE модель, полностью обученный с нуля. Топовая модель для бизнеса, аналитики и сложных проектов
- ⚡️GigaChat Lightning — компактная MoE-модель для быстрых локальных запусков и тестов, по качеству превосходит Qwen3-4B, а скорость с Multi-Token Prediction сравнима с Qwen3-1.7B
GitHub | HuggingFace | GitVerse
- 🎤 GigaAM-v3 — новое поколение моделей для распознавания речи с нормализацией и пунктуацией, минимизирует ошибки и обеспечивает удобное взаимодействие на русском языке
GitHub | HuggingFace | GitVerse
✅ Модели GigaChat делают работу проще, помогают быстрее решать задачи и дают доступ к мощным инструментам ИИ для любых проектов.
Подробнее — в статье на Хабр.
Флагман линейки — GigaChat Ultra-Preview — крупная модель собственной разработки Сбера. Она уверенно превосходит DeepSeek по ключевым показателям, обучена на русском и поддерживает длинный контекст до 128 тысяч токенов. Ultra-Preview справляется с задачами аналитики, генерации текста и дообучения на собственных данных, обеспечивая точность и стабильность на высоком уровне.
💡Больше о моделях:
- 🚀GigaChat Ultra-Preview — 702B-MoE модель, полностью обученный с нуля. Топовая модель для бизнеса, аналитики и сложных проектов
- ⚡️GigaChat Lightning — компактная MoE-модель для быстрых локальных запусков и тестов, по качеству превосходит Qwen3-4B, а скорость с Multi-Token Prediction сравнима с Qwen3-1.7B
GitHub | HuggingFace | GitVerse
- 🎤 GigaAM-v3 — новое поколение моделей для распознавания речи с нормализацией и пунктуацией, минимизирует ошибки и обеспечивает удобное взаимодействие на русском языке
GitHub | HuggingFace | GitVerse
✅ Модели GigaChat делают работу проще, помогают быстрее решать задачи и дают доступ к мощным инструментам ИИ для любых проектов.
Подробнее — в статье на Хабр.
GitHub
GitHub - salute-developers/gigachat3
Contribute to salute-developers/gigachat3 development by creating an account on GitHub.
❤8🔥5🥰3😁1
🖼️ Удаление водяных знаков с Sora2
Этот проект предлагает эффективный инструмент для удаления водяных знаков из изображений, используя алгоритмы глубокого обучения. Он предназначен для улучшения качества изображений, сохраняя при этом их оригинальные детали.
🚀Основные моменты:
- Использует современные методы машинного обучения.
- Поддерживает различные форматы изображений.
- Легко интегрируется в существующие рабочие процессы.
- Открытый исходный код для гибкости и модификации.
📌 GitHub: https://github.com/dachensky/sora2-watermark-remover
#python
Этот проект предлагает эффективный инструмент для удаления водяных знаков из изображений, используя алгоритмы глубокого обучения. Он предназначен для улучшения качества изображений, сохраняя при этом их оригинальные детали.
🚀Основные моменты:
- Использует современные методы машинного обучения.
- Поддерживает различные форматы изображений.
- Легко интегрируется в существующие рабочие процессы.
- Открытый исходный код для гибкости и модификации.
📌 GitHub: https://github.com/dachensky/sora2-watermark-remover
#python
GitHub
dachensky/sora2-watermark-remover
Sora 2 AI generated videos gentle watermark remover - dachensky/sora2-watermark-remover
😢1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
В Школе анализа данных, где готовят специалистов по ИИ, началось обучение по применению ИИ в естественно-научных исследованиях. На программу подали заявки ученые из 37 регионов - больше всего запросов получили от экспертов в областях физики, медицины и химии. В итоге зачислили 50 молодых исследователей: от магистрантов до кандидатов наук из Москвы, Петербурга, Уфы, Иркутска, Владивостока и Екатеринбурга.
Участники изучают основы ИИ и сразу применяют инструменты в своих задачах. С каждой командой работает эксперт ШАДа: помогает выбрать методы и спланировать эксперимент. Если проекту нужны тяжелые вычисления, подключаются мощности Yandex Cloud.
Команда из Institute of Science Tokyo анонсировала фреймворк PianoKPM Net, способный с высокой точностью определять активность мышц рук без использования нательных датчиков. Обычно для этого требуется инвазивная и дорогая электромиография, но новая архитектура реконструирует паттерны мышечных сокращений, анализируя только видеозапись.
В основе системы - уникальный датасет, собранный на базе 12 часов игры профессиональных пианистов, где визуальные данные синхронизированы с реальными сигналами мышц. Технология превращает обычную камеру в диагностический инструмент, что важно для реабилитационной медицины, спортивной аналитики и создания продвинутых интерфейсов «человек-компьютер». Авторы планируют выложить датасет и модель в открытый доступ.
techxplore.com
Project Prometheus поглотил разработчика агентного ИИ General Agents. Сделка прошла в закрытом режиме еще летом и сопровождалась переходом команды инженеров из DeepMind и Tesla в структуру Prometheus. Цель Prometheus: создание ИИ-систем для поддержки сложных производств автомобилестроения и космической отрасли.
Главный актив General Agents - технология Ace для автономного управления интерфейсами и приложениями. Хотя изначально Ace создавался для автоматизации рутинны на ПК, в рамках Prometheus эти наработки, судя по всему, будут масштабированы для индустриальных сценариев.
wired.com
Глава направления Sora в OpenAI Билл Пиблз сообщил, что бесплатные аккаунты теперь ограничены всего 6 видеогенерациями в сутки, так как текущие графические процессоры буквально плавятся от запросов. Это ограничение не выглядит временным: компания прямо предлагает докупать генерации по мере необходимости, хотя условия для подписчиков ChatGPT Plus и Pro пока остались прежними.
Google приняла аналогичные меры, урезав бесплатный доступ к инструменту Nano Banana Pro до 2 изображений в день. Техгигант предупредил, что лимиты могут меняться динамически и без уведомлений. Кроме того, под ограничения попал и доступ бесплатных пользователей к модели Gemini 3 Pro.
theverge.com
ИИ-поисковик получил функцию "persistent memory", которая позволяет запоминать предпочтения, интересы и детали предыдущих диалогов. Теперь система автоматически создает "постоянный контекст" пользователя, а ответы становятся персонализированными и требуют меньше уточняющих запросов.
Perplexity извлекает факты из хранилища памяти и напрямую использует их при формировании ответа. Этот контекстный слой работает поверх любой выбранной модели без потери накопленных знаний о пользователе. Функция полностью управляема: сбор данных можно отключить в настройках, а в режиме инкогнито история не сохраняется.
perplexity.ai
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍1🔥1
🇨🇳 Китай представил концепт AI-ускорителя на базе 14 нм логики + 18 нм DRAM, который обещает 120 TFLOPS при 2 TFLOPS на ватт.
По заявлениям, это уровень производительности Nvidia A100, но с упором не на техпроцесс, а на упаковку и работу с памятью.
Идея такая:
- вычислительные кристаллы 14 нм размещаются прямо поверх 18 нм DRAM
- используется гибридное 3D-бондинг-соединение
- тысячи коротких медных линий дают почти «как на кристалле» пропускную способность
- память ближе к вычислениям → меньше простаивания → выше реальная производительность на ватт
Заявленные характеристики — 120 TFLOPS при ~60 Вт, что лучше старых A100 по эффективности, но значительно слабее линейки Blackwell.
Но важно понимать:
- это пока архитектурный концепт, без массового кремния
- нет открытых бенчмарков
- нет подтверждённого серийного производства
- до уровня Nvidia Blackwell и по мощности, и по эффективности ещё далеко
Тем не менее сам подход показатель: акцент переносится с гонки за «нанометрами» к близости памяти, 3D-упаковке и near-memory computing. Это то направление, куда движется весь рынок высокопроизводительного AI-железа.
На данный момент концепт скорее сигнал о намерениях, чем реальный конкурент Nvidia.
tweaktown.com/news/109123/china-says-its-homegrown-14nm-chips-rival-nvidias-4nm-chips/index.html
По заявлениям, это уровень производительности Nvidia A100, но с упором не на техпроцесс, а на упаковку и работу с памятью.
Идея такая:
- вычислительные кристаллы 14 нм размещаются прямо поверх 18 нм DRAM
- используется гибридное 3D-бондинг-соединение
- тысячи коротких медных линий дают почти «как на кристалле» пропускную способность
- память ближе к вычислениям → меньше простаивания → выше реальная производительность на ватт
Заявленные характеристики — 120 TFLOPS при ~60 Вт, что лучше старых A100 по эффективности, но значительно слабее линейки Blackwell.
Но важно понимать:
- это пока архитектурный концепт, без массового кремния
- нет открытых бенчмарков
- нет подтверждённого серийного производства
- до уровня Nvidia Blackwell и по мощности, и по эффективности ещё далеко
Тем не менее сам подход показатель: акцент переносится с гонки за «нанометрами» к близости памяти, 3D-упаковке и near-memory computing. Это то направление, куда движется весь рынок высокопроизводительного AI-железа.
На данный момент концепт скорее сигнал о намерениях, чем реальный конкурент Nvidia.
tweaktown.com/news/109123/china-says-its-homegrown-14nm-chips-rival-nvidias-4nm-chips/index.html
❤6👍3🔥1
Ovis-Image - новая text-to-image модель от команды Alibaba AIDC 🔥
Что известно:
- 7B параметров, лицензия Apache 2.0
- Высокое качество генерации
- Работает на одном мощном GPU с низкой задержкой
- Отлично справляется с задачами, где важны текст, композиция и структура: постеры, UI-макеты, инфографика, лого
Модель: https://huggingface.co/AIDC-AI/Ovis-Image-7B
Демо: https://huggingface.co/spaces/AIDC-AI/Ovis-Image-7B
Что известно:
- 7B параметров, лицензия Apache 2.0
- Высокое качество генерации
- Работает на одном мощном GPU с низкой задержкой
- Отлично справляется с задачами, где важны текст, композиция и структура: постеры, UI-макеты, инфографика, лого
Модель: https://huggingface.co/AIDC-AI/Ovis-Image-7B
Демо: https://huggingface.co/spaces/AIDC-AI/Ovis-Image-7B
❤4👍1
🚀 AWS представила новое поколение AI-инструментов: Amazon Nova 2 и Agentic-AI
✔️ Nova 2 - семейство мощных моделей для текста, изображений, видео и мультимодальных задач
✔️ Nova Act - AI-агенты, которые могут работать в браузере: кликать, заполнять формы, навигироваться по UI
✔️ Nova Forge — сервис для создания собственных моделей на базе Nova: пред-тренировка, дообучение, кастомизация
Почему это важно
- Универсальность: от чат-ботов до анализа видео и документов
- Автоматизация: агенты заменяют рутинные действия и ручные процессы
- Кастомизация: компании могут строить модели под свои данные
- Оптимальная цена-производительность: конкурент на рынке крупных моделей
#AI #AWS #AmazonNova #GenerativeAI #AgenticAI #Automation
https://www.aboutamazon.com/news/aws/aws-agentic-ai-amazon-bedrock-nova-models
✔️ Nova 2 - семейство мощных моделей для текста, изображений, видео и мультимодальных задач
✔️ Nova Act - AI-агенты, которые могут работать в браузере: кликать, заполнять формы, навигироваться по UI
✔️ Nova Forge — сервис для создания собственных моделей на базе Nova: пред-тренировка, дообучение, кастомизация
Почему это важно
- Универсальность: от чат-ботов до анализа видео и документов
- Автоматизация: агенты заменяют рутинные действия и ручные процессы
- Кастомизация: компании могут строить модели под свои данные
- Оптимальная цена-производительность: конкурент на рынке крупных моделей
#AI #AWS #AmazonNova #GenerativeAI #AgenticAI #Automation
https://www.aboutamazon.com/news/aws/aws-agentic-ai-amazon-bedrock-nova-models
🧠 AgentEvolver: Эффективная система саморазвивающихся агентов
AgentEvolver — это комплексная платформа для самообучения агентов, объединяющая механизмы самовопроса, самонавигации и самоатрибуции. Она позволяет агентам автономно улучшать свои способности, обеспечивая эффективное и непрерывное развитие.
🚀Основные моменты:
- Автоматическая генерация задач для уменьшения затрат на создание данных.
- Оптимизация исследований через опыт, полученный от предыдущих задач.
- Тонкая настройка политики на основе атрибуции промежуточных шагов.
- Модульная архитектура для легкой настройки и расширения.
- Высокая производительность с меньшим количеством параметров по сравнению с аналогами.
📌 GitHub: https://github.com/modelscope/AgentEvolver
#python
AgentEvolver — это комплексная платформа для самообучения агентов, объединяющая механизмы самовопроса, самонавигации и самоатрибуции. Она позволяет агентам автономно улучшать свои способности, обеспечивая эффективное и непрерывное развитие.
🚀Основные моменты:
- Автоматическая генерация задач для уменьшения затрат на создание данных.
- Оптимизация исследований через опыт, полученный от предыдущих задач.
- Тонкая настройка политики на основе атрибуции промежуточных шагов.
- Модульная архитектура для легкой настройки и расширения.
- Высокая производительность с меньшим количеством параметров по сравнению с аналогами.
📌 GitHub: https://github.com/modelscope/AgentEvolver
#python
❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Представьте, что вы проснулись в недалёком будущем. Как бигтех работает с контентом?
Мультимодальные и рекомендательные системы нового поколения — это то, что уже сейчас определяет мир, в котором мы скоро будем жить.
Сотрудники VK рассказали, над чем работает их группа R&D и другие команды. Заходите по ссылке — смотрите ролики и знакомьтесь с нашей внутренней кухней.
Мультимодальные и рекомендательные системы нового поколения — это то, что уже сейчас определяет мир, в котором мы скоро будем жить.
Сотрудники VK рассказали, над чем работает их группа R&D и другие команды. Заходите по ссылке — смотрите ролики и знакомьтесь с нашей внутренней кухней.
👍2
Forwarded from Machinelearning
Лонгрид материала от Main Street Autonomy, о том, как лидары видят мир, почему они прожигают камеры смартфонов и где маркетологи нас обманывают.
В отличие от обычной камеры, которая фиксирует интенсивность света, лидар - это активный сенсор. Он отправляет свет и ловит его отражение. Его цель - измерить расстояние и направление.
В результате получается облако точек, где каждая точка - это точное положение объекта в пространстве. Камеры дают разрешение и цвет, а лидары - точную геометрию.
Самый популярный - Direct time of flight. Лидар посылает лазерный импульс и засекает время, за которое он вернется. Зная скорость света, можно посчитать расстояние. Но чтобы это работало, нужны невероятно быстрые детекторы.
APD - это лавинные фотодиоды. Они надежны, работают в линейном режиме, но требуют сложной аналоговой электроники.
А вот SPAD - однофотонные лавинные диоды, это настоящий бриллиант. Они настолько чувствительны, что реагируют на единственный фотон, работая в режиме счетчика Гейгера.
Главный плюс SPAD в том, что они совместимы с CMOS-процессом. Это значит, что их можно делать на тех же кремниевых пластинах, что и процессоры, создавая огромные массивы - их называют SPAD macropixels. Это путь компаний Ouster и Sony.
Но есть и другой путь - FMCW, или частотно-модулированный лидар. Здесь лазер светит постоянно, меняя частоту, а расстояние вычисляется по сдвигу фазы вернувшегося сигнала.
С FMCW можно измерять не только дальность, но и мгновенную скорость объекта через эффект Доплера. Звучит круто, но требует дорогих лазеров.
Исторически, первым решением было просто вращать весь лидар. Старые модели на крышах машин - те самые «ведра», которые крутятся на 360 градусов. Это надежно, дает полный обзор, но механически сложно и дорого.
Современный тренд - уход от вращения всей «головы» к более хитрым методам.
MEMS mirror. Это крошечные зеркала на чипе, которые вибрируют и отклоняют луч.
Risley prisms. Две вращающиеся призмы, преломляющие луч так, что он рисует сложный узор, похожий на цветок.
Есть совсем футуристичный Baraja SpectrumScan. Они вообще отказались от движущихся зеркал в одной из плоскостей. Они меняют длину волны лазера, пропуская свет через призму. Разные цвета преломляются под разным углом и луч сканирует пространство просто за счет изменения цвета. Гениально, но требует очень качественного источника света.
Большинство лидаров работают на длине волны 905 nm. Но есть проблема: человеческий глаз фокусирует этот свет на сетчатке. Если поднять мощность, можно буквально выжечь человеку глаз. Поэтому мощность таких лидаров жестко ограничена.
1550 nm. Этот свет поглощается жидкостью в глазу и не доходит до сетчатки. И мощность можно поднимать в тысячи раз, что дает огромную дальность обнаружения.
Но для детекторов на этой частоте нужен дорогой сплав InGaAs, а в качестве источника часто используют волоконные лазеры.
И тут есть нюанс: мощный лазер 1550 nm безопасен для сетчатки, но может повредить роговицу нагревом. Более того, такие мощные лидары сжигают матрицы обычных камер и смартфонов, если те окажутся на "линии огня".
Многие лидары врут. Одна из частых проблем - рассинхрон углов лучей. Даже в знаменитом датасете KITTI находили ошибки калибровки, из-за чего плоские стены становились кривыми.
Еще одна беда - «блюминг». Если лазер попадает в дорожный знак или катафот, отраженный сигнал настолько силен, что засвечивает соседние пиксели. Лидар видит призрачные объекты там, где их нет.
Есть такой термин - "Solid State LiDAR". Производители любят называть так свои устройства, чтобы подчеркнуть надежность.
Но часто это не так. Они выглядят как цельные коробки, но внутри у них есть движущиеся части: зеркала или призмы.
Настоящий Solid State - это когда вообще ничего не движется, даже внутри. Это то, к чему стремится индустрия. Но пока механика все еще с нами.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍4
🎬 HunyuanVideo-1.5: Легкая модель генерации видео
HunyuanVideo-1.5 — это мощная модель для создания видео с высоким качеством и всего 8.3 миллиарда параметров. Она оптимизирована для работы на потребительских GPU, что делает её доступной для разработчиков и креаторов. Репозиторий включает инструменты для генерации креативных видео.
🚀Основные моменты:
- Высокое качество видео с минимальными ресурсами
- Поддержка текстового и изображенческого ввода
- Оптимизирована для быстрого вывода на обычных GPU
- Открытый исходный код и доступные веса модели
📌 GitHub: https://github.com/Tencent-Hunyuan/HunyuanVideo-1.5
#python
HunyuanVideo-1.5 — это мощная модель для создания видео с высоким качеством и всего 8.3 миллиарда параметров. Она оптимизирована для работы на потребительских GPU, что делает её доступной для разработчиков и креаторов. Репозиторий включает инструменты для генерации креативных видео.
🚀Основные моменты:
- Высокое качество видео с минимальными ресурсами
- Поддержка текстового и изображенческого ввода
- Оптимизирована для быстрого вывода на обычных GPU
- Открытый исходный код и доступные веса модели
📌 GitHub: https://github.com/Tencent-Hunyuan/HunyuanVideo-1.5
#python
GitHub
GitHub - Tencent-Hunyuan/HunyuanVideo-1.5: HunyuanVideo-1.5: A leading lightweight video generation model
HunyuanVideo-1.5: A leading lightweight video generation model - Tencent-Hunyuan/HunyuanVideo-1.5