⚡️Sakana AI продолжает свой путь в развитии bio inspired архитектур нейронных сетей. Свежий утренний релиз нового типа моделей - Continuous Thought Machine
Ключевой особенностью новой архитектуры - механизм синхронизации нейронов, где каждый нейрон - это набор весов или мини-нейронка со своей памятью состояний. Как результат - говорят о росте способности к рассуждениям или reasoning, что сейчас является очень важным направлением развития фундаментальных моделей.
Детально тут👇
Paper: https://pub.sakana.ai/ctm/
GitHub: https://github.com/SakanaAI/continuous-thought-machines
@complete_ai
Ключевой особенностью новой архитектуры - механизм синхронизации нейронов, где каждый нейрон - это набор весов или мини-нейронка со своей памятью состояний. Как результат - говорят о росте способности к рассуждениям или reasoning, что сейчас является очень важным направлением развития фундаментальных моделей.
Детально тут👇
Paper: https://pub.sakana.ai/ctm/
GitHub: https://github.com/SakanaAI/continuous-thought-machines
@complete_ai
🔥17👍10
Приглашаю вас на мое выступление на Data Fest в Сбере 30 мая ✨
Будем говорить про генеративное проектирование в архитектуре, новые горизонты возможностей для творчества и инженерии🤖
Подключайтесь к онлайн-трансляции в сообществе Сбера в VK или приходите на мероприятие, если вы в Москве!
Чтобы прийти очно, необходимо зарегистрироваться➡️ вот тут
Будем говорить про генеративное проектирование в архитектуре, новые горизонты возможностей для творчества и инженерии
Подключайтесь к онлайн-трансляции в сообществе Сбера в VK или приходите на мероприятие, если вы в Москве!
Чтобы прийти очно, необходимо зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍22🔥14🏆6
Стал доступен первый российский AI-сервис для создания 3D-моделей — Kandinsky 3D 🚀
За считанные минуты сервис генерирует детализированные 3D-объекты по текстовым описаниям или входным изображениям. На выбор несколько поддерживаемых форматов: STL, OBJ, FBX, GLB и USDZ.
Kandinsky 3D также поможет оптимизировать процессы генеративного проектирования и промышленного дизайна. Нейросеть создаёт полигональные модели, совместимые с профессиональными системами автоматизированного проектирования (САПР).
Протестировать модель можно здесь, подключить API здесь.
👉Habr
За считанные минуты сервис генерирует детализированные 3D-объекты по текстовым описаниям или входным изображениям. На выбор несколько поддерживаемых форматов: STL, OBJ, FBX, GLB и USDZ.
Kandinsky 3D также поможет оптимизировать процессы генеративного проектирования и промышленного дизайна. Нейросеть создаёт полигональные модели, совместимые с профессиональными системами автоматизированного проектирования (САПР).
Протестировать модель можно здесь, подключить API здесь.
👉Habr
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23🔥12👍5🆒3🏆2
Эта неделя насыщена деловыми поездками, делюсь с вами.
📌 Первый пункт назначения был вчера — международная конференция IEEE USBEREIT 2025 в Екатеринбурге. Целью конференции являлось объединение исследователей и практиков из различных областей науки, включая радиоэлектронику, информационные технологии, биомедицинскую инженерию и другие.
Я выступал с докладом по генеративному проектированию в области строительства и промышленного производства. Это направление активно развивается в рамках деятельности лаборатории FusionBrain и вызывает интерес как у научного сообщества, так и у представителей бизнеса. После доклада присоединился в качестве эксперта к круглому столу про применение и развитие современных технологий ИИ в образовании.
📌 Следующая остановка — Казань!
Я выступал с докладом по генеративному проектированию в области строительства и промышленного производства. Это направление активно развивается в рамках деятельности лаборатории FusionBrain и вызывает интерес как у научного сообщества, так и у представителей бизнеса. После доклада присоединился в качестве эксперта к круглому столу про применение и развитие современных технологий ИИ в образовании.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥11⚡3👏3🏆1🙊1
This media is not supported in your browser
VIEW IN TELEGRAM
Вместе с Университетом Иннополис мы запустили новую лабораторию мультимодального генеративного ИИ!
Сегодня, на XVI Международном экономическом форуме «Россия — Исламский мир: KazanForum», состоялось подписание соглашения заместителем директора по развитию цифровых проектов российского ИТ-вуза Алексеем Павловым и генеральным директором Института AIRI Иваном Оселедцем.
Мне выпала честь возглавить новую лабораторию. Вместе с Директором Института ИИ Университета Иннополис Рамилем Кулеевым будем заниматься сведением ресерч инициатив лаборатории и продуктовых запросов от бизнеса с прицелом на повышение качества, а также поиском новых решений с помощью мультимодальных моделей. Задачи новой лаборатории связаны с треками лаборатории FusionBrain в AIRI, что усилит научные проекты и повысит эффективность команд.
Начало положено
⚠️Важная информация⚠️
Если вы студент, аспирант, постдок Иннополиса с опытом работы с языковыми, мультимодальными моделями, увлечены темой генеративного ИИ, присылайте мне @kuznetsoff87 своё резюме!
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥32👍13❤8🙊3🎉2🏆1
Вместе с коллегами из TRASSIR успешно завершили первый этап исследования возможностей мультимодальных моделей в задачах видеоаналитики📷
Основная цель проекта — создание системы, способной эффективно выявлять случаи краж товаров в торговых точках с минимизацией ошибок. Мы использовали мультимодальные модели, работающие в zero-shot-режиме, чтобы снизить количество ложных тревог и повысить точность выявления подозрительных ситуаций без специального дообучения модели.
Улучшения:
⚫️ Механизмы рассуждения, позволяющие лучше распознавать сложные действия (например, "взятие+возврат" товара)
⚫️ Детализация эпизодов интереса для более точного анализа коротких событий
⚫️ Поддержка потокового видео с учётом длинного временного контекста
➡️ Будущие проекты предусматривают использование мультимодальных моделей для оценки соблюдения стандартов общепита: анализ аудио на предмет соблюдения речевых скриптов персоналом, контроль за соблюдением санитарных норм, детекцию нарушений, связанных с условиями допродаж и чистотой помещений.
Основная цель проекта — создание системы, способной эффективно выявлять случаи краж товаров в торговых точках с минимизацией ошибок. Мы использовали мультимодальные модели, работающие в zero-shot-режиме, чтобы снизить количество ложных тревог и повысить точность выявления подозрительных ситуаций без специального дообучения модели.
Улучшения:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17🏆7🤝3👍2🙊2🤔1
⚡️Вчера ByteDance выпустил новую супер модель Bagel, которая базируется да трансформере декодере и решает широкий спектр задач понимания и генерации мультимодальных данных (картинки, видео). Модель умеет как понимать разные модальности, так и генерировать их и вносить изменения (например, редактировать картинку по текстовой инструкции)
Архитектурно это MoE архитектура с двумя типами экспертов: Understanding и Generation. В опен сурс выложена 7B модель (7 млрд. активных параметров, всего их — 14 млрд.)
Модель обучена на нескольких триллионах токенов (отдельная часть исследования посвящена росту качества от увеличения числа токенов на обучении для визуальных генеративных задач), которые включают очень разнообразные задачи: от описания изображений до видеороликов, сопровождаемых траекториями движения. Также проработан механизм подробной фильтрации данных (UI removal, контроль разрешения и др.) Обучение проходит в 3 этапа: 2 фазы претрейна и 1 файнтюнинг. Что интересно, у модели прокачаны и способности к рассуждениям (thinking mode inside💪).
📍Интересная фишка — Next Group of Token Prediction подход, при котором модель учат предсказывать группу текстовых или визуальных токенов в целях повышения скорости и компрессии.
👉Статья
👉Hugging Face
P.S. Обязательно изучаем и дружим с Cursor😉
Архитектурно это MoE архитектура с двумя типами экспертов: Understanding и Generation. В опен сурс выложена 7B модель (7 млрд. активных параметров, всего их — 14 млрд.)
Модель обучена на нескольких триллионах токенов (отдельная часть исследования посвящена росту качества от увеличения числа токенов на обучении для визуальных генеративных задач), которые включают очень разнообразные задачи: от описания изображений до видеороликов, сопровождаемых траекториями движения. Также проработан механизм подробной фильтрации данных (UI removal, контроль разрешения и др.) Обучение проходит в 3 этапа: 2 фазы претрейна и 1 файнтюнинг. Что интересно, у модели прокачаны и способности к рассуждениям (thinking mode inside💪).
📍Интересная фишка — Next Group of Token Prediction подход, при котором модель учат предсказывать группу текстовых или визуальных токенов в целях повышения скорости и компрессии.
👉Статья
👉Hugging Face
P.S. Обязательно изучаем и дружим с Cursor😉
👍6🔥5❤1🏆1
Сегодня коллеги из Сбера зарелизили технологию инструктивного редактирования — Malvina⚡️
Наша лаборатория FusionBrain принимала активное участие в проекте. Мы сосредоточились на исследованиях и разработке новых архитектурных решений для базовой модели. Цель — повысить эффективность модели и улучшить качество итогового редактирования🔝
Результаты в комментариях, а подробнее читайте тут
Наша лаборатория FusionBrain принимала активное участие в проекте. Мы сосредоточились на исследованиях и разработке новых архитектурных решений для базовой модели. Цель — повысить эффективность модели и улучшить качество итогового редактирования
Результаты в комментариях, а подробнее читайте тут
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42❤9🏆6🤔2🙊1
Делюсь своей победой 🌟
Я стал лауреатом Премии Посла Китая. Премия учреждена РосСНИО и Посольством Китая по инициативе Чрезвычайного и Полномочного Посла КНР Чжан Ханьхуэя и ежегодно поддерживает выдающихся российских специалистов.
Вместе с остальными лауреатами я поеду в КНР посетить научно-исследовательские учреждения для обмена опытом с китайскими коллегами.
Благодарен за такую возможность, это большая честь для меня!
Я стал лауреатом Премии Посла Китая. Премия учреждена РосСНИО и Посольством Китая по инициативе Чрезвычайного и Полномочного Посла КНР Чжан Ханьхуэя и ежегодно поддерживает выдающихся российских специалистов.
Вместе с остальными лауреатами я поеду в КНР посетить научно-исследовательские учреждения для обмена опытом с китайскими коллегами.
Благодарен за такую возможность, это большая честь для меня!
Please open Telegram to view this post
VIEW IN TELEGRAM
7💯94🏆77🔥58👏21❤🔥12👍11⚡5❤3😁1
Уже привычно: крупная трансляция на @okkosport — сайт лежит намертво, а там уже 1:0. Спасибо🤝
🌚15👍9💯5🙊4
Forwarded from Уставший техдир
Первый выпуск второго сезона подкаста "Фичи Катятся"!
Дима Бугайченко — CDS B2C в Сбере. Мы познакомились в Минске, где выступали на митапе по рекомендательным системам. Мне понравился его доклад, а после, на афтерпати, несколько часов обсуждали машинное обучение и мультиагентные системы. Тогда я подумал: “Блин, я бы с ним поработал”. И вот, спустя почти два года — мы коллеги. Именно видосом с Димой я открываю второй сезон подкаста “Фичи Катятся”.
В этом видео мы обсудим:
- Как понять искусственный интеллект через призму натурального: ключевые принципы и их значение для разработчиков.
- Эволюция ИИ: от древних автоматов до генеративных моделей и трансформеров.
- Мультиагентные системы: как они работают, где применяются (логистика, умные дома, марсианские роверы) и почему 2025 год астрологи объявили годом агентов.
- Рекомендательные системы: их роль в продуктах, вызовы приватности и пузыри мнений.
- Теория игр и эмерджентность: как мультиагентные системы балансируют интересы бизнеса и пользователей.
- Будущее развитие применения ИИ: как технологии изменят бизнес, организации и нашу повседневную жизнь.
- Будущее ИИ и сильный искусственный интеллект (AGI): что ждет IT, продукты и общество, и как разработчикам к этому подготовиться.
Этот выпуск для тех, кто хочет глубже понять, как мы оказались в глобальной AI трансформации, какие изменения нас ждут в айти, бизнесе, продуктах, обществе, и как разработчикам, тимлидам и CTO использовать эти технологии для создания продуктов будущего.
https://youtu.be/QKt2BlKUwpk
ВК, Rutube, Spotify, Apple Podcasts, Яндекс.Музыка
Лайк, шер! Ты знаешь, с кем поделиться этим выпуском!
Дима Бугайченко — CDS B2C в Сбере. Мы познакомились в Минске, где выступали на митапе по рекомендательным системам. Мне понравился его доклад, а после, на афтерпати, несколько часов обсуждали машинное обучение и мультиагентные системы. Тогда я подумал: “Блин, я бы с ним поработал”. И вот, спустя почти два года — мы коллеги. Именно видосом с Димой я открываю второй сезон подкаста “Фичи Катятся”.
В этом видео мы обсудим:
- Как понять искусственный интеллект через призму натурального: ключевые принципы и их значение для разработчиков.
- Эволюция ИИ: от древних автоматов до генеративных моделей и трансформеров.
- Мультиагентные системы: как они работают, где применяются (логистика, умные дома, марсианские роверы) и почему 2025 год астрологи объявили годом агентов.
- Рекомендательные системы: их роль в продуктах, вызовы приватности и пузыри мнений.
- Теория игр и эмерджентность: как мультиагентные системы балансируют интересы бизнеса и пользователей.
- Будущее развитие применения ИИ: как технологии изменят бизнес, организации и нашу повседневную жизнь.
- Будущее ИИ и сильный искусственный интеллект (AGI): что ждет IT, продукты и общество, и как разработчикам к этому подготовиться.
Этот выпуск для тех, кто хочет глубже понять, как мы оказались в глобальной AI трансформации, какие изменения нас ждут в айти, бизнесе, продуктах, обществе, и как разработчикам, тимлидам и CTO использовать эти технологии для создания продуктов будущего.
https://youtu.be/QKt2BlKUwpk
ВК, Rutube, Spotify, Apple Podcasts, Яндекс.Музыка
Лайк, шер! Ты знаешь, с кем поделиться этим выпуском!
🔥10🦄7❤3🙊1
Forwarded from Китай.AI
🔥 Интернет-королева возвращается: 340 страниц об AI, которые взорвали Кремниевую долину
Легендарный аналитик Мэри Микер, автор культовых отчетов о трендах интернета, спустя 6 лет выпустила новый масштабный доклад — на этот раз об искусственном интеллекте. 340 страниц данных, прогнозов и провокационных выводов.
Главный вывод: ИИ-революция уже необратима, и мы находимся в точке "сингулярности".
📌 Основные тезисы:
- AI-революция необратима: В отчете 51 раз встречается слово "беспрецедентный"
- Китайские модели дешевле в 500 раз (ERNIE 4.5 Turbo vs GPT-4.5)
- Индия — неожиданный лидер по числу пользователей ChatGPT (13.5% от мирового трафика)
💸 Пузырь OpenAI?
Микер прямо называет оценку компании ($300B) "сильно завышенной":
→ Выручка OpenAI: $9.2B/год
→ Оценка/Выручка = 33x (у Perplexity — 75x!)
🔧 Технические детали
• Энергопотребление Blackwell GPU в 105 000 раз ниже аналогов 2014 года
• DeepSeek-R1 почти догнал OpenAI (93% vs 95% в MATH Level 5)
🌐 Главный тренд будущего
Следующие 1 миллиард пользователей пропустят этап приложений и сразу перейдут к AI-ассистентам через голосовые интерфейсы — особенно в регионах с низким интернет-покрытием.
🔮Вывод: "Нынешние лидеры ИИ могут повторить судьбу AltaVista. Единственное, что точно известно — мы в начале нового суперцикла технологий."
Полный отчет: BOND Capital AI Report 2025
Краткий обзор в китайской статье
#КитайскийИИ #КитайAI #ИИтренды #OpenAI #TechАналитика
Легендарный аналитик Мэри Микер, автор культовых отчетов о трендах интернета, спустя 6 лет выпустила новый масштабный доклад — на этот раз об искусственном интеллекте. 340 страниц данных, прогнозов и провокационных выводов.
Главный вывод: ИИ-революция уже необратима, и мы находимся в точке "сингулярности".
📌 Основные тезисы:
- AI-революция необратима: В отчете 51 раз встречается слово "беспрецедентный"
- Китайские модели дешевле в 500 раз (ERNIE 4.5 Turbo vs GPT-4.5)
- Индия — неожиданный лидер по числу пользователей ChatGPT (13.5% от мирового трафика)
💸 Пузырь OpenAI?
Микер прямо называет оценку компании ($300B) "сильно завышенной":
→ Выручка OpenAI: $9.2B/год
→ Оценка/Выручка = 33x (у Perplexity — 75x!)
🔧 Технические детали
• Стоимость инференса упала на 99.7% за 2 года • Энергопотребление Blackwell GPU в 105 000 раз ниже аналогов 2014 года
• DeepSeek-R1 почти догнал OpenAI (93% vs 95% в MATH Level 5)
🌐 Главный тренд будущего
Следующие 1 миллиард пользователей пропустят этап приложений и сразу перейдут к AI-ассистентам через голосовые интерфейсы — особенно в регионах с низким интернет-покрытием.
🔮Вывод: "Нынешние лидеры ИИ могут повторить судьбу AltaVista. Единственное, что точно известно — мы в начале нового суперцикла технологий."
Полный отчет: BOND Capital AI Report 2025
Краткий обзор в китайской статье
#КитайскийИИ #КитайAI #ИИтренды #OpenAI #TechАналитика
⚡18🔥14❤🔥7❤4👍4🤓1
Forwarded from Vikhr models
Нашу статью приняли на Slavic Natural Language Processing Workshop на А* конференции ACL!
Скоро выложим на архив.
Скоро выложим на архив.
🔥33🏆10👍4❤2🙏2
Встретился на днях с руководителем направления отдела исследований и разработки в области искусственного интеллекта ПИК, Артуром Ишмаевым.
Мы обсудили возможные форматы сотрудничества и инициативы с использованием технологий генеративного проектирования, обменялись мыслями и практическим опытом!
✔️ Буду рассказывать вам о совместных проектах!
Мы обсудили возможные форматы сотрудничества и инициативы с использованием технологий генеративного проектирования, обменялись мыслями и практическим опытом!
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍31🔥6⚡2❤1