Brain-IT: Image Reconstruction from fMRI via Brain-Interaction Transformer
Давненько у нас не было реконструкции мыслеобразов с томографа, а там такое!
Прям уже очень хорошо научились реконструировать мыслеобразы. Но расшифровка все еще индивидуальна, нужно обучение на каждого определенного человека
Brain-IT работает эффективнее существующих методов: при использовании всего 1 часа данных фМРТ от нового субъекта даёт результаты, сравнимые с результатами других методов, обученных на полных 40-часовых записях
Ну и если вы хотите опробовать это на своем домашнем фМРТ аппарате, код обещают выложить
#science #brain #mindreading #news #fMRI #brain2image
Давненько у нас не было реконструкции мыслеобразов с томографа, а там такое!
Прям уже очень хорошо научились реконструировать мыслеобразы. Но расшифровка все еще индивидуальна, нужно обучение на каждого определенного человека
Brain-IT работает эффективнее существующих методов: при использовании всего 1 часа данных фМРТ от нового субъекта даёт результаты, сравнимые с результатами других методов, обученных на полных 40-часовых записях
Ну и если вы хотите опробовать это на своем домашнем фМРТ аппарате, код обещают выложить
#science #brain #mindreading #news #fMRI #brain2image
🔥7⚡1❤1👍1😁1
Нейронавт | Нейросети в творчестве
Qwen-Edit-2509-Multiple-angles - изменение ракурса
Появился демоспейс лоры QIE для смены ракурса
С ней можно создавать видео по первому и последнему кадру если у вас нет последнего кадра. Например в WAN
Демо
#imageediting #lora #qie #novelview
С ней можно создавать видео по первому и последнему кадру если у вас нет последнего кадра. Например в WAN
Демо
#imageediting #lora #qie #novelview
👍13🔥3
UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions
Система одновременной генерации аудио и видео / оживлятор портретов / липсинк
— генерирует аудио и видео с хорошей синхронизацией
— создаёт контент на основе изображения, описания и речи
— учитывает тембр с помощью референсного аудио
— продолжает и озвучивает видео, синтезирует видео по аудио.
В качестве базовой модели для видеоветви используется Wan 2.2-5B, а для аудиоветви — архитектурный шаблон Wan 2.1-1.3B
На видео с девушкой - это реальное видео и видео с догенеренной концовкой
Кода нет
#chracteranimation #lipsync #portraitanimation #video2video #speech2video #talkinghead
Система одновременной генерации аудио и видео / оживлятор портретов / липсинк
— генерирует аудио и видео с хорошей синхронизацией
— создаёт контент на основе изображения, описания и речи
— учитывает тембр с помощью референсного аудио
— продолжает и озвучивает видео, синтезирует видео по аудио.
В качестве базовой модели для видеоветви используется Wan 2.2-5B, а для аудиоветви — архитектурный шаблон Wan 2.1-1.3B
На видео с девушкой - это реальное видео и видео с догенеренной концовкой
Кода нет
#chracteranimation #lipsync #portraitanimation #video2video #speech2video #talkinghead
👍7🔥6
Kinematify: Open-Vocabulary Synthesis of High-DoF Articulated Objects
Генератор 3d моделей с большим числом степеней свободы (DoF) по изображению или тексту от Deemostech
Отличается от других 3D генераторов тем, что решает две ключевые задачи: определяет кинематическую структуру сложных объектов и вычисляет параметры соединений, используя статическую геометрию.
Кода разумеется нет, но есть демо
Демо
#3d #textto3d #IMAGETO3D
Генератор 3d моделей с большим числом степеней свободы (DoF) по изображению или тексту от Deemostech
Отличается от других 3D генераторов тем, что решает две ключевые задачи: определяет кинематическую структуру сложных объектов и вычисляет параметры соединений, используя статическую геометрию.
Кода разумеется нет, но есть демо
Демо
#3d #textto3d #IMAGETO3D
🔥6👍2
Kimi K2 Thinking
Новый агент от Moonshot использует инструменты для пошагового рассуждения.
Контекст 256к
— решает сложные задачи, выполняя до 200–300 последовательных вызовов инструментов без участия человека
— справляется с задачами, требующими глубокого анализа и структурированного рассуждения, например, решает математические задачи PhD-уровня
— эффективно ищет и анализирует информацию в интернете, превосходя человеческие показатели в BrowseComp
— пишет тексты — академические, исследовательские, художественные, — делая их логичными, содержательными и богатыми по форме
— помогает в кодировании и разработке ПО, выполняя многоэтапные рабочие процессы
— реагирует на личные и эмоциональные вопросы с эмпатией и балансом, предлагая взвешенные советы.
Доступен на kimi.com с ограниченным набором инструментов. Полный набор возможностей обещают скоро.
A также по API
#agent #assistant #reasoning
Новый агент от Moonshot использует инструменты для пошагового рассуждения.
Контекст 256к
— решает сложные задачи, выполняя до 200–300 последовательных вызовов инструментов без участия человека
— справляется с задачами, требующими глубокого анализа и структурированного рассуждения, например, решает математические задачи PhD-уровня
— эффективно ищет и анализирует информацию в интернете, превосходя человеческие показатели в BrowseComp
— пишет тексты — академические, исследовательские, художественные, — делая их логичными, содержательными и богатыми по форме
— помогает в кодировании и разработке ПО, выполняя многоэтапные рабочие процессы
— реагирует на личные и эмоциональные вопросы с эмпатией и балансом, предлагая взвешенные советы.
Доступен на kimi.com с ограниченным набором инструментов. Полный набор возможностей обещают скоро.
A также по API
#agent #assistant #reasoning
🔥4