This media is not supported in your browser
VIEW IN TELEGRAM
InstantDrag: Improving Interactivity in Drag-based Image Editing
Еще одна попытка сделать редактирование картинок путем указания что куда передвинуть. Может в этот раз взлетит
Код ждем
#imageediting #drag
Еще одна попытка сделать редактирование картинок путем указания что куда передвинуть. Может в этот раз взлетит
Код ждем
#imageediting #drag
👍4
Media is too big
VIEW IN TELEGRAM
A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis
Реконструкция сцен с релайтингом на гауссианах. Среди разработчиков Adobe Research
Код ждем
#relighting #gaussian #novelview
Реконструкция сцен с релайтингом на гауссианах. Среди разработчиков Adobe Research
Код ждем
#relighting #gaussian #novelview
❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Dream Machine API
Lumalabs выкатили API для видеогенератора Dream Machine
Расценки: $0,0032 за 1 млн сгенерированных пикселей
Это составляет $0,0032 за кадр или около $0,35 за 5-секундное видео 24fps при разрешении 1280×720p
На HuggingFace уже есть демо, там вам понадобится API токен от Lumalabs
Демо
#text2video #image2video #api
Lumalabs выкатили API для видеогенератора Dream Machine
Расценки: $0,0032 за 1 млн сгенерированных пикселей
Это составляет $0,0032 за кадр или около $0,35 за 5-секундное видео 24fps при разрешении 1280×720p
На HuggingFace уже есть демо, там вам понадобится API токен от Lumalabs
Демо
#text2video #image2video #api
👍3
Media is too big
VIEW IN TELEGRAM
Seed-Music
Генератор-редактор музыки. В деле замешан ByteDance.
Генерит хоть песни хоть инструментал, хоть вокал.
Споет что угодно заданным голосом по 10-секундному образцу.
Умеет редактировать слова оставляя мелодию, мелодию оставляя слова. Подозреваю, умеет редактировать что угодно
Есть препринт, нет ни кода, ни демки, ни сервиса.
Только надежда
#text2music #musicediting #music2music
Генератор-редактор музыки. В деле замешан ByteDance.
Генерит хоть песни хоть инструментал, хоть вокал.
Споет что угодно заданным голосом по 10-секундному образцу.
Умеет редактировать слова оставляя мелодию, мелодию оставляя слова. Подозреваю, умеет редактировать что угодно
Есть препринт, нет ни кода, ни демки, ни сервиса.
Только надежда
#text2music #musicediting #music2music
❤11🔥10👍1
diffusion-e2e-ft: Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think
Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.
Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня
Код
Демо глубина
Демо нормали
#image2normal #image2depth
Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.
Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня
Код
Демо глубина
Демо нормали
#image2normal #image2depth
🔥7❤4
EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer|
Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм
Код ждем
Демо
#text2audio
Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм
Код ждем
Демо
#text2audio
🔥5❤1👍1
Forwarded from CG дневничок (Sergey Frolov)
Runway и Lionsgate заключили партнерское соглашение, чтобы изучить возможности использования искусственного интеллекта в кинопроизводстве.
Первое в своем роде партнерство, направленное на создание и обучение новой модели искусственного интеллекта, разработанной на основе фирменного каталога Lionsgate. Эта модель, разработанная специально для того, чтобы помочь создателям фильмов, режиссерам-постановщикам и другим творческим талантам улучшить свою работу.
Новая нейросеть будет создавать кинематографическое видео, которое в дальнейшем можно редактировать с помощью набора управляемых инструментов Runway.
Что это означает для индустрии? Да в целом никакого шока от этой новости нет. AI отличный инструмент для ускорения работы, а т.к. с юридической точки зрения сгенерированный контент сложно считать "очищенным" по правам, то подобное соглашение как раз позволит студии использовать свои же проекты и наработки для внутренних разработок.
Ждем нейросетевого Джона Уика?🔫
Первое в своем роде партнерство, направленное на создание и обучение новой модели искусственного интеллекта, разработанной на основе фирменного каталога Lionsgate. Эта модель, разработанная специально для того, чтобы помочь создателям фильмов, режиссерам-постановщикам и другим творческим талантам улучшить свою работу.
Новая нейросеть будет создавать кинематографическое видео, которое в дальнейшем можно редактировать с помощью набора управляемых инструментов Runway.
Что это означает для индустрии? Да в целом никакого шока от этой новости нет. AI отличный инструмент для ускорения работы, а т.к. с юридической точки зрения сгенерированный контент сложно считать "очищенным" по правам, то подобное соглашение как раз позволит студии использовать свои же проекты и наработки для внутренних разработок.
Ждем нейросетевого Джона Уика?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Tripo 2.0
Новый генератор 3D моделей с PBR текстурами по тексту и по изображению.
Генерация занимает несколько минут, и вы получаете 4 варианта модели.
На старте дают 600 кредитов, это на 10 генераций по 60 кредитов.
После генерации вам предлагают сделать риг за 20 кредитов и можно назначить на модель анимацию.
Конвертирование и сохранение модели, кстати, тоже стоит - 10 кредитов.
Можно сделать ретопологию.
Короче, инструмент серьезный+-
Тест Бендера - хорошо.
Го тестить!
#textto3d #imageto3d
Новый генератор 3D моделей с PBR текстурами по тексту и по изображению.
Генерация занимает несколько минут, и вы получаете 4 варианта модели.
На старте дают 600 кредитов, это на 10 генераций по 60 кредитов.
После генерации вам предлагают сделать риг за 20 кредитов и можно назначить на модель анимацию.
Конвертирование и сохранение модели, кстати, тоже стоит - 10 кредитов.
Можно сделать ретопологию.
Короче, инструмент серьезный+-
Тест Бендера - хорошо.
Го тестить!
#textto3d #imageto3d
❤10
Forwarded from Psy Eyes
Media is too big
VIEW IN TELEGRAM
Kling: обновили генератор видео до версии V 1.5.
Что нового:
* Видео в 1080p, которые оптимизированы генериться под широкоформат
* Улучшилось следование промту
* Повысились качество, динамичность, и эстетичность картинки
* High-Quality (Professional) режим по той же цене
Также появился инструмент Motion Brush для выделения до 6 объектов на видео и их анимации по указанной траектории. Или можно задать, что должно остаться статичным. Такая же фича есть у Runway (не Gen-3) и Kaiber. Максимальная длительность видео из Motion Brush — 5 сек.
Пока контроль камеры и Motion Brush есть только в V 1. В версию V 1.5 они подъедут позже.
В обычном image-2-video режиме выдаётся видео длиной до 10 сек. Одновременно в Kling может генериться до 4 видео.
Анонс
Что нового:
* Видео в 1080p, которые оптимизированы генериться под широкоформат
* Улучшилось следование промту
* Повысились качество, динамичность, и эстетичность картинки
* High-Quality (Professional) режим по той же цене
Также появился инструмент Motion Brush для выделения до 6 объектов на видео и их анимации по указанной траектории. Или можно задать, что должно остаться статичным. Такая же фича есть у Runway (не Gen-3) и Kaiber. Максимальная длительность видео из Motion Brush — 5 сек.
Пока контроль камеры и Motion Brush есть только в V 1. В версию V 1.5 они подъедут позже.
В обычном image-2-video режиме выдаётся видео длиной до 10 сек. Одновременно в Kling может генериться до 4 видео.
Анонс
❤1🔥1
Опубликован код и демоспейс генератора картинок ультравысокого разрешения UltraPixel
Генерация 2560×5120 на RTX 4090 занимает 60 секунд
Код
Демо
#image2image #text2image #personalization
Генерация 2560×5120 на RTX 4090 занимает 60 секунд
Код
Демо
#image2image #text2image #personalization
👍8❤3👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Phidias: A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion
Генератор 3D моделей по изображению, тексту и по 3D, с референсом
Код ждем
#imageto3d #textto3D #3Dto3D
Генератор 3D моделей по изображению, тексту и по 3D, с референсом
Код ждем
#imageto3d #textto3D #3Dto3D
🔥6
#оффтоп #кино Сохранить/репостить
Ох будет вам чем вечера занять на ближайшие недели.
Приличных фильмов про музыку не так много, десятка три, наверно. А таких чтобы хотелось пересматривать - и вовсе мало. Представляю вам мой личный топ фильмов про музыку и музыкантов.
Что не вошло в топ:
- Короткометражки
- Документалки.
- Фильмы которые мне не захотелось посмотреть второй раз.
- Фильмы, в которых есть музыканты, но они не про музыку.
Уверен, мне удастся вас удивить. Итак, от лучшего к менее лучшему
1️⃣ . Легенда о пианисте/1900 (1988)
Грустная немного фантастическая история о пианисте-самоучке. Фильм с лучшей музыкальной сценой всех веков (по мнению эксперта Нейронавта)
2️⃣ . Одержимость (2013)
От начала и до конца напряжённая драма о барабанщике, упарывающемся ради места в оркестре
3️⃣ . Ла-Ла Ленд (2016)
Грустный слезовыжимательный мюзикл про музыканта и актрису, пытающихся пробиться в Лос-Анжелесе
4️⃣ . Струны (сериал 2021)
Российский сериал, драма о четырех виолончелистах, пытающихся попасть на конкурс Чайковского. Долго откладывал, посмотрел и не пожалел. Я не то чтобы знаток консерваторской жизни, но очень убедительно. Второй сезон хуже
5️⃣ . Чико и Рита (2009)
Трогательная анимационная драма, лав стори кубинских пианиста и певицы
6️⃣ . Yesterday (2019)
Гитарист-неудачник попадает в параллельную реальность, где никто кроме него не знает песен Битлз. Грех не воспользоваться таким шансом?
7️⃣ . Пустоголовые (1994)
Начинающая рок-группа захватывает радиостанцию чтобы привлечь внимание к своей музыке. Трио Сэндлер+Фрэйзер+Бушеми должно убедить вас посмотреть этот хит.
8️⃣ . Аполлон: Дети на холме (сериал 2012)
Трогательное аниме, сериал о первой любви, дружбе и музыке. Персонажи не без типичного анимешного юношеского долбо*бизма, но смотрел не отрываясь. Анимация частично выполнена ротоскопом по живому видео, но это сделано аккуратно, смотрится хорошо. Ну а попробуйте анимировать джазовых музыкантов. Пиксар, вон, на Душе упоролся по пальцам клавишника.
9️⃣ . Странный Эл (2022)
Эксцентричный стебный (как и сам Эл Янковик) псевдобайопик. Чем ближе к финалу, тем выше градус странности.
1️⃣ 0️⃣ . Рок-волна (2009)
Драмеди о том как в 1960-х рок-радиостанция противостояла попыткам британских властей запретить вещать рок
———————
Достойны упоминания:
Студия 666 (2022) - хоррор-комедия про Foo Fighters в L-миноре
Голый барабанщик (2008) - Дуайт Шрут тащит!
Бек/Beck: Mongolian Chop Squad (2004 – 2005) - аниме, но в отличие от Детей на холме, тут история успеха. Пацан за год научился лабать на гитаре как Хендрикс и группа порвала рок-фестиваль когда не было шансов - не верю! Сочинил свою первую песню - и сразу хит. Ага, конечно
Сестричка, действуй (1992) - музыки не так много, но там офигительный госпел. Есть сиквел, там больше госпела и меньше интересного сюжета.
Душа (2020) - все же, не совсем про музыку
Братья блюз (1980) - клевый, не без сюрпризов. Был снят до Перекрестка. Тут засветились настоящие Джеймс Браун, Рэй Чарльз, Арета Франклин
Перекрёсток (1986) - культовый
Волшебник (2019) - российская драма, хорошее кино
Звезда родилась (2018)
Джеймс Браун: Путь наверх (2014)
Звуки шума (2010) - весьма своеобразный
Зверопой (2016) - на разок. Все поют идеально, но до сих пор оставались незамеченными - не верю.
Богемская рапсодия (2018)
Амадей (1984)
Мы из джаза (1983)
Август Раш (2007) - красиво, но все персонажи картонные. Не докрутили
Что забыл? Какие шедевры прошли мимо меня?
В коменты кину список просмотренного чтобы вы не повторялись.
Ох будет вам чем вечера занять на ближайшие недели.
Приличных фильмов про музыку не так много, десятка три, наверно. А таких чтобы хотелось пересматривать - и вовсе мало. Представляю вам мой личный топ фильмов про музыку и музыкантов.
Что не вошло в топ:
- Короткометражки
- Документалки.
- Фильмы которые мне не захотелось посмотреть второй раз.
- Фильмы, в которых есть музыканты, но они не про музыку.
Уверен, мне удастся вас удивить. Итак, от лучшего к менее лучшему
Грустная немного фантастическая история о пианисте-самоучке. Фильм с лучшей музыкальной сценой всех веков (по мнению эксперта Нейронавта)
От начала и до конца напряжённая драма о барабанщике, упарывающемся ради места в оркестре
Грустный слезовыжимательный мюзикл про музыканта и актрису, пытающихся пробиться в Лос-Анжелесе
Российский сериал, драма о четырех виолончелистах, пытающихся попасть на конкурс Чайковского. Долго откладывал, посмотрел и не пожалел. Я не то чтобы знаток консерваторской жизни, но очень убедительно. Второй сезон хуже
Трогательная анимационная драма, лав стори кубинских пианиста и певицы
Гитарист-неудачник попадает в параллельную реальность, где никто кроме него не знает песен Битлз. Грех не воспользоваться таким шансом?
Начинающая рок-группа захватывает радиостанцию чтобы привлечь внимание к своей музыке. Трио Сэндлер+Фрэйзер+Бушеми должно убедить вас посмотреть этот хит.
Трогательное аниме, сериал о первой любви, дружбе и музыке. Персонажи не без типичного анимешного юношеского долбо*бизма, но смотрел не отрываясь. Анимация частично выполнена ротоскопом по живому видео, но это сделано аккуратно, смотрится хорошо. Ну а попробуйте анимировать джазовых музыкантов. Пиксар, вон, на Душе упоролся по пальцам клавишника.
Эксцентричный стебный (как и сам Эл Янковик) псевдобайопик. Чем ближе к финалу, тем выше градус странности.
Драмеди о том как в 1960-х рок-радиостанция противостояла попыткам британских властей запретить вещать рок
———————
Достойны упоминания:
Студия 666 (2022) - хоррор-комедия про Foo Fighters в L-миноре
Голый барабанщик (2008) - Дуайт Шрут тащит!
Бек/Beck: Mongolian Chop Squad (2004 – 2005) - аниме, но в отличие от Детей на холме, тут история успеха. Пацан за год научился лабать на гитаре как Хендрикс и группа порвала рок-фестиваль когда не было шансов - не верю! Сочинил свою первую песню - и сразу хит. Ага, конечно
Сестричка, действуй (1992) - музыки не так много, но там офигительный госпел. Есть сиквел, там больше госпела и меньше интересного сюжета.
Душа (2020) - все же, не совсем про музыку
Братья блюз (1980) - клевый, не без сюрпризов. Был снят до Перекрестка. Тут засветились настоящие Джеймс Браун, Рэй Чарльз, Арета Франклин
Перекрёсток (1986) - культовый
Волшебник (2019) - российская драма, хорошее кино
Звезда родилась (2018)
Джеймс Браун: Путь наверх (2014)
Звуки шума (2010) - весьма своеобразный
Зверопой (2016) - на разок. Все поют идеально, но до сих пор оставались незамеченными - не верю.
Богемская рапсодия (2018)
Амадей (1984)
Мы из джаза (1983)
Август Раш (2007) - красиво, но все персонажи картонные. Не докрутили
Что забыл? Какие шедевры прошли мимо меня?
В коменты кину список просмотренного чтобы вы не повторялись.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤4🔥1
Forwarded from NLP Wanderer
Мы выпускаем в релиз свои лучшие модели и тулкит алайнмента. который использовался для их тренировки.
Итак, наш флагман - Vikhr-Nemo-12B-Instruct-R-21-09-24 (карточка на HF)
12B модель на основе Mistral-Nemo, с качеством на русском языке в некоторых задачах не хуже gpt-4o-mini и имеет 128к токенов контекста, была специально заалайнена под решение широкого спектра задач на реальных и синтетических вопросах пользователей, включая код, математику, суммаризацию, ризонинг, ответы в специальном формате (JSON/HTML и тд) и многие другие.
Модель получила винрейт 79.8 (относительно gpt-3.5-turbo) на оффлайн бенчмарке Ru-General-Arena, что лучше любой текущей опенсорс модели до 30В для русского языка.
Для достижения такого качества мы собрали большой инструктивный датасет со втроенным CoT, что позволило сильно прочкать ризонинг модели, далее обучили Reward модель, сделали Rejection Sampling и применили собственный метод SMPO (вариация DPO) для выполнения преференс-тюнинга.
Вторая модель - Vikhrmodels/Vikhr-Llama3.1-8B-Instruct-R-21-09-24 (карточка на HF)
Так же обучена Llama-3,1-8B и имеет аналогичный размер контекста в 128k токенов. Винрейт на Ru-Arena-General - 63.9, что делает ее одной из лучших 8B моделей дла русского языка.
Модели обучены работать с RAG
Обе модели имеют уникальную особенность - они заалайнены для работы с RAG, т.е. используя системный промпт и спец. роль documents, вы сможете подавать ей документы в стандартизированной форме (JSON). При этом сам текст каждого документа может быть грязным чанком HTML, Markdown или Plain text формата до 4к символов каждый.
Модели умеют выделять информацию из предоставленных документов самостоятельно, реализуя таким образом "реранкер" на уровне LLM. Это сделано за счет двух-этапного ответа. Первый ответ модели представляет из себя JSON со списокм релевантных идентификаторов документов, а второй, если юзер его запросит, будет уже текстовым ответом модели на вопрос пользователя.
Благодаря такому обучению, на нашем бенчмарке для RAG (судья gpt-4o) Vikhr-Nemo показала качество в RAG задачах даже лучше, чем gpt-4o-mini (цифры в карточках моделей)
SMPO - Simple Margin Preference Optimization
Наш собственный метод выравнивания, разработанный для стабилизации прцоесса PO. Этот метод во многом заимствует идеи IPO, SimPO, C-RLFT, а также содержит собственную функцию потерь для разделения выбранных и отклоненных пар, отказываясь от классической сигмойды.
Основная идея метода заключается в стремлении плавно достичь желаемого уровня margin, не заставляя модель переобучаться, в том числе с помощью добавления балансирующего SFT лосса для выбранных и отклоненных вариантов одновременно.
Тулкит на Github - effective_llm_alignment
Репозиторий содержит скрипты и конфиги которые использовались для всех этапов обучения моделей. он позволяет удобно работать с основными методами алайнмента для LLM, включая наш SMPO.
Больше подробностей о моделях, как с ними работать, бенчмарках, процедуре обучения, вы можете найти в их карточках на HF.
Поиграться с Vikhr-Nemo-12B можно в tg bot_e (@vikhrbot), Gradio инференс
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍2
NeuroSandboxWebUI
"Простой и удобный интерфейс для использования различных нейросетевых моделей"
Для работы с текстом, картинками, видео, 3D, звуком.
Легкая установка
#GUI #tool
"Простой и удобный интерфейс для использования различных нейросетевых моделей"
Для работы с текстом, картинками, видео, 3D, звуком.
Легкая установка
#GUI #tool
❤10🔥4🤯2👍1