Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
В установщике нейросетей Pinokio уже доступны:

Кастомизатор картинок UNO
Голосовая модель DIA
Видеогенератор для бедных FramePack

И многие другие инструменты

За напоминание спасибо @Dmitriy_Ru6ts0v

#image2video #tts #personalization #referencing
8👍6
Картинки, видео и языковые модели - большая тройка направлений, которыми интересуюсь я и мои подписчики (иначе зачем бы вы на меня подписывались)

Три научных статьи в этих областях с участием Артема - и все три получили награды, две CVPR25 и одна ICLR25

Вангую, Через пару месяцев, мы будем пробовать новые более быстрые, более умные, более точные нейросетки, основанные на этих статьях. Хотя одна из них с открытым кодом, и можно посмотреть уже сейчас.

1) Дистилляция (ускорение) диффузии (большинство генераторов картинок и все видеогенераторы работаю на диффузии) в 3-4 шага

2) Как запускать генерацию картинок и видео на 80%, 60% или даже 40% компьюта с минимальными потерями в качестве

3) Ускорили Llama-3.1 405B в 9 раз, практически без потерь в качестве

Простым языком из первых рук читайте у Артема. Накидайте там поздравлений или хотя бы огоньков команде, люди делают наше будущее

эйай ньюз - подписывайтесь!
👌63👍3
Немножко #news

Давно заходили на Civitai.com?

Куда-то исчезли все срамные картинки с главной страницы. По поиску срамные модели еще можно найти, но они исчезают одна за другой, фурри-фетишисты обеспокоены. Да и с онлайн тренировкой моделей стало сложнее.

Согласно мнению реддитора, CivitAI не виноват.
Проблема связана с Visa и ограничениями, которые она накладывает на компании, принимающие её карты. Visa требует от компаний, работающих с искусственным интеллектом, применять цензуру, иначе они не смогут обрабатывать платежи.

Есть ряд альтернатив, которые еще не настолько популярны чтобы ощутить давление Visa

Сохраняем, пользуемся:

Tensor.art - прямой конкурент

Huggingface.com - репозиторий ИИ-разработчиков, "магазин ИИ-приложений"

Prompthero.com - этот у меня работает только с вэпээн

Pixai.art - хвалят за скорость и удобство по сравнению с Civitai

Seaart.ai - еще один неплохой конкурент

thinkdiffusion.com - генерация ИИ-арта в браузере с контролнетами


#text2image #gallery #online #tools #nsfw
👍3🔥32😭2
Media is too big
VIEW IN TELEGRAM
Hunyuan3D 2.5

Новая версия 3D-генератора, 10B параметров.
Авториг, многоракурсная генерация 3D, PBR текстуры

Попробовать - можно войти по имейлу

#imageto3d #textto3d
🤯1
CSM Chat to 3D

А помните такой 3D генератор CSM?

Они прикрутили работу с 3D в чате.
Люди уже встраивают в свои пайплайны

#chatto3d #textto3d #imageto3d
3🔥1
Король умер, да здравствует король!

Протестировал новую версию китайского 3D-генератора Hunyuan 2.5.

Итак, лягушка. Первое, на что бросается в глаза — адаптивная детализация, полигонов больше там, где они действительно нужны. Сетка отлично следует за формой — это особенно заметно по сердцу и орнаменту. Впервые на моей памяти нейронка так хорошо построила рельеф. Модель получилась симметричной, без видимых артефактов вроде дыр и пересечений. Только на лапе почему-то появилась неуместная ямка.

Текстура выглядит хуже. Задняя часть представляет собой сплошной визуальный шум, и даже спереди на сердце видны артефакты.

У предыдущих поколений image-to-3D моделей ворон либо получался неровным, либо симметричным, но с раздвоенным клювом. Просто отзеркалить фигурку по вертикальной оси нельзя, однако Hunyuan 2.5 в основном справляется: укладка перьев симметричная, при этом голова выглядит вполне естественно. Впрочем, на затылке рельеф отсутствует, а на правой лапе обнаружился лишний палец. Текстуры тоже далеки от идеала и не передают особенностей оригинальной картинки.

Фигурка Ктулху также приятно удивляет детализацией и симметричностью. Сетка немного хаотичная, но органические формы переданы реалистично. Текстура покрыта шумными деталями, однако судя по бликам, roughness map удался неплохо.

Подведем итоги. Сравнение с предыдущей серией экспериментов (8 моделей, Tripo3d, TRELLIS) говорит само за себя. Прирост в качестве значительный. Лягушку и Ктулху можно спокойно печатать на 3D-принтере без постобработки. Такими темпами вскоре придется обновлять тест, добавляя сложные формы, например, скульптуры людей.

Сейчас этот генератор доступен онлайн по адресу 3d.hunyuan.tencent.com (осторожно, интерфейс на китайском) и позволяет создавать до 20 моделей в день. А еще есть надежда на релиз в open source. По крайней мере, версия 2.0 представлена в pinokio и запускается на достаточно широком наборе конфигураций железа.
#нейронки #imageto3d #DIY
👍63🤯1
Hummingbird-0

Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.

Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется

Говорят, что SOTA (самая лучшая модель)

Попробовать

#lipsync
👍9😐2
Media is too big
VIEW IN TELEGRAM
Lyria 2

Генератор музыки от Deepmind
Все серьезно и очень продуктово.

Детализация жанровых нюансов, генерация инструментальных партий по текстовым описаниям, расширение композиций, редактирование стиля. Можно менять темп, тональность или полностью переосмыслить трек

Записаться в вейтлист
————————

Lyria RealTime

А это тот же генератор в реальном времени, есть кнопка попробовать (не для россиян)

Ну что, суно/удио бояться, батя вышел на поляну.

#music #text2music #music2music
🔥6🤷‍♂1
MusicGPT

Еще один генератор-редактор музыки/песен/звука

Можно делать инструментал, можно с вокалом

Делает ремиксы, умеет преобразовывать звуки, в том числе изменять голос. Ах да, есть TTS, может создать речь из вашего текста

И какой позор что их презентационное видео в твиттере залито БЕЗ ЗВУКА!

Я вам сам потыкал в ТОП 50 с сайта, наслаждайтесь

На старте дают 500 кредитов - это примерно на 10 музыкальных треков. За приглашение друзей докидывают еще по 500 кредитов. Но коммерческое использование музыки все равно только на платном тарифе

#music #text2music #text2sound #music2music #tts #text2speech
🔥10🤮1
Seurat: From Moving Points to Depth

Еще один трекер точек/генератор глубины для видео. Глубину предсказывает по траекториям точек, не по картинке как обычно делают остальные модели

Код ждем
Демо ждем

#trtacking #video2depth
3