Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from Psy Eyes (Andrey Bezryadin)
This media is not supported in your browser
VIEW IN TELEGRAM
Новый игрок на рынке text-2-video — Pika Labs. Становится жарко! Запросить доступ в бету можно написав им в личку или подав заявку на сайте.

Промты:

1. A marathon runner is running in a marathon competition

2. A Wasteland Punk style digital computer game character is fully armed and walking in a ruined city

3. Ice-skating in Bryant Park at 9 pm, warm ambient light in the background, heartwarming city scene, 8K

4. Korean hot tofu soup

5. Korean BBQ

6. A little boy is looking friendly at the camera, front view, outside

7. Beautiful forest in the morning, camera panning

8. Forest, morning, sunlight casting in between the trees, foggy, creepy
7👍1
Emad: А если все — суперы программисты, то никто не программист.

О том что программистов, по его мнению, через 5 лет не будет

твиттер
Нейронавт | Нейросети в творчестве
Emad: А если все — суперы программисты, то никто не программист. О том что программистов, по его мнению, через 5 лет не будет твиттер
https://youtu.be/9i0MVSwIivE

Split Audio Tracks to MusicGen

Смотрите какой демоспейс.
Загружаете в него музыкальный трек, он распиливает его на инструменты как Vocalremover или Fadr.
Сразу выбираете какой трек хотите использовать и жмете Load your chosen track. Теперь можно отдельную вырезанную из песни партию использовать как затравку для MusicGen.

Пишем промт, черрипикаем, черрипикаем, черрипикаем. Понравившееся можно перемиксовать с оригиналом в любимой DAW или видеоредакторе. Вуаля, вы кавермейкер.

Важно: Чтобы получить правильный темп и тональность, надо прописать их в промте. В моем примере было "113 BPM, G#m key" И после этого вероятно, придется темп еще немного скорректировать при сборке.

Чуть не забыл. Это демка, и максимально можно сгенерить 30 секунд за раз.

#aicover #music2music #audio2audio #Nuronaut_art
🔥5👍2
Forwarded from Ai Filmmaker
Media is too big
VIEW IN TELEGRAM
Сейчас техника дорисовки ( matte painting ) или изменения пространства в кино очень обширна. Сложнейшие симуляции, реалистичная графика и отслеживание движения камеры, позволяют на postproduction этапе создавать точнейшую иллюзию, того что мы видим.

Но так было не всегда. Когда не было компьютеров киношники обходились различными трюками. При статичных кадрах буквально перед камерой ставили стекло на котором дорисовывали в реалистичной манере то. чего не было в кадре. Так рождались первые постапокалиптические и фантастические миры.

Когда Youtube выдал мне подборку Matte painting из старых фильмов.
Меня осенило! Генеративная заливка нового фотошопа, идеальный инструмент для того, чтобы создавать целые куски локаций. Итоги эксперимента вы можете увидеть выше!
👍62
#обзор

Инструкция по скачиванию, установке и рисованию на SDXL 0.9 на вашей локальной машине. Заодно познакомимся с ComfyUI.

По просьбе читателей добавил в пост мысли о том, почему у SDXL нет будущего.

Читать на DTF | Пикабу

Скачать файл с пайплайном для ComfyUI для рисования на SDXL.
____
Stable Diffusion: инструменты, расширения, модели, токены
1👎1
Forwarded from Psy Eyes (Andrey Bezryadin)
Media is too big
VIEW IN TELEGRAM
Пика-пика, Котаны!

Получил доступ к Pika Labs. Первый и последний фрагмент мои, остальные с дискорда. Музыка сгенерирована в MusicGen.

Если сравнивать с Runway, то Pika визуально не уступает им ни в чём, при этом зачастую картинка консистентней и художественней. Также есть негативный промт хоть для какого-то контроля, и нет "фризов" динамичных фрагментов. Ещё Можно скрыть промт.

Какие параметры у промтов:
-gs xx (guidance scale, чем выше чифра, тем ближе визуал к промту)
-neg "xxx" (негативный промт, задаём чего не должно быть в кадре)
-hide (скрыть промт)
-ar xx:xx (соотношение сторон, 16:9, 9:16, 1:1, 4:5)

Ну и пока что можно генерить по многу промтов за раз без лимита. 100% это не навсегда, так что дерзайте. Через личку в твиттере Pika Labs получить доступ можно быстрее.

Промты:

1) Сat sitting and watching at the cyberpunk city with flying cars at night from the roof, view from the back, 8k, very high details, -neg "bad paws, bad anatomy"

2) hidden

3) a crab in the sand

4) hidden

5) Ultra cool groovy Dog surfing on a surfboard over blue surf waves, GoPro, cinematic, unreal render, photorealistic, perfect form, high definition, intricate details, 8k

6) hidden

7) Noah Bradley animation of a royal feast

8) demonic entity in their spaceship 4k uhd, rotating gimble shot, hyper detailed -neg low resolution, amateur, glitchy, unstable, fragmented, blurry, pixelated, ridley Scott

9) vintage 8mm footage of of aliens and egyptian pharaohs building the pyramids of giza, ancient egypt

10) Thomas Moran animation of a woman walking in a street

11) Pierre-Auguste Renoir animation of a woman walking through a flower field

12) hidden

13) Сat sitting and watching at the cyberpunk city with flying cars at night from the roof, view from the back, 8k, very high details, -neg "fence, bad paws, bad anatomy"

Ну че, го сами сделаем 4 сезон Love, Death + Robots?
3
В демоспейс ZoeDepth прикрутили генератор 3D-меша по картинке и генератор 3D-меша по 360-градусной панораме. Результат отдает в формате .glb

#imageto3D #depthto3D #image2depth
Очень удобно. Суммаризатор 300 от Яндекса теперь интегрирован в Яндекс браузер. Заходишь на страницу статьи, и сразу тебе предлагают краткий пересказ.

#LLM #chatbot #summary
Forwarded from Заметки
This media is not supported in your browser
VIEW IN TELEGRAM
Обновление DeepFaceLive

Добавлена возможность менять лицо, используя всего лишь одно фото (пример на прикрепленном видео).

Никто обнову уже не ждал (репозиторий улетел в архив и обновлять его не планировалось), но так как на днях энтузиаст поделился своим методом запуска roop в реалтайме, было решено добавить его и в DFLive.

Если меняете лицо на видео, то советую использовать дополнительно эту сборку для улучшения деталей лица https://drive.google.com/file/d/1YJJVnPGq90e_mWZxSGGTptNQilZNfOEO/view?usp=drivesdk

Скачать свежую версию DFLive можно тут https://mega.nz/folder/m10iELBK#Y0H6BflF9C4k_clYofC7yA
🔥41
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за аниматоров. В восьмой раз.
Пока Юнити хайпует на ИИ, Эпик подозрительно отмалчивается.
Измотанные ожиданием пользователи берут код в свои руки и пишут плагины для UE.
Вот тут VFX Kitchen взял бумагу "Generating Diverse and Natural 3D Human Motions from Text" и модель SMPL от института Макса Планка и наваял плагин типа "text-to-animation".
Программеры не очень дружат с UI, поэтому три четверти демо происходит в левому углу видео, а мелкий текст промптов нужно расшифровывать отдельной нейросеткой или большим монитором. Но если вы дождались 1:29, то автор наконец жмет кнопку Сделать Красиво Vizualize Result и аниматоры, рыдая, идут учить промпт инжиниринг.
https://www.youtube.com/watch?v=oz-SgMJvRro
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Тут рассказывают, насколько крут Code Interpreter в ChatGPT. Как теперь выглядит суперказуальный геймдев и как быстро можно собрать демку, буквально на коленке у ИИ в течение 5 минут.

И так:

1. Пишем промпт: "write p5.js code for Asteroids where you control a spaceship with the mouse and shoot asteroids with the left click of the mouse. If your spaceship collides with an asteroid, you lose. If you shoot down all asteroids, you win! I want to use my own textures for the spaceship and for asteroids."

2. Идем на сайт Openprocessing, создаем скетч, сохраняем. Это нужно, чтобы загрузить текстурки. Копируем код из ChatGPT-4.

3. Генерируем текстурки, удаляем фон, например, в Clip Drop.

4. Заменяем имена текстур своими именами.

5. Запускаем.

6. Если что-то не работает, спрашиваем GPT-4, чтобы он исправил. Можно скопировать ошибку и попросить исправить.

7. Чтобы лучше понять, что происходит в коде, можно попросить чат объяснить, что означает конкретная функция, как объяснить 10-летнему ребенку.

И вот что получается в итоге!
Не понятно, чего там 6 лет GTA5 разрабатывали. 🤡
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning

Мне кажется это лучший генератор видео что я видел. Хотя может быть авторы выбрали самые крутые результаты. Или дело в минимуме движения. Но эти примеры выглядят восхитительно. Да это же облет камеры с параллаксом! Дайте две!

Суть в том что модель обученную на видео, встраивают в StableDiffusion. Да, все эти видео не сайте сгенерированы модельками с Civitai!

Код
Колаб

#text2video
5👍2
This media is not supported in your browser
VIEW IN TELEGRAM
VampNet: Music Generation via Masked Acoustic Token Modeling

Качественный генератор музыки с уклоном в экспериментальную, конкурент MusicGen
Только без текстовой подсказки. Может делать вариации и продолжить музыку из затравки.

Код найден благодаря @tech_wizart
Примеры
Примеры с LoRA дообучением
Демо

#music2music #audio2audio
👍5
Бонус
Аудиоредактор Audacity с интергрированным доступом к нейросеткам с HuggingFace от авторов VampNet (предыдущий пост). Это неофициальная пока сборка в статусе Pull request на гитхабе Audacity

#audio2audio #tools
🔥6